안드로이드 html 파싱 예제

예를 들어, 메타라는 모든 태그를 얻으려면 항아리 파일을 마우스 오른쪽 버튼으로 클릭하고 Android Studio에 나타난 플라이 아웃 메뉴에서 라이브러리로 추가를 클릭합니다. 당신은 안드로이드 스튜디오에서 항아리를 추가하는 방법에 대한 자세한 내용은 여기에서 읽을 수 있습니다. 첫 번째 예제에서는 HTML 문자열을 구문 분석합니다. 이 자습서에서는 두 가지 예제를 사용할 예정입니다. 첫 번째 예는 프로젝트의 자산 폴더에 저장된 HTML 파일을 구문 분석하는 것입니다. 두 번째 예제에서는 라이브 웹 페이지의 HTML 파일을 구문 분석하는 데 중점을 둡니다. JSoup API에 대한 몇 가지 기본 정보를 알게 되면 Android 앱을 코딩할 수 있습니다. 끝에서 우리는 얻을 것이다 : 이 튜토리얼의 끝에서, 희망, 당신은 HTML 페이지를 구문 분석하기 위해 Jsoup와 통합 안드로이드 응용 프로그램을 개발하는 방법을 알고있다. 때문에 두 번째 예제는 인터넷 전화를 할 것이라는 사실에, 우리는 우리의 프로젝트 Manifest.xml 파일에 인터넷 권한을 추가하려고합니다.

다음 예제는 HTML 페이지에서 링크를 구문 분석합니다. 가져오기 자바.io.IOException; 가져오기 org.jsoup.Jsoup; 가져오기 org.jsoup.nodes.Document; 가져오기 org.jsoup.nodes.Element; 가져오기 org.jsoup.select.Elements; 이제 JSoup API를 사용하고 HTML을 구문 분석할 준비가 되었습니다. 가장 먼저 염두에 두어야 할 것은 원격 웹 사이트를 호출하는 것이므로 메인 스레드에서 JSoup API를 사용할 수 없으므로 ANR 문제가 있을 수 있으므로 이 예제에서는 AsyncTask를 사용합니다. html() 메서드는 요소의 HTML을 반환합니다. 우리의 경우 전체 문서의 HTML 소스입니다. 두 번째 예제에서는 로컬 HTML 파일을 구문 분석합니다. File 개체를 첫 번째 매개 변수로 사용하는 오버로드된 Jsoup.parse() 메서드를 사용합니다. 이 예제에서는 웹 페이지에 연결하고 모든 링크 요소를 구문 분석합니다. 레이아웃은 매우 간단 볼 수 있듯이: 우리는 URL을 삽입 하는 EditText, HTML 구문 분석 및 다른 EditText 결과 표시 하는 점심 버튼.

우리가 가지고있는 주요 활동에서 :이 게시물은 HTML을 구문 분석하기 위해 안드로이드에서 JSoup을 사용하는 방법을 설명합니다. JSoup은 HTML 파일을 추출하고 조작하는 데 도움이되는 Java 라이브러리입니다. 이 라이브러리를 사용하여 Android에서 HTML 페이지를 구문 분석할 수 있습니다. HTML 페이지에서 렌더링하는 대신 정보를 구문 분석하고 추출하려는 경우가 있습니다. 이 경우 사용하기 매우 쉬운 강력한 API 세트를 가지고 있기 때문에 JSoup을 Android와 통합 할 수 있습니다. 이 게시물에서는 JSoup을 사용하는 Android 프로젝트를 설정하는 방법과 Android 앱을 개발하는 HTML 페이지에서 정보를 추출하는 방법에 대해 설명합니다. 이 예제에서는 Jsoup 정규식 선택기를 사용하여 회사 웹 사이트 «x-hub.io»에서 모든 이미지 파일 (png, jpg, GIF)을 가져오는 방법을 보여 줍니다.