와챠의 우당탕탕 코딩 일기장

[안드로이드] 웹 크롤링 본문

코딩 일기장/Android(Kotlin)

[안드로이드] 웹 크롤링

minWachya 2021. 5. 14. 19:34
반응형

Jsoup로 웹 크롤링 및 HTML 문서 파싱하기

Gliide로 URL 주소로 이미지 로딩하기

 

네이버 영화 사이트에서 웹 크롤링하기

 

다크모드에서 실행한 결과

가져올 정보

  • 영화 제목
  • 평점
  • 참여자수
  • 예매율

 

1) 네이버 영화 사이트>개발자 도구

<body> > <div id="wrap" > <div id="container" > <div id="content" > <div class="obj_section" >

<div class="lst_wrap" > <ul class="lst_detail_t1" > <li>...

li가 영화 하나하나의 정보를 의미한다.

 

영화 제목

<dl class="lst_dsc"> > <dt class="tit">를 펼쳐보면 이렇게 영화 제목이 나온다!

 

 

평점, 평점 참여자 수

<dd>  >  <div class="star_t1">  >  <a ~> 에서

<span class="num">은 평점

<span class="num2">는 참여자 수를 나타낸다.

 

예매율

<dl class="info_exp">  >  <dt class="tit_t1">   <dd> <div class="star_t1 b_star">에서

<span class="num">이 예매율이다.

 

 

 

이제 코딩하기!!

전에 설정 먼저 하기

 

gladle(:app) 설정

id 연결 편하게 해주기 위해서

id 'kotlin-android-extensions' 추가

 

HTML 태그 검색 위해

implementation 'io.reactivex.rxjava2:rxandroid:2.1.1'
implementation 'io.reactivex.rxjava2:rxkotlin:2.4.0'

implementation 'org.jsoup:jsoup:1.13.1' 추가

 

AndroidManifest.xml 설정

웹 사이트 데이터 가져오기 위해서

<uses-permission android:name="android.permission.INTERNET" /> 추가

 

application에 android:usesCleartextTraffic="true" 추가

 

 

AndroidManifest.xml

 

activity_main.xml

 

MovieItem.kt

 

MainActivity.kt

반응형
Comments