본문 바로가기
발전소/[T.I.L] : Today I Learned

[T.I.L] : 01

by 오주현 2021. 10. 26.
반응형

일일 배움을 위한 Today I Learned !


웹 수집 (크롤링)

크롤링은 HTML에 접근해 텍스트를 읽어 들이는 방법으로 HTML 태그에 대한 이해도가 높아야 합니다.

 

CGV 영화 순위를 크롤링 해오는 실습을 했는데 HTML을 보면서 어느 단에서 끊어서 가져와야 하는지에 대한 고민이 제일 어려웠습니다.

 

예제를 참고하면서 코딩을 해 데이터 끌어오는 것은 성공시켰지만 아직 예제 없이 혼자 코딩을 하기엔 많이 부족하고 코드의 흐름과 각 중요 부분의 역할도 제대로 알지 못 하지만 이것도 반복해서 공부하는 것이 중요합니다.

 

크롤링에 성공한 화면

결과적으론 오늘 예제를 학습하면서 크롤링에 성공을 하긴 했습니다.

아직 부족한 부분은 더 학습해서 올려보도록 하겠습니다.

 

-

 

https://ohju.tistory.com/37

 

[스프링 프레임워크] : 웹 크롤링(수집)하기

www.cgv.co.kr/movies/ 위에 링크에 있는 CGV 영화 정보를 크롤링 하는 것을 목표로 합니다. 인터넷 브라우저에 보여지는 사이트는 모두 HTML을 인터넷 브라우저가 읽어서 보여주는데 이런 특징을 활용

ohju.tistory.com

 

반응형

댓글