반응형
웹 크롤링을 위해서 먼저 해당 페이지가 웹 크롤링을 해도 되는 페이지인지 확인하기 위해 사이트 주소 뒤에 /robots.txt 붙여 확인한다.
https://www.melon.com/robots.txt
chart 크롤링이 허용되어 있다. Disallow로 명시되어 있으면 크롤링을 할 수 없다.
<http://localhost:8080/melon/collectMelonSong>
멜론 차트 탑 100을 수집하고 저장한다.
<http://localhost:8080/melon/getSongList>
저장한 차트를 조회한다.
<http://localhost:8080/melon/getSingerSongCnt>
가수별 차트에 등록된 노래 수를 카운트한다.
JSON 웹 뷰어에서 조금 더 편하게 볼 수 있다.
코드는 아래 링크에서 확인이 가능하다.
https://ohju96.notion.site/TOP-100-2011fd56ff7547a2b1e15682e5c0326a
반응형
'Data Base > MongoDB' 카테고리의 다른 글
[MongoDB] : 방대한 양의 데이터를 저장하기 위해 insertMany 사용하기 (0) | 2022.04.25 |
---|---|
[MongoDB] : 몽고디비 find 쿼리 사용 (0) | 2022.04.24 |
[MongoDB] : Spring Boot 연동 및 MongoDB Test Code 작성 (0) | 2022.04.22 |
[MongoDB] : Data Grip으로 MongoDB 외부 접속하기 (1) | 2022.04.22 |
[MongoDB] : CentOS에서 MongoDB 설치 및 셋팅하기 (0) | 2022.04.22 |
댓글