반응형
단어의 길이가 3글자 이상인 단어만 빈도수를 분석하도록 하는 프로젝트를 시작한다.
단어는 대소문자를 따로 구분하지 않고 분석하지만 일단 소문자로 처리해 본다.
자세한 코드는 아래서 확인이 가능하다.
https://ohju96.notion.site/3-0e58681981d141139f93ccc44de10c03
반응형
'Data Base > Hadoop' 카테고리의 다른 글
[Hadoop] : ToolRunner 사용하기 (0) | 2022.05.03 |
---|---|
[Hadoop] : 하둡, 맵리듀스 프로젝트 IP 별 호출 빈도 수 분석하기 (0) | 2022.04.28 |
[Hadoop] : 맵리듀스 버전 별 차이 (0) | 2022.04.28 |
[Hadoop] : 맵리듀스를 활용해서 단어별 빈도수 분석, 단어 세기 (0) | 2022.04.26 |
[Hadoop] : 맵리듀스 기본 개념, 특징, 주요 처리 과정과 프로젝트 설명 (0) | 2022.04.26 |
댓글