Data Base/Hadoop
[Hadoop] : 시퀀스 파일별로 단어별 빈도수 세기
오주현
2022. 5. 19. 22:09
반응형
시퀀스 파일은 RecordReader 객체가 읽기 쉽게 만든 구조로 기존 맵리듀스 잡을 통해 실행이 가능하다.
이전 실습에서 수행한 ‘단어별 빈도수 세기’ 잡을 통해 실행이 가능하다. (아래 링크 참고)
2022.04.26 - [Data Base/Hadoop] - [Hadoop] : 맵리듀스를 활용해서 단어별 빈도수 분석, 단어 세기
hadoop jar mr.jar hadoop.MapReduce.wc.WordCount /result20/part-m-00000 /result21
정상적으로 실행된 맵리듀스 잡과 단어 빈도수 결과이다.
반응형