Data Base/Hadoop

[Hadoop] : 시퀀스 파일별로 단어별 빈도수 세기

오주현 2022. 5. 19. 22:09
반응형

시퀀스 파일은 RecordReader 객체가 읽기 쉽게 만든 구조로 기존 맵리듀스 잡을 통해 실행이 가능하다.

 

이전 실습에서 수행한 ‘단어별 빈도수 세기’ 잡을 통해 실행이 가능하다. (아래 링크 참고)

2022.04.26 - [Data Base/Hadoop] - [Hadoop] : 맵리듀스를 활용해서 단어별 빈도수 분석, 단어 세기

hadoop jar mr.jar hadoop.MapReduce.wc.WordCount /result20/part-m-00000 /result21

 

정상적으로 실행된 맵리듀스 잡과 단어 빈도수 결과이다.

반응형