728x90
Partitioner Class
Map 함수의 출력인 (Key, Value) 쌍이 Key에 의해서 어느 Reducer (머신)로 보내질 것인지를 정해지는데
이러한 결정을 정의하는 class
하둡의 기본 타입은 Hash 함수가 Default로 제공되고 있어서 Key에 대한 해시 값에 따라 어느 Reducer(머신)으로 보낼지를 결정한다.
하둡의 기본타입
- Text
- IntWritable
- LongWritable
- FloatWritable
- DoubleWritable
Partitioner Class 예제 코드
소문자로 시작하면 0번 머신으로, 대문자로 시작하면 1번 머신으로 보내는 파티셔너 예제 코드
public static class MyPartitioner extends Partitioner<Text, IntWritable> {
@Override
public int getPartition(Text key, IntWritable value, int numPartitions) {
if(key.toString().charAt(0) < 'a') return 0;
else return 1;
}
}
728x90
'Hadoop > 이론' 카테고리의 다른 글
Matrix Addition (0) | 2021.09.16 |
---|---|
Inverted Index (0) | 2021.09.15 |
맵리듀스 프레임워크 이해하기 (0) | 2021.08.25 |