티스토리 뷰
Bigdata/TroubleShooting
yarn nodemanager Socket Timeout ( hive on tez )
hellotheresy 2017. 3. 3. 13:56환경 : HDP 2.3 ( hive 1.2 , Tez 0.7 )
대용량 hive on tez shuffle join시에 간혹 socket timeout이 발생한다.
이 부분을 피하기 위해 config를 변경하였지만.. 별로 신통치 않다
dfs.socket.timeout
dfs.datanode.socket.write.timeout
대용량 데이터에 대한 shuffle join이라.. explain을 해보니.. 정말 무지막지한 shuffle이 일어난다
( map join이나 다른 join은 데이터 검증에서 실패;; )
찾아보니 socket timeout에 대한 OS 설정이 있어서 해당 내용을 반영해야 할 것 같다.
/proc/sys/net/core/somaxconn : 일반적으로 128 ~ 1024로 설정되어 있으니.. 해당을 2000~4000으로 늘려봐야 겠다.
Reference
: http://hortonworks.com/blog/announcing-apache-hive-2-1-25x-faster-queries-much/
'Bigdata > TroubleShooting' 카테고리의 다른 글
java.lang.NoClassDefFoundError: org/junit/runners/model/MultipleFailureException (0) | 2017.02.15 |
---|
댓글