Chinaunix
标题:
spark executor 上的task 不均衡问题。
[打印本页]
作者:
xiaoqi8866
时间:
2018-03-07 22:58
标题:
spark executor 上的task 不均衡问题。
请问,我目前碰到问题是 spark executor 上的task任务数量不均衡。 导致,分配了很多executor ,实际干活的就那么几个。
劳烦大伙帮忙分析一下这个问题。
如下图,
企业微信截图_20180307224854.png
(127.39 KB, 下载次数: 123)
下载附件
2018-03-07 22:51 上传
分配很了多executor ,但是实际工作的executor主要集中在 p1\p2\p3 这三个机器。 这三个机器恰好是 datanode 节点。
Locality Level 都是 node_local
执行的语句非常简单就是 select count(*) from table .
如果把p1/p2/p3 上的 nodemanger 关掉。task 就分配的均衡了。
Locality Level 都是 Rack_local
我猜测是跟spark 优先读取本地数据有关 。但是,只是猜测,且没有不知道如何调整。
请问各位碰过相似的问题,或是有类似的经验吗?
谢谢。
欢迎光临 Chinaunix (http://bbs.chinaunix.net/)
Powered by Discuz! X3.2