Comparison method violates its general contract!

删除回忆录丶 提交于 2020-02-29 09:14:55

在使用spark RDD中,需要进行二次排序,二次排序需要使用到scala List的sortWith(compare),需传递一个比较函数compare给sortWith,这个时候会报如标题所示的错误。

val rdd1 = rdd.groupByKey().sortByKey(true).map(x => (x._1,x._2.toList.sortWith(timeCompare)));

这个错误是jvm1.6和jvm1.7版本不一样带来的bug,来龙去脉参考:Comparison method violates its general contract!

根据参考文档,需要强制jvm使用jdk1.6的数组排序策略,所以需要传递jvm参数,如下:

sparkConf.set("spark.executor.extraJavaOptions", "-Djava.util.Arrays.useLegacyMergeSort=true");

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!