map()是将函数用于RDD中的每个元素,将返回值构成新的RDD。
map的作用是对rdd之中的元素进行逐一进行函数操作映射为另外一个rdd。flatMap的操作是将函数应用于rdd之中的每一个元素,将返回的迭代器的所有内容构成新的rdd。通常用来切分单词。
map函数会对每一条输入进行指定的操作,然后为每一条输入返回一个对象;而flatMap函数则是两个操作的集合——正是“先映射后扁平化”
来源:CSDN
作者:Z_Data
链接:https://blog.csdn.net/Z_Date/article/details/87894933