//2015年5月1日
一、分治法
map reduce(注意mapreduce要实现全排序的难点)
分治法注意点:你分的是否有规律
1.你用hash分,则不同部分间不可能有相同的数据
二、int型与string型数据
前者 bitmap
后者 trie tree
三、top N
分治法则每个map中取top N,最后在reduce中合并为一个Top N
或者堆排序,K个元素的最大堆
四、近似算法
只会考布隆过滤器,判重,求交集
来源:CSDN
作者:王凯2012
链接:https://blog.csdn.net/u013599826/article/details/45419307