主要用到了标准库中的hash_map,优先级队列priority_queue。
- 从头到尾遍历文件,从文件中读取遍历到的每一个单词。
- 把遍历到的单词放到hash_map中,并统计这个单词出现的次数。
- 遍历hash_map,将遍历到的单词的出现次数放到优先级队列中。
- 当优先级队列的元素个数超过k个时就把元素级别最低的那个元素从队列中取出,这样始终保持队列的元素是k个。
- 遍历完hash_map,则队列中就剩下了出现次数最多的那k个元素。
//出现次数最多的是个单词
- //出现次数最多的是个单词
- void
- if
- int
- whiletrue
- if
- break
- int,string>,vector<pair<int,string>>,greater<pair<int
- for(hash_map<string,int
- if
- while
文章来源: 统计英文文本中出现频率最高的10个单词