数据清洗——cleancc简介
数据清洗——cleancc cleancc 快速清洗数据内容可以 项目地址 使用方法 pip install cleancc import cleancc 共有五个函数调用: 1.第一个函数为punct: [ 去除标点并让所有字母小写 :param pop_list:所要处理的的列表格式 :param lower:是否转小写,默认是 :return all_comment:处理后的结果-字符串格式 ] 2.第二个函数为statistics: [ 词频统计 :param pop_list:所要处理的的列表格式 :param symbol:是否去除标点,默认是 :param lower:是否转小写,默认是 :return wordCount_dict:统计结果-字典格式 ] 3.第三个函数为stop_words: [ 删除词频统计中的停顿词 :param statis:是否选择词频清理 :param pop_list:所要处理的的列表格式 :param symbol:是否去除标点,默认是 :param lower:是否转小写,默认是 :param wordCount_dict:词频统计结果-字典 :return