单词

统计出现频率最高的十个单词的程序性能分析

强颜欢笑 提交于 2020-03-21 16:39:40
3 月,跳不动了?>>> 李竹君 2011211964 0401115班 1.使用C语言。 2.整体思路:首先将一篇文章分词,分词的方法是将逐字符的判断一篇文章,如果该字符的ASCII码在“A~Z”或“a~z”之间(区分大小写),则该字符属于一个单词的一部分,如果该字符不在“A~Z”或者“a~z”,则该字符为两个单词之间的分隔符(多个标点或者空格相连的情况下在3.讲)。将分隔下来的单词和该单词的长度存入结构体,将所有结构体构成链表,将表头的单词与除表头外的所有单词进行比较,如果出现一个单词和原节点单词相等,则将该节点删掉,以此类推,直到最后一个节点,记录相等节点数目,并存入该节点结构体,然后再将表头的下一个节点单词与该节点的后续节点比较,以此类推,直到所有节点都比较完毕。再对所有链表节点内的相等节点数目进行升序排序,取前十位,则得到结果。 3.具体实现细节:1)多个标点或空格:在形成链表的过程中,若出现多个标点或空格,则判断该节点内的单词是否为'\0',若为'\0',则原文中此处出现多个标点或空格相连。将该节点删去即可。2) 将节点的单词长度记录下来是为了在比较过程中提高效率,即单词长度不等则单词肯定不等。 4.采用“选择排序”。 5.原文档303kb. 6.运行结果: 7.性能分析: 可以看到,总共程序运行1.6s,在单独工作的函数中,除主函数外,pre_sort(

P1026 统计单词个数 【dp】

一世执手 提交于 2020-03-21 12:03:13
题目描述 给出一个长度不超过 200 2 0 0 的由小写英文字母组成的字母串(该字串以每行 20 2 0 个字母的方式输入,且保证每行一定为 20 2 0 个)。要求将此字母串分成 k k 份,且每份中包含的单词个数加起来总数最大。 每份中包含的单词可以部分重叠。当选用一个单词之后,其第一个字母不能再用。例如字符串 this 中可包含 this 和 is ,选用 this 之后就不能包含 th 。 单词在给出的一个不超过 6 6 个单词的字典中。 要求输出最大的个数。 输入格式 每组的第一行有两个正整数 p,k p , k。 p p 表示字串的行数, k k 表示分为 k k 个部分。 接下来的 p p 行,每行均有 20 2 0 个字符。 再接下来有一个正整数 s s,表示字典中单词个数。 接下来的 s s 行,每行均有一个单词。 输出格式 1 1个整数,分别对应每组测试数据的相应结果。 输入输出样例 输入 #1 复制 1 3 thisisabookyouareaoh 4 is a ok sab 输出 #1 复制 7 思路   题意有个地方说的比较模糊,就是重叠的情况下的影响。   实际上是用了this可以再选is,但是不能再选第一个字母t,也就是选满了main_len之后就不能选了。   大概懂了之后就知道这是一个递推找字符串的子串里满足能在字典中找到单词且能出现几个单词。

BZOJ3940: [Usaco2015 Feb]Censoring

倖福魔咒の 提交于 2020-03-20 08:31:42
BZOJ3940: [Usaco2015 Feb]Censoring Description Farmer John has purchased a subscription to Good Hooveskeeping magazine for his cows, so they have plenty of material to read while waiting around in the barn during milking sessions. Unfortunately, the latest issue contains a rather inappropriate article on how to cook the perfect steak, which FJ would rather his cows not see (clearly, the magazine is in need of better editorial oversight). FJ has taken all of the text from the magazine to create the string S of length at most 10^5 characters. He has a list of censored words t_1 ... t_N that he

LeetCode --- 68. Text Justification

余生颓废 提交于 2020-03-20 04:31:59
题目链接: Text Justification Given an array of words and a length L, format the text such that each line has exactly L characters and is fully (left and right) justified. You should pack your words in a greedy approach; that is, pack as many words as you can in each line. Pad extra spaces ' ' when necessary so that each line has exactly L characters. Extra spaces between words should be distributed as evenly as possible. If the number of spaces on a line do not divide evenly between words, the empty slots on the left will be assigned more spaces than the slots on the right. For the last line of

2020年3月校内模拟赛 编程题5 C++实现

…衆ロ難τιáo~ 提交于 2020-03-17 20:51:27
问题描述   小明对类似于 hello 这种单词非常感兴趣,这种单词可以正好分为四段,第一段由一个或多个辅音字母组成,第二段由一个或多个元音字母组成,第三段由一个或多个辅音字母组成,第四段由一个或多个元音字母组成。   给定一个单词,请判断这个单词是否也是这种单词,如果是请输出yes,否则请输出no。   元音字母包括 a, e, i, o, u,共五个,其他均为辅音字母。 输入格式   输入一行,包含一个单词,单词中只包含小写英文字母。 输出格式   输出答案,或者为yes,或者为no。 样例输入 lanqiao 样例输出 yes 样例输入 world 样例输出 no 评测用例规模与约定   对于所有评测用例,单词中的字母个数不超过100。 #include<iostream> #include<string> using namespace std; // 1元音 2 辅音 int fun (char c) { if (c == 'a' || c == 'e' || c == 'i' || c == 'o' || c == 'u') return 1; else return 2; } int main () { string str; cin >> str; int level = 1; int judge = fun(str[0]); // 1元音 2 辅音 for

1160:拼写单词

99封情书 提交于 2020-03-17 20:44:38
题目地址: https://leetcode-cn.com/problems/find-words-that-can-be-formed-by-characters/ 题目描述 给你一份『词汇表』(字符串数组) words 和一张『字母表』(字符串) chars。假如你可以用 chars 中的『字母』(字符)拼写出 words 中的某个『单词』(字符串),那么我们就认为你掌握了这个单词。 注意: 每次拼写时,chars 中的每个字母都只能用一次。返回词汇表 words 中你掌握的所有单词的长度之和 题目示例 示例 1: 输入:words = ["cat","bt","hat","tree"], chars = "atach" 输出:6 解释: 可以形成字符串 "cat" 和 "hat",所以答案是 3 + 3 = 6。 示例 2: 输入:words = ["hello","world","leetcode"], chars = "welldonehoneyr" 输出:10 解释: 可以形成字符串 "hello" 和 "world",所以答案是 5 + 5 = 10。 提示: 1 <= words.length <= 1000 1 <= words[i].length, chars.length <= 100 所有字符串中都仅包含小写英文字母 解题思路 通过分析题目可得

哈希表:拼写单词 (3.17 leetcode每日打卡)

偶尔善良 提交于 2020-03-17 11:00:03
给你一份『词汇表』(字符串数组) words 和一张『字母表』(字符串) chars。 假如你可以用 chars 中的『字母』(字符)拼写出 words 中的某个『单词』(字符串),那么我们就认为你掌握了这个单词。 注意:每次拼写时,chars 中的每个字母都只能用一次。 返回词汇表 words 中你掌握的所有单词的 长度之和。 示例 1: 输入:words = ["cat","bt","hat","tree"], chars = "atach" 输出:6 解释: 可以形成字符串 "cat" 和 "hat",所以答案是 3 + 3 = 6。 示例 2: 输入:words = ["hello","world","leetcode"], chars = "welldonehoneyr" 输出:10 解释: 可以形成字符串 "hello" 和 "world",所以答案是 5 + 5 = 10。 提示: 1 <= words.length <= 1000 1 <= words[i].length, chars.length <= 100 所有字符串中都仅包含小写英文字母 思路:今天也是刚知道哈希表的应用,就是建立一个表,根据关键值(例如ASCLL码)直接访问数据元素,然后达到快速查表的目的。本题的思路就是先把字母表的个字母数记录,然后再根每个单词进行比较

一个例子搞懂CSS中word-wrap、word-break

不羁岁月 提交于 2020-03-17 02:04:15
<div class="longW">这有一个长单词叫 longggggggggggggggggggggggggggg </div> 1、设置 word-wrap:break-word 它会首先尝试挪到下一行,看看下一行的宽度够不够,放不下的话就在 下一行 进行单词内的强制断句 word-wrap 决定是否允许单词内断句 normal: 只在允许的断字点换行(浏览器保持默认处理:长单词就会溢出) 。 break-word:在长单词或URL地址内部进行换行。 2、设置 word-break:break-all 它断句的方式非常粗暴,word-break:break-all不会尝试把长单词挪到下一行,而是直接进行单词内的断句,当这一行放不下的时候就直接强制断句。如果想更节省空间,那就用word-break:break-all。 word-break 决定用什么方式来断句 normal:使用浏览器默认的换行规则。 break-all:允许在单词内换行 , 允许任意非CJK(Chinese/Japanese/Korean)文本间的单词断行。 keep-all:只能在半角空格或连字符处换行,不允许CJK(Chinese/Japanese/Korean)文本中的单词换行,只能在半角空格或连字符处换行。非CJK文本的行为实际上和normal一致。 来源: CSDN 作者: 五花漏 链接:

Java语言命名规则

若如初见. 提交于 2020-03-16 17:54:49
某厂面试归来,发现自己落伍了!>>> A:包 最好是域名倒过来,要求所有的字母小写 B:类或者接口 如果是一个单词首字母大写 如果是多个单词每个单词首字母大写(驼峰标识) C:方法或者变量 如果是一个单词全部小写 如果是多个单词,从第二个单词首字母大写 D:常量 如果是一个单词,所有字母大写 如果是多个单词,所有的单词大写,用下划线区分每个单词 这里的字母不仅仅局限于26个常见的英文字母 (知道就行) 来源: oschina 链接: https://my.oschina.net/u/1580996/blog/682048

凡是背单词背词汇表,都是傻×行为

霸气de小男生 提交于 2020-03-16 14:14:33
某厂面试归来,发现自己落伍了!>>> 原文标题:重点谈单词就是死!这个小组连存在都没必要 觉得说得太对了,转过来给大家看看,原文链接: 重点谈单词就是死!这个小组连存在都没必要 凡是背单词被词汇表,都是傻×行为,我们高帅富的透析英语根本就不屑跟你们这些人玩儿 用扇贝背单词,基本上就是一背一个死啊! 之前小组有人发帖讨论扇贝之类的软件(拓词也好,百词斩也好),我就把其中reasonable的建议放这里 “扇贝我之前坚持了1年多,它刚建起的时候我就在那了,和cheka他们也挺熟,不过后来觉得没什么用,平时看书用透析就可以了。所以我放弃了,背单词果然不是一个好方法。 现在坚持下来的那些人,基本上每天添加的新单词不超过20个,其实20个也多了。时间拉的太长,很久之前的肯定不会记得,就算记得,也没有在文章中习得的印象深刻。 如果是为了考-试背单词,那我建议还是拓词,毕竟它短期的量还是相当大的。只要你能坚持到考-试就好。其实靠量的话,沪江里面的背单词也挺好。但我真心不喜欢背单词。 如果是为了学好英文,那就建议不要背单词,看组里的帖子吧,扇贝不适合爱英语的同学。当背单词成为一种习惯的时候,很可怕的,我宁愿把读原版书当作一个习惯。” “用了半年多,放弃了,背单词的问题都是一样的,容易形成记忆孤岛。 另外,对于一个单词有很多种释义的,效果就很不好。 还有我在一个月内背了terrible,dread