杭电OJ——2030汉字统计
题目 汉字统计 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 74491 Accepted Submission(s): 40031 Problem Description 统计给定文本文件中汉字的个数。 Input 输入文件首先包含一个整数n,表示测试实例的个数,然后是n段文本。 Output 对于每一段文本,输出其中的汉字的个数,每个测试实例的输出占一行。 [Hint:]从汉字机内码的特点考虑~ Sample Input 2 WaHaHa! WaHaHa! 今年过节不说话要说只说普通话WaHaHa! WaHaHa! 马上就要期末考试了Are you ready? Sample Output 14 9 解题思路 一开始,看到“汉字机内码”,内心的独白是:“这是啥???计算机组成原理恐惧???” 今天去查了一些资料,稍微了解了一些。嗯一点点突破,那都是进步嘛!!!汉字机内码在计算机中由两个字节表示,且字节最高位是1,数据在计算机中由补码表示,则对应的十进制数是负数的,所以只要统计字符串中值为负数的字节数即可。对了,最后count要除以2,因为刚才说了嘛,汉字由两个字节表示。 关于汉字机内码 我转载了一篇文章,在我的专栏