分隔符

运用python制作词云(2)

匿名 (未验证) 提交于 2019-12-02 22:11:45
在运用python制作词云(1)中我们知道了可以用jieba库将语句拆分成词组 接下来我们将使用wordcloud库将得到的词组制作成词云 前排提示: join()函数使用 语法: 'sep'.join(seq) 上面的语法即:以sep作为分隔符,将seq所有的元素合并成一个新的字符串 返回值:返回一个以分隔符sep连接各个元素后生成的字符串 遇到python不懂的问题,可以加Python学习交流群:1004391443一起学习交流,群文件还有零基础入门的学习资料 如 结果为 即以 空格为分隔符 的字符串 wordcloud库的安装 在命令提示符里面输入命令来安装wordcloud库 pip3 install wordcloud 完成wordcloud库的安装 安装后 在python中输入import wordcloud 如没有错误提示即确认安装成功 词组文本的生成 在生成词云时,wordcloud默认会以空格或标点为分隔符对目标文本进行分词处理。 因此为了方便起见,首先将文本变为以空格和标点为分隔符的词组文本。 下面以文本 ” 2018年世界互联网峰会,马云总体演讲了阿里巴巴的成长历程,以及在战略布局上的思维;从演讲中了解到,阿里巴巴定位之初,并非是一家希望成功的商家身份。而是希望通过阿里巴巴平台,使更多小商家成功的企业。可以知道,马云成功之初,互联网创业阿里巴巴,定位的是小企业

MySQL必知应会-第23章-使用存储过程

匿名 (未验证) 提交于 2019-12-02 22:06:11
本章介绍什么是存储过程,为什么要使用存储过程以及如何使用存储过程,并且介绍创建和使用存储过程的基本语法。 需要MySQL 5 MySQL 5添加了对存储过程的支持,因此,本章内容适用于MySQL 5及以后的版本。迄今为止,使用的大多数SQL语句都是针对一个或多个表的单条语句。并非所有操作都这么简单,经常会有一个完整的操作需要多条语句才能完成。例如,考虑以下的情形。 为了处理订单,需要核对以保证库存中有相应的物品。 如果库存有物品,这些物品需要预定以便不将它们再卖给别的人,并且要减少可用的物品数量以反映正确的库存量。 库存中没有的物品需要订购,这需要与供应商进行某种交互。 关于哪些物品入库(并且可以立即发货)和哪些物品退订,需要通知相应的客户。这显然不是一个完整的例子,它甚至超出了本书中所用样例表的范围,但足以帮助表达我们的意思了。执行这个处理需要针对许多表的多条MySQL语句。此外,需要执行的具体语句及其次序也不是固定的,它们可能会(和将)根据哪些物品在库存中哪些不在而变化。那么,怎样编写此代码?可以单独编写每条语句,并根据结果有条217164 使用存储过程件地执行另外的语句。在每次需要这个处理时(以及每个需要它的应用中)都必须做这些工作。可以创建存储过程。存储过程简单来说,就是为以后的使用而保存的一条或多条MySQL语句的集合。可将其视为批文件,虽然它们的作用不仅限于批处理。

Linux常用命令

匿名 (未验证) 提交于 2019-12-02 21:56:30
本文总结一些在开发中常用到的Linux命令。 1. vim vim命令用于编辑文件。 普通模式(命令行模式) 123456789 set number/set nu:vim时显示行号 或通过修改vim的配置文件使得每次vim时都显示行号HOME:快速移动到当前行首部END:快速移动到当前行尾部w:移动到下一个单词b:移动到上一个单词:+行号+回车:快速移动到某一行:+$+回车:快速移动到最后一行dd:删除当前行dj:删除当前行和下一行 由普通模式进入插入模式 12345 i:在当前光标处进行编辑I:在行首插入A:在行尾插入o:在当前行后插入一个新行O:在当前行前插入一个新行 由插入模式进入普通模式 1 ESC 2. grep grep命令用于查找文件里符合条件的字符串。 1234567891011 以nba.txt文件为例:cat nba.txt | grep "curry":查找nba.txt中包含curry字符串的所有行并返回cat nba.txt | grep "curry" -v:查找nba.txt中不包含curry字符串的所有行并返回(第一条的取反)cat nba.txt | grep "CuRry" -i:忽略大小写cat nba.txt | grep "curry" -n:显示匹配到的行号cat nba.txt | grep "curry" -c:统计匹配到的结果行数

linux命令高级操作

匿名 (未验证) 提交于 2019-12-02 21:56:30
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/shenlong1356/article/details/91554209 Table of Contents 4、shell编程统计某个文件夹下的文件占用的字节数,过滤4096大小的文件(if语句): 5、 awk编程 参考: https://www.cnblogs.com/chenhuan001/p/6297615.html 尽管操作可能会很复杂,但语法总是这样 ,其中 pattern 表示 AWK 在数据中查找的内容,而 action 是在找到匹配内容时所执行的一系列命令 。花括号({})不需要在程序中始终出现,但它们用于根据特定的模式对一系列指令进行分组。 pattern就是要表示的正则表达式,用斜杠括起来。 awk语言的最基本功能是在文件或者字符串中基于指定规则浏览和抽取信息,awk抽取信息后,才能进行其他文本操作。完整的awk脚本通常用来格式化文本文件中的信息。 通常,awk是以文件的一行为处理单位的。awk每接收文件的一行,然后执行相应的命令,来处理文本。 有三种方式调用awk 1.命令行方式 awk [-F field-separator] 'commands' input-file(s) 其中,commands 是真正awk命令,[-F域分隔符]是可选的。 input

Java字符串拼接新方法 StringJoiner

匿名 (未验证) 提交于 2019-12-02 21:52:03
Java中如何输出像1-2-3-4-5 这样的字符 抱歉对于这个问题我甚至不能想到一个合适的标题,但是不重要 以下操作基于 jdk 1.8 StringJoiner sj = new StringJoiner ( "-" , "" , "" ); sj . add ( "1" ). add ( "1" ). add ( "2" ); String desiredString = sj . toString (); 在1.8版本中新加了 一个’StringJoiner‘ 方法 StringJoiner是java.util包中的一个类,用于构造一个由分隔符分隔的字符序列(可选),并且可以从提供的前缀开始并以提供的后缀结尾。 虽然这也可以在StringBuilder类的帮助下在每个字符串之后附加分隔符,但StringJoiner提供了简单的方法来实现,而无需编写大量代码 关于StringJoiner的详细介绍大家可以去看看这位仁兄的博客 写的很好这里我就不过多阐述了 https://www.hollischuang.com/archives/3283 来源:博客园 作者: 飞鸟 链接:https://www.cnblogs.com/hwcs/p/11465141.html

字符串截取子串(Java substring , indexOf)

匿名 (未验证) 提交于 2019-12-02 21:52:03
前言   因为之前java课设做的是股票分析系统,我找的接口返回的是一个.csv文件,因为这种文件里面的数据是以逗号分隔的,所以要对数据进行分析的时候需要截取子串,并且以逗号作为截取的标志。所以接下来就说一下我使用的字符串函数 substring和indexOf。 ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- 字符串函数(字符串str为:2019-07-20-13-32) substring 函数的参数不同,功能也不一样。 比如 说一个参数的时候,给一个字符串里面的位置,然后从当前位置一直截取到字符串尾。比如temp=str.substring(5),那么temp=07-20-13-32。 如果有两个参数,那么截取的是两个位置之间的字符串。比如temp=str(0,3),那么temp=2019。 indexOf 函数的表示方法是给一个字符,返回的是该字符串中第一个该字符的位置,比如说是str.indexOf('-'

Python-OS模块

我怕爱的太早我们不能终老 提交于 2019-12-02 16:45:27
os模块的作用 os模块是python标准库中的一个用于访问操作系统功能的模块, os模块提供了其他操作系统接口,可以实现跨平台访问。 1.系统操作 os.sep 返回系统路径的分隔符 linux类系统的路径分隔符是“/”,windows系统的分隔符是“\” 1 import os 2 print(os.sep) # 返回系统路径的分隔符 os.name 返回当前平台操作系统 当返回的值为posix时,则为linux系统;返回值为nt时,则为windows系统 1 import os 2 print(os.name) # 输出当前操作系统类型 3 if os.name =='posix': 4 print('您使用的是linux系统') # 判断是使用是否为Linux系统 5 else: 6 print('您使用的是其他的系统') os.uname() 返回操作系统的详细信息,也可以得到具体分项的信息 Windows版本没有这个命令 1 import os #导入模块 2 uname = os.uname() #使用变量接收 3 print(uname) # 输出系统所有详细信息 4 print(uname.sysname) # 输出系统操作系统类型 5 print(uname.nodename) # 输出主机名称 6 print(uname.release) # 输出内核版本 7

第七章 Shell正则应用

大憨熊 提交于 2019-12-02 16:38:31
1. 正则表达式概述 01. 什么是正则表达式 正则表达式 regular expression , RE是一种字符模式,用于在查找过程中匹配指定的字符。 02. 为什么要使用正则表达式? 在工作中,我们时刻面对着大量的日志,程序,以及命令的输出。迫切的需要过滤我们需要的一部分内容,甚至是一个字符串。比如: 现在有一个上千行的文件,我们仅需要其中包含"root"的行,怎么办? 此时就需要使用到正则表达式的规则来筛选想要的内容。 03. 正则表达式注意事项 1.正则表达式应用非常广泛,存在于各种语言中,例如:php,python,java等。2.正则表达式和通配符特殊字符是有本质区别的3.要想学好grep、sed、awk首先就要掌握正则表达式。4.注意正则神坑,中文符号。 2. 正则表达式规则 正则表达式描述 \转义符,将特殊字符进行转义,忽略其特殊意义 ^匹配行首,^是匹配字符串的开始 $匹配行尾,$是匹配字符串的结尾 ^$表示空行. (点)匹配换行符之外的任意单个字符 [ ]匹配包含在[字符]之中的任意一个字符 [^]匹配[^]之外的任意一个字符 [a-z]匹配[]中指定范围内的任意一个字符 ?匹配其前面的字符1次或者0次+匹配其前面的字符1次或者多次 匹配其前面的字符0次或者多次**.** *表示所有( )匹配表达式,创建一个用于匹配的字符串 {n}匹配之前的项n次

shell命令

吃可爱长大的小学妹 提交于 2019-12-02 14:39:54
grep命令练习: 选项与参数: -a :将 binary 文件以 text 文件的方式搜寻数据 -c :计算找到 ‘搜寻字符串’ 的次数 -i :忽略大小写的不同,所以大小写视为相同 -n :顺便输出行号 -v :反向选择,亦即显示出没有 ‘搜寻字符串’ 内容的那一行! –color=auto :可以将找到的关键词部分加上颜色的显示喔! -A3 包含当前数据的后面三行数据, -B2 包含当前数据的前两行 0.包含jon数据的前两行和后一行 grep -n -A1 -B2 ‘Jon’ test.log 1.显示所有包含San的行 grep –n ‘San’ datafile 2.显示所有以J开始的人名所在的行 grep –n ‘^J’ datafile 3.显示所有以700结尾的行 grep –n ‘700 ’ d a t a f i l e 4. 显 示 所 有 不 包 括 834 的 行 g r e p – v n ‘ 834 ’ d a t a f i l e 5. 显 示 所 有 生 日 在 D e c e m b e r 的 行 g r e p – n ‘ : 12 / ’ d a t a f i l e 6. 显 示 所 有 电 话 号 码 的 区 号 为 284 的 行 g r e p – n ‘ : 284 − ’ d a t a f i l e 7. 显 示 所

Python超详细的字符串用法大全

孤街醉人 提交于 2019-12-02 12:31:43
字符串拼接 实际场景:把列表中的数据拼接成一个字符串 解决方案:使用 str.join() 方法 >>> li = ['cxk', 'cxk', 'kk', 'caibi'] >>> ''.join([str(i) for i in li]) 'cxkcxkkkcaibi' 推荐使用生成器表达式,如果列表很大,可以节省很多内存空间 >>> ''.join(str(i) for i in li) '3cxkkkcaibi' 拆分含有多种分隔符的字符串 实际场景:把某个字符串依据分割符号拆分不同的字段,该字符串包含多种不同的分隔符 s = "ab;fd/ft|fs,f\tdf.fss*dfd;fs:uu}fsd" 1.使用 python 中的 split() 方法,由于 split 一次处理一个分隔符,例如: >>> res = s.split(';') >>> res ['ab', 'fd/ft|fs,f\tdf.fss*dfd', 'fs:uu}fsd'] 所以我们需要根据字符串中的分隔符,依次分割,可以是 map 函数! >>> list(map(lambda x: x.split("|"), res)) [['ab'], ['fd/ft', 'fs,f\tdf.fss*dfd'], ['fs:uu}fsd']] 结果变成了一个二维列表,而我们想要的结果是一维列表,怎么办?