whitespace

在Python中删除字符串中的所有空格

梦想的初衷 提交于 2020-04-30 17:45:34
问题: I want to eliminate all the whitespace from a string, on both ends, and in between words. 我想消除字符串两端和单词之间的所有空白。 I have this Python code: 我有这个Python代码: def my_handle(self): sentence = ' hello apple ' sentence.strip() But that only eliminates the whitespace on both sides of the string. 但这仅消除了字符串两侧的空白。 How do I remove all whitespace? 如何删除所有空格? 解决方案: 参考一: https://stackoom.com/question/YhQa/在Python中删除字符串中的所有空格 参考二: https://oldbug.net/q/YhQa/Remove-all-whitespace-in-a-string-in-Python 来源: oschina 链接: https://my.oschina.net/u/3797416/blog/4259503

Python3字符串-含局部英文翻译

こ雲淡風輕ζ 提交于 2020-04-29 11:12:46
Strings are amongst the most popular types (最常用的类型) in Python. We can create them simply by enclosing characters in quotes(引号引起来) . Python treats single quotes the same as double quotes. Creating strings is as simple as assigning a value to a variable. For example − var1 = 'Hello World!' var2 = "Python Programming" 单引号、双引号、三引号要匹配 Accessing Values in Strings 通过索引和切片访问字符串中的值 Python does not support a character type; these are treated as strings of length one, thus also considered a substring. To access substrings, use the square brackets for slicing along with the index or indices to obtain your

关于Python编程,这一篇文章就够了,新手必学

别说谁变了你拦得住时间么 提交于 2020-04-29 09:31:44
概述 在使用Python或者其他的编程语言,都会多多少少遇到编码错误,处理起来非常痛苦。在Stack Overflow和其他的编程问答网站上,UnicodeDecodeError和UnicodeEncodeError也经常被提及。本篇教程希望能帮你认识Python编码,并能够从容的处理编码问题。 这里也要注意:不管你是为了Python就业还是兴趣爱好,记住:项目开发经验永远是核心,如果你没有2020最新python入门到高级实战视频教程,可以去小编的Python交流.裙 :七衣衣九七七巴而五(数字的谐音)转换下可以找到了,里面很多新python教程项目,还可以跟老司机交流讨教! 本教程提到的编码知识并不限定在Python,其他语言也大同小异,但我们依然会以Python为主,来演示和讲解编码知识。 通过该教程,你将学习到如下的知识: 获取有关字符编码和数字系统的概念 理解编码如何使用Python的str和bytes 通过int函数了解Python对数字系统的支持 熟悉Python字符编码和数字系统相关的内置函数 什么是字符编码 现在的编码规则已经有好多了,最简单、最基本是的ASCII编码,只要是你学过计算机相关的课程,你就应该多少了解一点ASCII编码,他是最小也是最适合了解字符编码原理的编码规则。具体如下: 小写英文字符:a-z 大写英文字符:A-Z 符号: 比如 $和! 空白符

[转]将微信和支付宝支付的个二维码合二为一

大城市里の小女人 提交于 2020-04-27 02:56:37
本文转自: https://blog.csdn.net/woshishuiaaad/article/details/53540933 因公司需要将支付宝和微信的二维码合成一个,不管用户用支付宝扫还是微信扫都能打开对应的支付页面,在网上找了一些文章,很感谢各位大神的经验,我也记录下我是如何将两个二维码合二为一的~。 原理:支付宝或微信生成的二维码中本质都内嵌了一个url,在扫码时实际是定向去访问二维码中内嵌的url,这样我就可以将这个url指定到我的一个控制器,在控制器中判断是微信还是支付宝软件扫的,然后去唤醒各自的支付即可。 1.首先生成二维码: folderName:存储二维码图片的文件夹名 imageName:二维码图片名称 content:是在二维码中写入的内容,这里我传入的是URL:指定我判断软件类型的控制器 [java] view plain copy public static String genQRImage(String folderName, String imageName, String content) { //String filePath = System.getProperty("twtwebapp.root"); String fileName = imageName + ".png"; try { // 检查是否存在imageQR目录

基于LSTM的语言模型实现

独自空忆成欢 提交于 2020-04-26 15:30:17
语言模型 简介 1. 任务说明 本文主要介绍基于lstm的语言的模型的实现,给定一个输入词序列(中文分词、英文tokenize),计算其ppl(语言模型困惑度,用户表示句子的流利程度),基于循环神经网络语言模型的介绍可以 参阅论文 。相对于传统的方法,基于循环神经网络的方法能够更好的解决稀疏词的问题。 2. 效果说明 在small meidum large三个不同配置情况的ppl对比: small config train valid test paddle 40.962 118.111 112.617 tensorflow 40.492 118.329 113.788 medium config train valid test paddle 45.620 87.398 83.682 tensorflow 45.594 87.363 84.015 large config train valid test paddle 37.221 82.358 78.137 tensorflow 38.342 82.311 78.121 3. 数据集 此任务的数据集合是采用ptb dataset,下载地址为: http://www.fit.vutbr.cz/~imikolov/rnnlm/simple-examples.tgz 快速开始 1. 开始第一次模型调用 训练或fine-tune

埋点指标和维度

爱⌒轻易说出口 提交于 2020-04-24 16:50:27
维度 日期 用户类型 品牌 设备型号 操作系统 分辨率 APP 版本 渠道 地域 页面 指标 一、用户类指标 二、复合指标 三、事件与页面指标 四、Crash分析指标 五、信息流分析指标 常用指标定义 一、用户类指标 启动用户 :启动过该应用的用户(以独立设备为判断标准),通常也叫活跃用户。 注:用户定义以独立设备为准,其中可能会用到包括 imei 、 mac id 、 Android id 、 IDFA 、 IDFV 等综合设备维度指标,生成长期有效彼此不冲突的唯一设备 ID 新用户 :首次下载安装并激活该应用的用户。在渠道或版本统计中,仅在第一次下载时被记为渠道新用户,后续重新下载或升级版本,不算新用户。(以独立设备为判断标准) 老用户 :当日启动用户中,以前也启动过应用程序的用户 日活跃用户 :当日启动过应用程序的用户(已去重) 周活跃用户 :过去 7 天(含当日)启动过应用程序的用户(已去重) 月活跃用户 :过去 30 天(含当日)启动过应用程序的用户(已去重) 月沉默用户 :过去 30 天(含当日)没有启动过应用程序的用户 留存用户 :所选考察时段的用户中,在留存时段再次启动应用的用户。包括新用户留存与活跃用户留存。 流失用户 :过去 60 天(含当日)没有启动过应用程序的用户(已去重) 分时用户 :每小时的启动用户数量(以独立设备为标准按小时去重) 升级用户 :

用PaddlePaddle实现BERT

纵然是瞬间 提交于 2020-04-23 13:08:13
模型介绍 BERT 的全称是基于 Transformer 的双向编码器表征,其中「双向」表示模型在处理某一个词时,它能同时利用前面的词和后面的词两部分信息。这种「双向」的来源在于 BERT 与传统语言模型不同,它不是在给定所有前面词的条件下预测最可能的当前词,而是随机遮掩一些词,并利用所有没被遮掩的词进行预测。 因此BERT的任务主要有以下两个: 二分类任务:在数据集中抽取两个句子A和B,B有50%的概率是A的下一句,这样通过判断B是否是A的下一句来判断BERT模型 Mask预测任务:传统语言模型是给定所有前面词来预测最可能的当前词,而BERT模型则是随机的使用「mask」来掩盖一些词,并利用所有没有被掩盖的词对这些词进行预测。论文中是随机mask掉15%的词,并且在确定需要mask的词后,80%的情况会使用「mask」来掩盖,10%的情况会使用随机词来替换,10%的情况会保留原词,例如: 原句:xx xx xx xx hello 80%:xx xx xx xx 「mask」 10%:xx xx xx xx world 10%:xx xx xx xx hello 预训练的流程如下图: 原文链接: BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding 参考链接: https:/

基于PaddlePaddle的对话通用理解模块DGU

和自甴很熟 提交于 2020-04-22 02:27:13
对话通用理解模块DGU 1、模型简介 2、快速开始 3、进阶使用 4、参考论文 1、模型简介     对话相关的任务中,Dialogue System常常需要根据场景的变化去解决多种多样的任务。任务的多样性(意图识别、槽位解析、DA识别、DST等等),以及领域训练数据的稀少,给Dialogue System的研究和应用带来了巨大的困难和挑战,要使得dialogue system得到更好的发展,需要开发一个通用的对话理解模型。为此,我们给出了基于BERT的对话通用理解模块(DGU: DialogueGeneralUnderstanding),通过实验表明,使用base-model(BERT)并结合常见的学习范式,就可以在几乎全部对话理解任务上取得比肩甚至超越各个领域业内最好的模型的效果,展现了学习一个通用对话理解模型的巨大潜力。 下载安装命令 ## CPU版本安装命令 pip install -f https://paddlepaddle.org.cn/pip/oschina/cpu paddlepaddle ## GPU版本安装命令 pip install -f https://paddlepaddle.org.cn/pip/oschina/gpu paddlepaddle-gpu 2、快速开始 安装说明   a、环境依赖 Python >= 2.7 cuda >= 9.0

cgroup,cpu.share参数,测试docker容器进程与系统进程CPU资源占用

纵饮孤独 提交于 2020-04-19 15:00:43
测试机器1核,Fedora release 30 (Thirty) 根据进程id,查看进程所属cgroup [username @localhost ~]$ cat /proc/1/cgroup 11: memory:/init.scope 10: pids:/init.scope 9:net_cls,net_prio:/ 8:hugetlb:/ 7: devices:/init.scope 6:perf_event:/ 5:cpuset:/ 4:blkio:/ 3:cpu,cpuacct:/ 2:freezer:/ 1:name= systemd:/init.scope 0::/init.scope cgroup根路径为/sys/fs/cgroup 系统进程与容器进程抢占CPU时,CPU资源是怎么分配的? 启动一个容器,运行两个进程 [username @localhost ~]$ sudo docker run -it --rm --cpu-shares=512 centos:7 /bin/bash [root@74983a25bb02 /]# while : ; do : ; done & [1] 14 [root@74983a25bb02 /]# while : ; do : ; done & [2] 15 查看监控数据 4857 root 20 0 11836 392 0

Python数据分析-第6章DataFrame(下)

余生颓废 提交于 2020-04-18 21:30:02
5.访问数据 DataFrame的数据结构分为行和列,一行和一列的交叉位置是一个cell,该cell的位置是由行索引和列索引共同确定的。可以通过at/iat,或loc/iloc属性来访问数据框的元素,该属性后跟一个中括号:[row,col],中括号内 row表示行索引或行标签,col表示列索引或列标签。如果省略row, 那么row维度使用“:”代替,格式是 [ :, col] ,表示访问所有行的特定列;如果省略col ,格式是[row],表示访问特定行的所有列。 In [39]: import pandas as pd data = { 'user' :[ '小王' , '小李' , '小明' ], 'shcool' :[ '清华' , '北大' , '科大' ], 'class' :[ '数学' , '历史' , '计算机' ]} df = pd . DataFrame ( data , index = [ 'a' , 'b' , 'c' ]) df Out[39]: user shcool class a 小王 清华 数学 b 小李 北大 历史 c 小明 科大 计算机 5.1.访问单个元素 通过元素的行和列索引对来访问单个cell,at 和 iat 属性只能访问当个cell,区别是at可以使用字符串和整数,而iat只能使用整数。 at 和 iat 的格式是:[row,