def

文本分类的一种对抗训练方法

萝らか妹 提交于 2021-01-23 05:25:36
最近阅读了有关文本分类的文章,其中有一篇名为《Adversarail Training for Semi-supervised Text Classification》, 其主要思路实在文本训练时增加了一个扰动因子,即在embedding层加入一个小的扰动,发现训练的结果比不加要好很多。 模型的网络结构如下图: 下面就介绍一下这个对抗因子r的生成过程: 在进入lstm网络前先进行从w到v的计算,即将wordembedding 归一化: 然后定义模型的损失函数,令输入为x,参数为θ,R adv 为对抗训练因子,损失函数为: 其中一个细节,虽然 θ ˆ 是θ的复制,但是它是计算扰动的过程,不会参与到计算梯度的反向传播算法中。 然后就是求扰动: 先对表达式求导得到倒数g,然后对倒数g进行l2正则化的线性变换。 至此扰动则计算完成然后加入之前的wordembedding中参与模型训练。 下面则是模型的代码部分: #构建adversarailLSTM模型 class AdversarailLSTM(object): def __init__(self, config, wordEmbedding, indexFreqs): #定义输入 self.inputX = tf.placeholder(tf.int32, [None, config.sequenceLength], name=

C#几种截取字符串的方法(split 、Substring、Replace、remove)

冷暖自知 提交于 2021-01-23 03:55:37
C#截图字符串常用的方法有 split 、Substring、Replace、remove等。 split的使用: 1. Split( Char ()) 返回的字符串数组包含此实例中的子字符串(由指定 Unicode 字符数组的元素分隔)。 根据单个分隔字符用split截取。 例如 复制代码代码如下: string st="GT123_1"; string[] sArray=st.Split(‘_’);// 一定是单引 即可得到sArray[0]="GT123",sArray[1]="1"; 2.利用多个字符来分隔字符串 例如 复制代码代码如下: string str = "GTAZB_JiangjBen_123"; string[] sArray = str.Split(new char[2] { 'j', '_' }); foreach(string e in sArray) { Console.WriteLine(e); } 得到sArray[0]="GTAZB",sArray[1]="Jiang",sArray[2]="Ben",sArray[3]="123"; 3.Split( String (), StringSplitOptions) 返回的字符串数组包含此字符串中的子字符串(由指定字符串数组的元素分隔)。参数指定是否返回空数组元素。

几句简单的python代码完成周公解梦功能

ぃ、小莉子 提交于 2021-01-22 18:01:24
《周公解梦》是靠人的梦来卜吉凶的一本于民间流传的解梦书籍,共有七类梦境的解述。这是非常传统的中国文化体系的一部分,但是如何用代码来获取并搜索周公解梦的数据呢?一般情况下,要通过爬虫获取数据,然后再进行索引搜索,这个过程是十分复杂的,要熟练很多技术并且花不少时间开发,所以最好的方法还是直接调用接口完成,笔者以python为例,来实现这个功能: # -*- coding: utf-8 -*- # flake8: noqa __author__ = 'wukong' import urllib from urllib import urlencode #配置您申请的appKey和openId app_key="***" open_id="***" """ request_url 请求地址 params 请求参数 method 请求方法 """ def request_content(request_url,params,method): params = urlencode(params) if method and method.lower() =="get": f = urllib.urlopen("%s?%s" % (request_url, params)) else: f = urllib.urlopen(request_url, params) content = f

TensorFlow实现线性回归

拟墨画扇 提交于 2021-01-22 15:28:16
线性回归(Linear regression)是利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式。 特点:只有一个自变量的情况称为单变量回归,大于一个自变量情况的叫做多元回归 通用公式:h(w) = w 1 x 1 +w 2 x 2 +w 3 x 3 +...+b=w T x + b 根据数据建立回归模型,w1x1+w2x2+…..+b = y,通过真实值与预测值之间建立误差,使用梯度下降优化得到损失最小对应的权重和偏置。最终确定模型的权重和偏置参数,最后可以用这些参数进行预测。 线性回归案例: 假设随机指定100个点,只有一个特征 数据本身的分布为 y = 0.7 * x + 0.8 这里将数据分布的规律确定,是为了使我们训练出的参数跟真实的参数(即0.7和0.8)比较是否训练准确 TensorFlow计算API: 运算 矩阵运算 tf.matmul(x, w) 平方 tf.square(error) 均值 tf.reduce_mean(error) 梯度下降优化 tf.train.GradientDescentOptimizer(learning_rate) 梯度下降优化 learning_rate:学习率,一般为0~1之间比较小的值 method: minimize(loss) return:梯度下降op 步骤分析: 1

有关魔兽世界怀旧服的钓鱼工具的一点思考

ぐ巨炮叔叔 提交于 2021-01-22 12:27:18
手动钓鱼是真的累,思考了很久包括在网上也参考了很多思路. 抓包改协议肯定会被封,只能做物理上的自动钓鱼工具. 具体流程应该是这样 1.甩杆,计时开始 2.截图分析浮标的坐标 3.等到音频波动(鱼上钩的声音) 4.将鼠标移动到指定坐标,右击浮标,上鱼 照这个思路实现成功率50%左右的一个工具. openCV的识别能做到80%-90%左右的图像识别准确率 最主要问题是浮标距离会导致鱼上钩声音大小不同,离得近,上钩声音大,远的话,声音会较小. ##2019/10/23 主要用到库uiautomation 这个库是python用来做windows应用的自动化的。 这个库支持大部分的windows应用,不支持DirectUI程序。 很多DirectUI程序都没有实现UIAutomation Provider,所以不支持自动化,要想支持自动化,必须程序作者修改源码支持。 应用内的编辑及点击,都可以通过这个库来实现。不需要去整什么按键精灵。 automation.py 可以查看当前所有的windows应用信息 如下这段代码,可以激活你的windows应用,并在对应的坐标(x,y)右击操作。 import uiautomation as autotool def myAppClick(): detailWindow = autotool.WindowControl(searchDepth= 1,

常用的JVM配置参数

喜欢而已 提交于 2021-01-22 10:36:34
一、Trace 跟踪参数   在Eclipse中,如何打开GC的监控日志     选择菜单栏Run -> Run Configurations -> Java Application -> 选择自己的项目 -> 在右侧找到Arguments选项卡 -> 在VM arguments中填写参数,具体参数在下面会有说明。     根据右侧Main的project和下面Main class确定自己监控的main方法     在右侧找到Arguments选项卡 -> 在VM arguments中填写参数 -verbose:gc(打开GC的跟踪日志) -XX:+printGC(打开GC的log的开关,简要日志)     上图为我自己的一个小项目中的gc简要的日志信息 其中 9865k 表示在堆中GC之前使用了9865k的空间,2891k 表示GC之后使用2891k的空间,剩空间为19456k ,本次GC使用的时间为0.0021802 secs -XX:+PrintGCDetails(打印GC的详细信息)     上图我们以第二条为例:PSYoungGen表示新生代 GC之前为9214k,GC之后为 1016K,新生代总大小为9216k,GC所使用的时间为0.0016505 secs。而后面的信息则为上面简要信息中的内容。user 总计本次 GC 总线程所占用的总 CPU 时间 ,sys –

python语法

只愿长相守 提交于 2021-01-22 04:54:32
python语法 python语法优缺点 编辑方法 注释 变量 输出 输入 延时打印 运算符 常用数据类型转换 if 判断语句 循环 dict和set 函数 递归函数 高级特性 python语法优缺点 1、优点 简单 易学 免费、开源 可移植性 可扩展性 2、缺点 运行速度 国内市场较小 中文资料匮乏 构架选择太多 3、使用场景 web应用开发 操作系统管理、服务器运维的自动化脚本 科学计算 桌面应用程序 服务器软件(爬虫等) 游戏(逻辑、服务器) 构思实现,产品早期原型 编辑方法 一、python第一种编辑方法 1、打开终端,输入 python,进入python环境,输入exit(),退出python (默认进入python 2交互程序) 2、输入python3,进入python 3交互程序 二、python第二种编辑方式 1、先通过命令行查找python2或python3的地址,记下来 2、通过vi编辑器编写程序,并在首行加上指定的解释器,即 (Windows系统会忽略这个注释) 3、查看新建文件是否有可执行权限,若没有,就添加 ls -l chmod u+x test.py 4、以上设置完成后,输入 ./test.py 即可执行程序 三、python第三种编辑方式 1、在试用本地文本编辑器编写程序并保存 2、在终端直接通过python 文件名 执行 注:推荐使用 python

Python编码---转自金角大王

天涯浪子 提交于 2021-01-21 09:42:47
本节内容   编码回顾   编码转换   Python的bytes类型 编码回顾 在备编码相关的课件时,在知乎上看到一段关于Python编码的回答 这哥们的这段话说的太对了,搞Python不把编码彻底搞明白,总有一天它会猝不及防坑你一把。 不过感觉这哥们的答案并没把编码问题写明白,所以只好亲自动笔了。 折腾编码问题,有很多次,我以为自已明白了,最终发现,那只不过是自圆其说而已,这一次,终于100%确定,动笔即不再改! 看这篇文章前,你应该已经知道了为什么有编码,以及编码的种类情况 ASCII 占1个字节,只支持英文 GB2312 占2个字节,支持6700+汉字 GBK GB2312的升级版,支持21000+汉字 Shift-JIS 日本字符 ks_c_5601-1987 韩国编码 TIS-620 泰国编码 由于每个国家都有自己的字符,所以其对应关系也涵盖了自己国家的字符,但是以上编码都存在局限性,即:仅涵盖本国字符,无其他国家字符的对应关系。应运而生出现了万国码,他涵盖了全球所有的文字和二进制的对应关系, Unicode 2-4字节 已经收录136690个字符,并还在一直不断扩张中... Unicode 起到了2个作用: 直接支持全球所有语言,每个国家都可以不用再使用自己之前的旧编码了,用unicode就可以了。(就跟英语是全球统一语言一样)

python GUI(Tkinter)

五迷三道 提交于 2021-01-21 09:41:44
Tkinter简介   是python内置的标准GUI库,在安装python后,导入模块即可正常使用,Tk和Tkinter可在大多数的Unix,以及Windows和Macintosh系统上运行。 关于Tkinter的导入(注意大小写) 在2.x版本上,编写为: from Tkinter import * 在3.x版本上,编写为: from tkinter import * Tkinter组件 控件 描述 Button 按钮控件 Canvas 画布控件,显示图形元素如线条或文本 Checkbutton 多选框控件,不存在互斥,可多个选择 Entry 输入控件,用于输入或者显示文本内容 Frame 框架控件,在屏幕上显示一个矩形区,多用于作为容器 Label 标签控件,可用于显示文本和位图 Listbox 列表控件 Menubutton 菜单项按钮控件 Menu 菜单控件,显示菜单栏,下拉菜单和弹出菜单等 Message 消息控件,用于显示多行文本,与Label类似 Radiobutton 多选框控件,存在互斥,多个只能选择一个 Scale 范围控件,显示一个数值刻度并设定范围 Scrollbar 滚动条控件,当内容超过可视化区域的时候使用,比如列表框 Text 文本控件,用于显示多行文本 Toplevel 容器控件,用来提供一个单独的对话框,和Frame类似 Spinbox 输入控件

python接口自动化框架搭建

人走茶凉 提交于 2021-01-21 03:59:17
一、在搭建接口自动化测试框架前,我觉得先需要想明白以下几点:   ① 目前情况下,绝大部分接口协议是http,所以需要对http协议有个基本的了解,如:http协议请求、响应由哪些部分组成,常用的method,对应的请求传参方式等等   ② 需要对接口发送请求,所以要对可以发送http请求的模块比较熟悉,如python 的requests、urllib 等   ③ 使用的数据承载工具,如使用excel、mysql、oracle 等   ④ 实现哪些需求,如 在用例层面控制是否执行用例,响应信息、执行结果、失败原因等等写入数据载体,可变参数分离的配置化,测试结束后邮件发送结果给相关人员等等   ⑤ 发送请求前需要解决哪些问题,如 上下接口间的关联(包含请求参数与关联参数的映射关系)、url的拼接等等;请求后的断言等等   ⑥ 其他的,如涉及到接口加密、调用其他语言的方法等等 二、下面是实现的思路: 先遍历接口列表》查找出需要测试的接口》根据接口找到对应的用例》 遍历该接口的用例》找出需要执行的用例》判断用例是否与其他接口有关联》 处理关联关系》拼接请求url及参数》发送请求》断言用例是否通过》写入结果内容》发送邮件 三、框架模块基本结构(数据载体使用excel) 关联示例: 参数配置示例: 日志示例: 四、主函数详细代码(即第二步的思路实现) from utils