test

垃圾邮件分类

ε祈祈猫儿з 提交于 2020-03-21 04:24:11
1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词汇出现概率的向量 。 6. 测试模型:用测试数据集评估模型预测的正确率。 混淆矩阵 准确率、精确率、召回率、F值 7. 预测一封新邮件的类别。 8. 考虑如何进行中文的文本分类(期末作业之一)。 要点: 理解朴素贝叶斯算法 理解机器学习算法建模过程 理解文本常用处理流程 理解模型评估方法 #垃圾邮件分类# import csv import nltk from nltk.corpus import stopwords from nltk.stem import WordNetLemmatizer text = '''As per your request 'Melle Melle (Oru Minnaminunginte Nurungu Vettam)' has been set as your callertune for all Callers. Press *9 to copy your friends Callertune''' #预处理# def preprocessing(text): #分词#

android unit test

感情迁移 提交于 2020-03-20 23:30:42
3 月,跳不动了?>>> Android Unit and Integration testing:https://github.com/codepath/android_guides/wiki/Android-Unit-and-Integration-testing Unit Testing with JUnit - Tutorial: http://www.vogella.com/tutorials/JUnit/article.html Android application testing with the Android test framework - Tutorial :http://www.vogella.com/tutorials/AndroidTesting/article.html Robolectric Installation for Unit Testing:https://github.com/codepath/android_guides/wiki/Robolectric-Installation-for-Unit-Testing Android Button Example:http://www.mkyong.com/android/android-button-example/ https://code.google.com/p/robotium

python机器学习之KNN算法

跟風遠走 提交于 2020-03-20 23:30:22
K邻近算法(kNeighbrClassifier/KNN):原理为 欧几里得距离+最近+投票(权重)+概率    根据距离的远近进行分类   欧几里得距离:多维空间中各点之间的距离       缺点: 时间复杂度和空间 复杂度较大    注 意:当训练样本数据少的时候,样本比例一定要相同   KNN算法分类电影 import numpy import pandas #导入Excel文件 from sklearn.neighbors import KNeighborsClassifier #机器学习算法库,没有深度学习算法 movie=pandas.read_excel(r"D:\Python\代码\Machine-Learn\1-KNN\data\movie.xlsx",sheet_name=0) movie 电影名称 武打镜头 接吻镜头 分类情况 0 大话西游 36 1 动作片 1 杀破狼 43 2 动作片 2 前任3 0 10 爱情片 3 战狼2 59 1 动作片 4 泰坦尼克号 1 15 爱情片 5 新余心愿 2 19 爱情片 movie=pandas.read_excel(r"D:\Python\代码\Machine-Learn\1-KNN\data\movie.xlsx",sheet_name=0) x=movie[["武打镜头","接吻镜头"]]

python中多线程与多进程中的数据共享问题

感情迁移 提交于 2020-03-20 23:25:27
之前在写多线程与多进程的时候,因为一般情况下都是各自完成各自的任务,各个子线程或者各个子进程之前并没有太多的联系,如果需要通信的话我会使用队列或者数据库来完成,但是最近我在写一些多线程与多进程的代码时,发现如果它们需要用到共享变量的话,需要有一些注意的地方 多线程之间的共享数据 标准数据类型在线程间共享 看以下代码 #coding:utf-8 import threading def test(name,data): print("in thread {} name is {}".format(threading.current_thread(),name)) print("data is {} id(data) is {}".format(data,id(data))) if __name__ == '__main__': d = 5 name = "杨彦星" for i in range(5): th = threading.Thread(target=test,args=(name,d)) th.start() 这里我创建一个全局的int变量d,它的值是5,当我在5个线程中调用test函数时,将d作为参数传进去,那么这5个线程所拥有的是同一个d吗?我在test函数中通过 id(data) 来打印一下它们的ID,得到了如下的结果 in thread <Thread(Thread

Robolectric 探索之路

我与影子孤独终老i 提交于 2020-03-20 23:19:35
3 月,跳不动了?>>> layout: post title: Roboletric探索之路,从抗拒到依赖 description: Roboletric Android Unit Testing category: blog --- 我为什么以前抗拒Android Unit Testing 1、懒,人类最大的天敌; 2、不是不知道什么是单元测试,只是需求太多了,哪有时间~; 3、需要学习单元测试的语言或者框架,不熟悉,所以从没尝试过; 4、没见到单元测试的好处,一想到要花时间就望而却步; 5、至少只是我个人之前的感受,我相信有很多的程序猿同胞们都跟我有类似的感受; 既然抗拒,为什么现在要尝试Android Unit Testing呢 大势所趋,bug量的增多不得不让我们提高代码的质量,不是我们完不成功能,只是我们验证功能的成本实在太高,随着工程的复杂度的增加,run一次模拟器或者真机,在window上的花费至少是一分钟以上,甚至三四分钟,所以有些人偷懒,包括我,有时候把那些看上去“没有问题的代码”提交到了主干上,随之产生了bug,然后进入修复bug-》run-》修复bug->run;花费了更多的时间和资源; 我们的燃眉之急是要尽快改善这个问题,从根源着手,就是【增强自测】 测试手段 现在是个讲究效率的时代,我们希望能够快速高效的验证我们的代码逻辑是否有问题

前端JavaScript规范

断了今生、忘了曾经 提交于 2020-03-20 23:17:39
JavaScript规范 目录 类型 对象 数组 字符串 函数 属性 变量 条件表达式和等号 块 注释 空白 逗号 分号 类型转换 命名约定 存取器 构造器 事件 模块 jQuery ES5 兼容性 HTML、CSS、JavaScript分离 使用jsHint 前端工具 类型 原始值 : 相当于传值(JavaScript对象都提供了字面量),使用字面量创建对象。 string number boolean null undefined var foo = 1, bar = foo; bar = 9; console.log(foo, bar); // => 1, 9 复杂类型 : 相当于传引用 object array function var foo = [1, 2], bar = foo; bar[0] = 9; console.log(foo[0], bar[0]); // => 9, 9 对象 使用字面值创建对象 // bad var item = new Object(); // good var item = {}; 不要使用保留字 reserved words 作为键 // bad var superman = { class: 'superhero', default: { clark: 'kent' }, private: true }; // good var

获取Struts2 Fielderror信息

白昼怎懂夜的黑 提交于 2020-03-20 20:04:01
3 月,跳不动了?>>> 1,addFieldError 等方法 都存放在request中 名称为 struts.valueStack (request.getAttribute ("struts.valueStack")) 2,valueStack是STRUTS2的一个堆栈类 获取ActionErrors方法 通过代码可用看到valueStack的结构 也可以去看源码(我快看吐了 狂调父类等 我是看不动了 有耐心的可以去看) 下面的代码直接嵌入到网页中是有效的 <s:if test="hasActionErrors()"> <div class="error" id="errorMessages"> <s:iterator value="actionErrors"> <s:property escape="false"/> -- 这个就是错误信息 </s:iterator> </div> </s:if> 获取FieldErrors 通ActionErrors <s:if test="hasFieldErrors()"> <div class="error" id="errorMessages"> <s:iterator value="fieldErrors"> <s:iterator value="value"> <s:property escape="false"/> </s

MyCat基本知识

谁都会走 提交于 2020-03-20 13:38:39
MyCat基本知识 一.Mycat基本元素 1.逻辑库,mycat中存在,对应用来说相当于mysql数据库,后端可能对应了多个物理数据库,逻辑库中不保存数据 2.逻辑表,逻辑库中的表,对应用来说相当于mysql的数据表,后端可能对应多个物理数据库中的表,也不保存数据 逻辑表分类 1.分片表,进行了水平切分的表,具有相同表结构但存储在不同数据库中的表,所有分片表的集合才是一张完整的表 2.非分片表,垂直切分的表,一个数据库中就保存了一张完整的表 3.全局表,所有分片数据库中都存在的表,如字典表,数量少,由mycat来进行维护更新 4.ER关系表,mycat独有,子表依赖父表,保证在同一个数据库中 二.安装mycat 1.配置环境变量 export JAVA_HOME=/usr/lib/jdk1.8.0_20 export JRE_HOME=$JAVA_HOME/jre export CLASSPATH=.:$JAVA_HOME/lib:$JER_HOME/lib:$CLASSPATH export PATH=$JAVA_HOME/bin:$JER_HOME/bin:$PATH:/usr/local/mycat/bin export MYCAT_HOME=/usr/local/mycat export ZOOKEEPER_HOME=/usr/ local/zookeeper-3.4

Mysql-01.安装和配置(重新整理)

故事扮演 提交于 2020-03-20 13:21:45
3 月,跳不动了?>>> Windows操作系统下安装和配置 一、Mysql安装 Window系统下Mysql安装文件分为msi和zip格式,其中msi格式可以直接点击安装,按照安装提示进行安装配置即可,zip格式的则需要解压,解压完毕后需要手工配置才可以正常运行。 二、Mysql配置 ZIP版本的Mysql下载到本地后,直接解压即安装完毕。如解压路径为D:\Program Files\MySql,则Msql的配置和启动路径就在D:\Program Files\MySql\bin目录下。 配置默认的环境变量:将D:\Program Files\MySql\bin加入系统的环境变量Path中; 1.修改mysql默认配制信息 将my-default.ini修改为my.ini,修改my.ini内容,添加如下信息 basedir=D:\Program Files\MySql //Mysql程序目录 datadir=D:\Program Files\MySql\data //数据库存放目录 port=3306 //端口号 [mysql] default-character-set=utf8 //默认字符集(和下面的不一样) [mysqld] character-set-server=utf8 //默认字符集(和上面的有区别) 2.安装mysql服务 用管理员身份启动命令行窗口

codeforces 1236 A. Bad Ugly Numbers

帅比萌擦擦* 提交于 2020-03-20 12:39:32
A. Bad Ugly Numbers time limit per test 1 second memory limit per test 256 megabytes input standard input output standard output You are given a integer n n ( n > 0 n>0). Find any integer s s which satisfies these conditions, or report that there are no such numbers: In the decimal representation of s s: s > 0 s>0, s s consists of n n digits, no digit in s s equals 0 0, s s is not divisible by any of it's digits. Input The input consists of multiple test cases. The first line of the input contains a single integer t t ( 1 ≤ t ≤ 400 1≤t≤400), the number of test cases. The next t t lines each