negative

数据分析练习报告二

我是研究僧i 提交于 2020-03-14 01:48:50
一、今天完成了行业代码匹配,还有数据没有展示 二、文本匹配,添加行业代码。 设计思路:首先,我们需要将完全相同的行业代码进行匹配,其次将相似的行业代码进行文本相似匹配,选取符合要求的前面几个行业,追加行业代码。 判断完全相同的部分就不解释了,主要解释如何使用word2vec模式进行文本相似的匹配。 需要使用的库 1、首先我们需要创建数据集(主要看数据集是以何种方式储存的),接收数据集(使用何种函数)。 数据集中单个元素与单个元素之间以空格隔开。接受数据集 1 sentences = word2vec.Text8Corpus("../词库/商业类别词.txt") #text8为语料库文件名 View Code 2、构建模型 1 model=gensim.models.Word2Vec(sentences, sg=1, size=100, window=5, min_count=2, negative=3, sample=0.001, hs=1, workers=4) 2 # print(model) 3 # 该步骤也可分解为以下三步(但没必要): 4 # model=gensim.model.Word2Vec() 建立一个空的模型对象 5 # # model.build_vocab(sentences) 遍历一次语料库建立词典 6 # # model.train(sentences)

混淆矩阵

Deadly 提交于 2020-03-06 17:44:24
预测0 预测1 实际0 True negative False positive 实际1 False negative True positive 简单的说就是混淆矩阵有四个部分,这四个部分由预测结果和实际标签两个部分交叉出来的结果。 首先说按照老外的思维:对于结果有两个态度,一个是积极的(positive),一个是消极的(negative)。 所以预测为1的时候,被称为positive,被预测为消极的时候,被称为negative。 当实际值为1,但预测为消极的时候,这时的结论就是假消极,(False negative)。当实际值为0,预测值也为0的时候,这时的结论就是真消极(True nagative)。 当实际值为0,但预测为积极的时候,这时的结论就是假积极,(False positive)。 当实际值为1,预测值也为1的时候,这时的结论就是真积极(True positive) from sklearn.metrics import confusion_matrix y_true = [0,1,0,1,1,1,0,1,0,0] y_pred = [0,0,0,1,1,0,0,1,0,1] confusion_matrix(y_true, y_pred) return: array([[4, 1], [2, 3]], dtype=int64) cm = confusion

ROC曲线(Receiver Operating Characteristic Curve)

家住魔仙堡 提交于 2020-03-05 11:03:35
分类模型尝试将各个实例(instance)划归到某个特定的类,而分类模型的结果一般是实数值,如逻辑回归,其结果是从0到1的实数值。这里就涉及到如何确定阈值(threshold value),使得模型结果大于这个值,划为一类,小于这个值,划归为另一类。 考虑一个二分问题,即将实例分成正类(positive)或负类(negative)。对一个二分问题来说,会出现四种情况。如果一个实例是正类并且也被预测成正类,即为真正类(True positive),如果实例是负类被预测成正类,称之为假正类(False positive)。相应地,如果实例是负类被预测成负类,称之为真负类(True positive),正类被预测成负类则为假负类(false negative)。 列联表如下表所示,1代表正类,0代表负类。     预测       1 0 合计 实际 1 True Positive(TP) False Negative(FN) Actual Positive(TP+FN) 0 False Positive(FP) True Negative(TN) Actual Negative(FP+TN) 合计   Predicted Positive(TP+FP) Predicted Negative(FN+TN)  TP+FP+FN+TN 从列联表引入两个新名词。其一是真正类率(true

求正/负余数

南笙酒味 提交于 2020-03-02 00:43:40
` 以下为程序运行结果示例: negative: -1 positive: 4 输入格式:无 输出格式: 负余数的输出格式:"negative: %d\n" 正余数的输出格式:"positive: %d\n" ```c #include <stdio.h> #include <stdlib.h> int main() { int a=-11,b=5,c; c=a%b; printf("negative: %d\n",c); printf("positive: %d\n",c+5); return 0; } ``我们可以直接通过暴力直接推出这个结果, 我的第二中求法通过数学函数,表示出绝对值,在进行计算 #include <stdio.h> #include <stdlib.h> #include <math.h> int main() { int a=-11,b=5,c; c=a%b; printf("negative: %d\n",c); if (a<0&&c<0) c+=fabs(b); printf("positive: %d\n",c); return 0; } 注意调用数学函数。 来源: CSDN 作者: zm528630 链接: https://blog.csdn.net/zm528630/article/details/104599196

POJ 2121

时光怂恿深爱的人放手 提交于 2020-02-24 13:14:06
Inglish-Number Translator Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 5162 Accepted: 2027 Description In this problem, you will be given one or more integers in English. Your task is to translate these numbers into their integer representation. The numbers can range from negative 999,999,999 to positive 999,999,999. The following is an exhaustive list of English words that your program must account for: negative, zero, one, two, three, four, five, six, seven, eight, nine, ten, eleven, twelve, thirteen, fourteen, fifteen, sixteen, seventeen, eighteen, nineteen, twenty, thirty,

Climbing Stairs

喜夏-厌秋 提交于 2020-02-17 11:51:44
原题链接在这里: https://leetcode.com/problems/combination-sum-iv/ 题目: Given an integer array with all positive numbers and no duplicates, find the number of possible combinations that add up to a positive integer target. Example: nums = [1, 2, 3] target = 4 The possible combination ways are: (1, 1, 1, 1) (1, 1, 2) (1, 2, 1) (1, 3) (2, 1, 1) (2, 2) (3, 1) Note that different sequences are counted as different combinations. Therefore the output is 7. Follow up: What if negative numbers are allowed in the given array? How does it change the problem? What limitation we need to add to the question to

Word2vec模型及负采样精讲

旧巷老猫 提交于 2020-02-12 21:55:03
Word2vec模型本质 :是一个用来生成词向量的、简单的神经网络模型。   通过计算相似度来降低原来输入词的维度,举个例子:              图.甲 网络结构如下:                图.乙   如乙图所示,我们一开始输入的是one-hot编码后的向量,1位于第7位,其对应的输入层到隐藏层的权重矩阵w一定是第7行,如下图示意            图.丙   丙图示意的是第三行,我们将one-hot编码后的输入再tokenize转化回去,查找w索引值为3的行,拿出来即可,拿出来的就是 词向量 原来需要计算那么多次乘法,现在只需查表即可。   图甲那张图的全过程称之为 池化向量。                图.丁   图丁有一处错误,全连接层激活函数为softmax,output到预测值时的激活函数为sigmoid,此图为原始的池化向量过程。 负采样:     在训练神经网络时,每当接受一个训练样本,然后调整所有神经单元权重参数,来使神经网络预测更加准确。换句话说,每个训练样本都将会调整所有神经网络中的参数。   我们词汇表的大小决定了我们skip-gram 神经网络将会有一个非常大的权重参数,并且所有的权重参数会随着数十亿训练样本不断调整。   negative sampling (负例样本,即one-hot编码后的为0的那些位置的样本

[Algorithm] 448. Find All Numbers Disappeared in an Array

|▌冷眼眸甩不掉的悲伤 提交于 2020-02-12 03:21:35
Given an array of integers where 1 ≤ a[i] ≤ n ( n = size of array), some elements appear twice and others appear once. Find all the elements of [1, n ] inclusive that do not appear in this array. Could you do it without extra space and in O( n ) runtime? You may assume the returned list does not count as extra space. Example: Input: [4,3,2,7,8,2,3,1] Output: [5,6] /** * @param {number[]} nums * @return {number[]} */ var findDisappearedNumbers = function(nums) { let a = new Set(); for (let i = 1; i <= nums.length; i++) { a.add(i); } for (let num of nums) { if (a.has(num)) { a.delete(num) } }

Query DSL - Boosting Query

老子叫甜甜 提交于 2020-02-03 23:18:22
Boosting Query Returns documents matching a positive query while reducing the relevance score of documents that also match a negative query. 可以为返回的文档匹配一个 positive 查询和一个 negative 查询, positive 查询对文档的相关性得分没有影响,而 negative 查询会降低文档的 相关性得分 。 You can use the boosting query to demote certain documents without excluding them from the search results. 您可以使用 boosting 查询使某些文档降级,而不必将它们从搜索结果中排除。 Example request GET /_search { "query": { "boosting" : { "positive" : { "term" : { "text" : "apple" } }, "negative" : { "term" : { "text" : "pie tart fruit crumble tree" } }, "negative_boost" : 0.5 } } } Copy as cURL

A Tour of Go Exercise: Errors

强颜欢笑 提交于 2020-02-01 02:54:46
Copy your Sqrt function from the earlier exercises and modify it to return an error value. Sqrt should return a non-nil error value when given a negative number, as it doesn't support complex numbers. Create a new type type ErrNegativeSqrt float64 and make it an error by giving it a func (e ErrNegativeSqrt) Error() string method such that ErrNegativeSqrt(-2).Error() returns "cannot Sqrt negative number: -2" . Note: a call to fmt.Print(e) inside the Error method will send the program into an infinite loop. You can avoid this by converting e first: fmt.Print(float64(e)) . Why? Change your Sqrt