数据集成

我的面试题-软件测试基础

浪子不回头ぞ 提交于 2019-11-27 12:24:41
软件的生命周期(prdctrm) 计划阶段(planning)-〉需求分析(requirement)-〉设计阶段(design)-〉编码(coding)->测试(testing)->运行与维护(running maintrnacne) 1 ,问:你在测试中发现了一个 bug ,但是开发经理认为这不是一个 bug ,你应该怎样解决。 答: 首先,将问题提交到缺陷管理库里面进行备案。 然后,要获取判断的依据和标准: 根据需求说明书、产品说明、设计文档等,确认实际结果是否与计划有不一致的地方,提供缺陷是否确认的直接依据; 如果没有文档依据,可以根据类似软件的一般特性来说明是否存在不一致的地方,来确认是否是缺陷; 根据用户的一般使用习惯,来确认是否是缺陷; 与设计人员、开发人员和客户代表等相关人员探讨,确认是否是缺陷; 合理的论述,向测试经理说明自己的判断的理由,注意客观、严谨,不参杂个人情绪。 等待测试经理做出最终决定,如果仍然存在争议,可以通过公司政策所提供的渠道,向上级反映,并有上级做出决定。 2 ,问:给你一个网站,你如何测试? 答: 首先,查找需求说明、网站设计 m 等相关文档,分析测试需求,制定测试计划,确定测试范围和测试策略,一般包括以下几个部分: 功能性测试;界面测试;性能测试;数据库测试;安全性测试;兼容性测试 设计测试用例: 功能性测试可以包括,但不限于以下几个方面:

webservice优缺点

有些话、适合烂在心里 提交于 2019-11-27 06:32:19
为什么要用webservice 用webservice是为了支持异构平台,譬如服务器端是python/java,客户端可以是jsp/php/asp.net。 从测试角度看,可以用它做测试的客户端,通过webservice和服务器通信。 从接口角度看,webservice生成的代码虽然很啰嗦,可它是强类型代码,接口有变动只要编译就知道错误。 J2EE的EJB(SLSB)可以提供WebService,而且是支持多个客户端并发的。即两个client可以同时调用同一个接口,而且这两个接口会同时执行(因为无状态)。 例如,若同时访问同一个接口,会同时调用: 14:01:41,641 INFO [STDOUT] registerWorker start... 14:01:41,919 INFO [STDOUT] registerWorker start... 14:01:46,668 INFO [STDOUT] registerWorker #1008 14:01:46,670 INFO [STDOUT] registerWorker finished... 14:01:46,924 INFO [STDOUT] registerWorker #1009 14:01:46,926 INFO [STDOUT] registerWorker finished... 14:01:56,671 INFO

(转载)彻底的理解:WebService到底是什么?

佐手、 提交于 2019-11-27 05:06:07
(转载)彻底的理解:WebService到底是什么? 最近老是有人跟我提web service接口,怎么,怎么滴,我觉得很扎耳朵,web service是一种将服务器的服务封装起来的技术,表现为对外提供接口,所以,web service不是一种接口 !!!!!! 转载地址: http://blog.csdn.net/qq_19916577/article/details/44988015 一、序言 大家或多或少都听过WebService(Web服务),有一段时间很多计算机期刊、书籍和网站都大肆的提及和宣传WebService技术,其中不乏很多吹嘘和做广告的成分。但是不得不承认的是WebService真的是一门新兴和有前途的技术,那么WebService到底是什么?何时应该用? 当前的应用程序开发逐步的呈现了两种迥然不同的倾向:一种是基于浏览器的瘦客户端应用程序,一种是基于浏览器的富客户端应用程序(RIA),当然后一种技术相对来说更加的时髦一些(如现在很流行的Html5技术),这里主要讲前者。 基于浏览器的瘦客户端应用程序并不是因为瘦客户能够提供更好的用户界面,而是因为它能够避免花在桌面应用程序发布上的高成本。发布桌面应用程序成本很高,一半是因为应用程序安装和配置的问题,另一半是因为客户和服务器之间通信的问题

Learning from class-imbalanced data: Review of methods and applications 论文阅读

南楼画角 提交于 2019-11-27 02:40:51
目录 Learning from class-imbalanced data: Review of methods and applications 摘要 Introdution 介绍 Research methodology and initial statistics 调研方法和初始统计 Research methodology 调研方法 Initial statistics 初步统计 Imbalanced data classification approaches 不平衡数据分类方法 Basic strategies for dealing with imbalanced learning 处理不平衡学习的基本方法 Preprocessing techniques 预处理技术 resampling 重采样 Feature selection and extraction 特征选择和抽取 Cost-sensitive learning 代价敏感学习 Classification algorithms for imbalanced learning 针对不平衡学习的分类算法 Ensemble methods 集成方法 Iterative based ensemble 基于迭代的集成 Parallel based ensembles 基于并行的集成 Base classifier

nlp四大任务集成项目

一世执手 提交于 2019-11-26 20:01:45
介绍 本项目支持的NLP任务包括 分类、匹配、序列标注、文本生成等. - 对于分类任务,目前支持多分类、多标签分类,通过选择不同的loss即可。 - 对于匹配任务,目前已支持交互模型和表示模型。 - 对于NER任务,目前已支持rnn+crf,idcnn+crf以及bert+crfgit地址:https://github.com/zhufz/nlp_research 数据 训练数据(目前data下均内置了样例数据): (1)对于分类任务的数据使用csv格式,csv头部包括列名‘target’和‘text’; (2)对于匹配任务的数据使用csv格式,csv头部包括列名‘target’,‘text’ 或者 ‘target’,‘text_a’,‘text_b’ (3)对于NER任务的数据,参考"data/ner/train_data",或者使用其它格式的数据的话,修改task/ner.py中的read_data方法即可。 预训练数据(目前在分类和匹配任务上已支持): - 如果使用到bert作为预训练(直接下载google训练好的模型即可),直接运行"sh scripts/prepare.sh" - 如果使用elmo作为预训练,需要准备一份corpus.txt训练语料放在language_model/bilm_tf/data/目录下 然后执行指令进行预训练: cd language

140种Python标准库、第三方库和外部工具

♀尐吖头ヾ 提交于 2019-11-26 19:38:36
吐血整理!140种Python标准库、第三方库和外部工具都有了 Python那些事 今天 文章转载自公众号 大数据 , 作者 宋天龙 导读: Python数据工具箱涵盖从数据源到数据可视化的完整流程中涉及到的常用库、函数和外部工具。其中既有Python内置函数和标准库,又有第三方库和工具。 这些库可用于文件读写、网络抓取和解析、数据连接、数清洗转换、数据计算和统计分析、图像和视频处理、音频处理、数据挖掘/机器学习/深度学习、数据可视化、交互学习和集成开发以及其他Python协同数据工作工具。 作者:宋天龙 来源:大数据(ID:hzdashuju) 内容摘编自《Python数据分析与数据化运营》(第2版) 为了区分不同对象的来源和类型,本文将在描述中通过以下方法进行标识: Python内置函数: Python自带的内置函数。函数无需导入,直接使用。例如要计算-3.2的绝对值,直接使用abs函数,方法是 abs( -3.2) Python标准库: Python自带的标准库。Python标准库无需安装,只需要先通过import方法导入便可使用其中的方法。例如导入string模块,然后使用其中的find方法: import string string.find( 'abcde', 'b') 第三方库: Python的第三方库。这些库需要先进行安装(部分可能需要配置)。 外部工具:

集成学习 概念介绍

老子叫甜甜 提交于 2019-11-26 11:37:27
集成学习(Esemble learning) 在机器学习领域,如何根据观察数据学习一个精确的估计数据是一个主要问题。 通常,我们通过训练数据应用某个算法得出一个训练模型,然后使用评估数据来评估这个模型的预测正确率,最后如果我们可以接受这个正确率就使用该模型进行预测数据。通常我们将训练数据进行交叉验证,比如说10则交叉验证,我们将训练数据平均分为10份,循环用其中的9份数据来训练模型,用另一份数据验证准确率,最后将结果准确率平均就是最后的分类准确率。当然还有其他方法。 但是寻找一个可以有很高准确率的算法是很难的。 弱学习:就是学习算法在辨别一组概念仅比猜测好一点。 强学习:可以再一个多项式级的时间内辨别一组概念,而且准确率很高。 目前,已经证明,强学习和弱学习是相互等价的,意思就是说在我们学习某一组概念的时候可以只使用一个比一个随机猜测好一点的弱学习算法,然后使用某种方法将它提升为强学习。 即使用多个弱学习器集成为一个强学习。集成学习的理论基础就是这个。 集成学习可以显著的提高学习系统的泛化能力。 步骤: 1)通过不同方法训练出多个学习器(比如使用同质的分类器不同的训练数据和参数设置,使用不一样的分类器。。。。) 2)集成多个分类器的结果。 在集成学习系统中,分量学习器的输出形式对采用何种集成方法有很大的影响,根据输出形式我们可以这么分: (1)基于抽象级信息的集成