data

数据挖掘测试数据集大全

耗尽温柔 提交于 2020-03-08 14:57:41
常用的基本上UCI和w3c的。关于源代码,网上有很多公开源码的算法包,例如最为著名的Weka,MLC++等。Weka还在不断的更新其算法,下载地址: http://www.cs.waikato.ac.nz/ml/weka/ UCI收集的机器学习数据集 ftp://pami.sjtu.edu.cn http://www.ics.uci.edu/~mlearn/\\MLRepository.htm statlib http://liama.ia.ac.cn/SCILAB/scilabindexgb.htm http://lib.stat.cmu.edu/ 样本数据库 http://kdd.ics.uci.edu/ http://www.ics.uci.edu/~mlearn/MLRepository.html 关于基金的数据挖掘的网站 http://www.gotofund.com/index.asp http://lans.ece.utexas.edu/~strehl/ reuters数据集 http://www.research.att.com/~lewis/reuters21578.html 各种数据集: http://kdd.ics.uci.edu/summary.data.type.html http://www.mlnet.org/cgi-bin/mlnetois.pl/

Zookeeper 在Linux系统的安装

微笑、不失礼 提交于 2020-03-08 14:30:51
Zookeeper 介绍 注册中心负责服务地址的注册与查找,相当于目录服务,服务提供者和消费者只在启动时与注册中心交互,注册中心不转发请求,压力较小 安装步骤: 第一步:安装 jdk 第二步:把 zookeeper 的压缩包上传到linux 系统 Alt+P 进入SFTP ,输入put d:\zookeeper-3.4.6.tar.gz 上传 第三步:解压缩压缩包 tar -zxvf zookeeper-3.4.6.tar.gz 第四步:进入 zookeeper-3.4.6 目录,创建 data 文件夹 mkdir data 第五步:进入conf目录 ,把 zoo_sample.cfg 改名为 zoo.cfg cd conf mv zoo_sample.cfg zoo.cfg 第六步:打开zoo.cfg , 修改 data 属性:dataDir=/root/zookeeper-3.4.6/data Zookeeper 服务启动 进入bin目录,启动服务输入命令 ./ zkServer.sh start 关闭服务输入命令 ./ zkServer.sh stop 查看状态 ./zkServer.sh status 来源: https://www.cnblogs.com/sunliyuan/p/12442433.html

解决System.Data.SQLite兼容32位和64位问题

别来无恙 提交于 2020-03-08 11:12:20
将当前说明文档的目录下的x64、x86目录和System.Data.SQLite.dll文件复制到您的应用程序根目录中(注意更新引用,引用System.Data.SQLite.dll即可,两目录中的不需要引用,但发布时需打包)。 如果是WEB网站,则复制到Bin目录下即可,发布时,也注意x64和x86一起打包发布 注意,当前的System.Data.SQLite.dll是完全的托管代码,不是混合程序集,文件大小为两百多KB, 如果你使用的是八百多KB以上的,说明你使用的是混合程序集,混合程序集是指定的处理器架构的,无法在不同架构下使用 所谓混合程序集的System.Date.SQLite指的是包含了托管的代码和Native的C/C++代码,本解决办法提供的System.Data.SQLite的为完全的托管 代码,必须配合Native Interop dll才能使用 注意:System.Data.SQLite必须是1.0.86.0及其以上版本 文件下载地址: http://files.cnblogs.com/Ares-blog/sqlite%E5%85%BC%E5%AE%B964%E4%BD%8D%E5%92%8C32%E4%BD%8D%E6%96%B9%E6%A1%88.zip 来源: https://www.cnblogs.com/Ares-blog/p/3439354.html

Python 绘图 - Bokeh 柱状图小试(Stacked Bar)

喜夏-厌秋 提交于 2020-03-08 09:44:21
背景 在 Bokeh 初探 之后,学习使用它来做个图 目标 做一个柱状图,支持多个 y 数据源,即有堆叠效果的柱状图 stacked bar 实现 单数据源 简单的柱状图 参考 Handling Categorical Data — Bokeh 1.4.0 documentation from bokeh.io import show, output_file from bokeh.plotting import figure output_file("bars.html") fruits = ['Apples', 'Pears', 'Nectarines', 'Plums', 'Grapes', 'Strawberries'] counts = [5, 3, 4, 2, 4, 6] p = figure(x_range=fruits, plot_height=250, title="Fruit Counts", toolbar_location=None, tools="") p.vbar(x=fruits, top=counts, width=0.9) p.xgrid.grid_line_color = None p.y_range.start = 0 show(p) 效果图见上述参考 增加一个 y 数据源,做堆叠效果 这样的话,需要考虑: 数据源:不能是单一的列表了

Excel VBA随笔五

ε祈祈猫儿з 提交于 2020-03-08 09:08:04
使用ado操作外部数据 conn.Open "Provider=Microsoft.ACE.OLEDB.12.0;Data Source=E:\BaiduNetdiskDownload\EXCEL_VBA\第十六课\data\Edata.xlsx;Extended Properties=""HDR=YES;""" Range("a1").CopyFromRecordset conn.Execute("select * from [data$] union all select * from [data2$]") conn.Close '添加数据 insert into [data$](姓名, 性别, 年龄) values('太难起', '男', 33) excel 不能使用sql删除外部数据,可以加一列,设置是否删除,查询的时候,对此进行判断 运行提示找不到可安装的ISAM,加上excel 12.0; conn.Open "Provider=Microsoft.ACE.OLEDB.12.0;Data Source=E:\BaiduNetdiskDownload\EXCEL_VBA\第十六课\data\Edata.xlsx;Extended Properties=""excel 12.0;HDR=YES;""" select [data$].姓名, 性别, 年龄, 月薪 from

Docker部署Elasticsearch集群

旧巷老猫 提交于 2020-03-08 07:45:01
http://blog.sina.com.cn/s/blog_8ea8e9d50102wwik.html Docker部署Elasticsearch集群 参考文档: https://hub.docker.com/r/library/elasticsearch/ https://hub.tenxcloud.com/repos/tenxcloud/elasticsearch https://hub.alauda.cn/repos/library/elasticsearch 环境: CentOS 7.2 docker-engine-1.11.2 elasticsearch-2.3.3 前言: 虚拟机节点部署请参看 Elasticsearch 负载均衡集群 ,这里简单介绍下docker部署 本实验采用不同类型的节点集群(client x1, master x3, data x2) ela-client.example.com:192.168.8.10(client node) ela-master1.example.com:192.168.8.101(master node) ela-master2.example.com:192.168.8.102(master node) ela-master3.example.com:192.168.8.103(master node) ela

phpcms首页调用点击量方法(AJAX方法)

寵の児 提交于 2020-03-08 04:22:05
//在HTML文档加载完成立即执行该函数将触发DOMContentLoaded事件,而不需要等待样式表,图像和子框架页面加载(事件可以用来检测HTML页面是否完全加载完毕(fully-loaded))。 window.addEventListener(‘DOMContentLoaded’,function(evt){ //获取blogs的所有文章id var blogs = document . getElementsByClassName ( "blogs" ) ; var ids = "" ; for ( var i = 0 ; i < blogs . length ; i ++ ) { ids += blogs [ i ] . getAttribute ( "aid" ) + "," ; } //ajax开始 $ . ajax ( { url : 'http://' + document . domain + '/xy' , data : { ids : ids } , type : 'get' , cache : false , dataType : 'json' , success : function ( data ) { if ( data . msg ) { console . log ( data ) ; for ( var x = 0 ; x < data .

基于docker容器部署Solr 8.1.1

£可爱£侵袭症+ 提交于 2020-03-08 01:14:19
Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的返回结果。 https://github.com/docker-solr/docker-solr (1)bin:solr的运行脚本 (2)contrib:solr的一些扩展jar包,用于增强solr的功能 (3)dist:该目录包含build过程中产生的jar文件,以及相关的依赖文件 (4)data:用于存放与zookeeper关联的配置文件zoo.cfg (5)example:solr工程的例子目录 部署Solr $ docker run -d -it --restart=always -p 8983:8983 -privileged=true --name solr solr:v8.1.1 $ docker exec -it --user=solr solr /bin/bash $ mkdir /var/solr/data/new_core $ cp -r /opt/solr-8.1.1/server/solr/configsets/sample_techproducts_configs/conf /var/solr/data/new_core/

B树与B+树简明扼要的区别

自古美人都是妖i 提交于 2020-03-08 00:58:36
看了很多讲B树和B+树的文章,大多都是围绕各自的特性讲的,第一,树中每个结点最多含有m个孩子(m>=2);第二,……我也是从这些文章里弄懂了各种树的联系与区别,要真写,我可能还不如人家写得好。所以就在这里简明扼要的用几张图记录一下主要区别吧。 为了便于说明,我们先定义一条数据记录为一个二元组[key,data],key为记录的键值,key唯一;data为数据记录除key外的数据。 B树 每个节点都存储key和data,所有节点组成这棵树,并且叶子节点指针为null。 B+树 只有叶子节点存储data,叶子节点包含了这棵树的所有键值,叶子节点不存储指针。 后来,在B+树上增加了顺序访问指针,也就是每个叶子节点增加一个指向相邻叶子节点的指针,这样一棵树成了数据库系统实现索引的首选数据结构。 原因有很多,最主要的是这棵树矮胖,呵呵。一般来说,索引很大,往往以索引文件的形式存储的磁盘上,索引查找时产生磁盘I/O消耗,相对于内存存取,I/O存取的消耗要高几个数量级,所以评价一个数据结构作为索引的优劣最重要的指标就是在查找过程中磁盘I/O操作次数的时间复杂度。树高度越小,I/O次数越少。 那为什么是B+树而不是B树呢,因为它内节点不存储data,这样一个节点就可以存储更多的key。 在MySQL中,最常用的两个存储引擎是MyISAM和InnoDB,它们对索引的实现方式是不同的。 MyISAM

您善于使用匿名函数吗?

為{幸葍}努か 提交于 2020-03-07 19:34:43
尝试从缓存中获取数据,如果数据存在则返回,否则从数据源中获取数据,放入缓存,然后返回。   您是否熟悉上面这段逻辑说明?如果您的应用中大量使用了缓存,则上面这段逻辑很可能会出现许多次。例如: CacheManager cacheManager = new CacheManager (); public List < User > GetFriends( int userId) { string cacheKey = "friends_of_user_" + userId; object objResult = cacheManager.Get(cacheKey); if (objResult != null ) return ( List < User >)objResult; List < User > result = new UserService ().GetFriends(userId); cacheManager.Set(cacheKey, result); return result; }   这段逻辑似乎比较简单,不过在实际应用中,从数据源中获取数据可能不是简单地调用一个方法,而是需要多个类之间的协作,事务控制等等,而缓存的读写可能也会比上面的示例来的复杂。因此,一个可读性高的做法是提供三个独立的方法(读取缓存,读取数据源,写入缓存)