GT

Cassandra最佳实践(3)配置篇

£可爱£侵袭症+ 提交于 2020-03-25 09:14:26
3 月,跳不动了?>>> 本篇文章我们主要介绍cassandra的相关配置,我把cassandra的相关配置中个人觉得相对比较重要的按照集群、节点这个横向维度进行介绍,可能有的配置我不会列在这里,那么具有见cassandra.yaml里面的详细介绍;如何配置cassandra,需要在集群启动的时候在conf目录下面的cassandra.yaml里面进行配置即可。此外我们的配置需要遵守yaml文件配置规则。本处以3.11.4进行介绍 集群维度 cluster_name: //集群的名字,默认是Test Cluster,用''括起来。不同的cluster name的节点无法组成一个集群 num_tokens: 256 //集群中单节点的的分配token数,因为使用vnode,也就是vnode的个数,每个token是随机生成的,此外如果不使用vnode的话,可以使用每个节点预分配一个初始的token,通过下面的配置下; initial_token: //如果集群不想使用vnode的话,需要手工给每个节点进行token配置,手工计算节点的token数,但是扩容的时候建议是成倍扩容。vnode不需要 partitioner: //集群的数据分配算法,也就是常见的一致性hash算法中计算hash的那个模块,其中默认使用org.apache.cassandra.dht

Python类的方法(method):super的用法

两盒软妹~` 提交于 2020-03-25 09:02:44
3 月,跳不动了?>>> 一、问题的发现与提出   在Python类的方法(method)中,要调用父类的某个方法,在Python 2.2以前,通常的写法如代码段1: 代码段1: class A: def __init__ (self): print " enter A " print " leave A " class B(A): def __init__ (self): print " enter B " A. __init__ (self) print " leave B " >>> b = B() enter B enter A leave A leave B 即,使用非绑定的类方法(用类名来引用的方法),并在参数列表中,引入待绑定的对象(self),从而达到调用父类的目的。   这样做的缺点是,当一个子类的父类发生变化时(如类B的父类由A变为C时),必须遍历整个类定义,把所有的通过非绑定的方法的类名全部替换过来,例如代码段2, 代码段2: class B(C): # A --> C def __init__ (self): print " enter B " C. __init__ (self) # A --> C print " leave B "   如果代码简单,这样的改动或许还可以接受。但如果代码量庞大,这样的修改可能是灾难性的。   因此,自Python 2

11-散列3 QQ帐户的申请与登陆 (25分)

十年热恋 提交于 2020-03-25 08:45:09
3 月,跳不动了?>>> 实现QQ新帐户申请和老帐户登陆的简化版功能。最大挑战是:据说现在的QQ号码已经有10位数了。 输入格式: 输入首先给出一个正整数 NN ( ≤ 10^5 ​ ​ ),随后给出 NN 行指令。每行指令的格式为:“命令符(空格)QQ号码(空格)密码”。其中命令符为“N”(代表New)时表示要新申请一个QQ号,后面是新帐户的号码和密码;命令符为“L”(代表Login)时表示是老帐户登陆,后面是登陆信息。QQ号码为一个不超过10位、但大于1000(据说QQ老总的号码是1001)的整数。密码为不小于6位、不超过16位、且不包含空格的字符串。 输出格式: 针对每条指令,给出相应的信息: 1)若新申请帐户成功,则输出“New: OK”; 2)若新申请的号码已经存在,则输出“ERROR: Exist”; 3)若老帐户登陆成功,则输出“Login: OK”; 4)若老帐户QQ号码不存在,则输出“ERROR: Not Exist”; 5)若老帐户密码错误,则输出“ERROR: Wrong PW”。 输入样例: 5 L 1234567890 myQQ@qq.com N 1234567890 myQQ@qq.com N 1234567890 myQQ@qq.com L 1234567890 myQQ@qq L 1234567890 myQQ@qq.com 输出样例: ERROR:

java代码中操作Redis:单机redis、集群redis(spring+redis集成)

两盒软妹~` 提交于 2020-03-25 08:42:29
3 月,跳不动了?>>> 一、准备 关于redis的一些安装,可以查看我的几篇文章自行安装: Redis目录 。 一个web项目,我这边一直用的一个github项目是: https://github.com/gubaijin/buildmavenweb 导入java的Redis客户端依赖包Jedis: <dependency> <groupId>redis.clients</groupId> <artifactId>jedis</artifactId> <version>2.9.0</version> </dependency> 二、单机Redis 简单单机用代码测试: Jedis jedis = new Jedis("localhost"); jedis.set("foo", "bar"); String value = jedis.get("foo"); 跟spring集成,大家可以直接点击查看: J2ee项目从0搭建(十一):在项目中集成Redis,用于数据的存储或者缓存 三、代码中连接redis集群 //使用jedis在代码中连接redis集群,因为是集群,可以自动发现,也同样只要一个地址就行了 Set<HostAndPort> jedisClusterNodes = new HashSet<HostAndPort>(); //Jedis Cluster will

Solr的安装与配制

故事扮演 提交于 2020-03-25 08:42:02
3 月,跳不动了?>>> 一、下载solr solr 各种版本下载地址:http://archive.apache.org/dist/lucene/solr/ 我使用的是solr-6.0.0 二、下载tomcat8 tomcat8的各个版本的下载地址:http://archive.apache.org/dist/tomcat/tomcat-8/ 我使用的版本是:apache-tomcat-8.0.51 三、solr的环境搭建 将tomcat、solr解压 并将webapp重命名为solr 3.1 将【solr-6.0.0\server\solr-webapp】下的webapp文件拷贝到【apache-tomcat-8.0.51\webapps】目录下 3.2 将【solr-6.0.0\server\lib\ext】下的所有jar包拷贝到【apache-tomcat-8.0.51\webapps\solr\WEB-INF\lib】 3.3 将【solr-6.0.0\server\resources】下的log4j.properties配置文件拷贝到【apache-tomcat-8.0.51\webapps\solr\WEB-INF\classes】(如果WEB-INF下没有classes文件那么,就创建一个classes文件夹) 3.4 在【apache-tomcat-8.0.51

redis配置详解

你。 提交于 2020-03-25 08:35:27
3 月,跳不动了?>>> ##redis配置详解 # Redis configuration file example. # # Note that in order to read the configuration file, Redis must be # started with the file path as first argument: # # ./redis-server /path/to/redis.conf # Note on units: when memory size is needed, it is possible to specify # it in the usual form of 1k 5GB 4M and so forth: # # 1k => 1000 bytes # 1kb => 1024 bytes # 1m => 1000000 bytes # 1mb => 1024*1024 bytes # 1g => 1000000000 bytes # 1gb => 1024*1024*1024 bytes # # units are case insensitive so 1GB 1Gb 1gB are all the same. ################################## INCLUDES ###########

Spark MLlib SVM算法

若如初见. 提交于 2020-03-25 08:33:20
3 月,跳不动了?>>> 1.1 SVM支持向量机算法 支持向量机理论知识参照以下文档: 支持向量机 SVM (一) http://www.cnblogs.com/jerrylead/archive/2011/03/13/1982639.html 支持向量机 SVM (二) http://www.cnblogs.com/jerrylead/archive/2011/03/13/1982684.html 支持向量机(三)核函数 http://www.cnblogs.com/jerrylead/archive/2011/03/18/1988406.html 支持向量机(四) http://www.cnblogs.com/jerrylead/archive/2011/03/18/1988415.html 支持向量机(五) SMO 算法 http://www.cnblogs.com/jerrylead/archive/2011/03/18/1988419.html SVM 的目标函数及梯度下降更新公式如下: MLlib 中 SVM的代码结构如下: 1.2 Spark Mllib SVM源码分析 1.2.1 SVMWithSGD SVM 算法的train 方法,由SVMWithSGD类的object定义了train函数,在train函数中新建了SVMWithSGD对象。 package

Spark MLlib Deep Learning Deep Belief Network (深度学习-深度信念网络)2.2

只谈情不闲聊 提交于 2020-03-25 08:31:41
3 月,跳不动了?>>> Spark MLlib Deep Learning Deep Belief Network ( 深度学习- 深度信念网络)2.2 http://blog.csdn.net/sunbow0 第二章Deep Belief Network ( 深度信念网络) 2 基础及源码解析 2.1 Deep Belief Network深度信念网络基础知识 1 )综合基础知识参照: http://tieba.baidu.com/p/2895759455 http://wenku.baidu.com/link?url=E8eett6R-mpVL-5AtO1yRNZR4DdEhW7YkQhDKY2CoYCiCQQYqdmWgrHQed2rsJZ8H2rwobpTgyjuXhdakD5QRv0OBWCUB8B2UA2iSNTcGeO 2 )原著资料参照: 《Learning Deep Architectures for AI 》 http://wenku.baidu.com/link?url=suD736_WyPyNRj_CEcdo11mKBNMBoq73-u9IxJkbksOtNXdsfMnxOCN2TUz-zVuW80iyb72dyah_GI6qAaPKg42J2sQWLmHeqv4CrU1aqTq 《A Practical Guide to Training

Spark MLlib FPGrowth算法

[亡魂溺海] 提交于 2020-03-25 08:29:06
3 月,跳不动了?>>> 1.1 FPGrowth算法 1.1.1 基本概念 关联规则挖掘的一个典型例子是购物篮分析。关联规则研究有助于发现交易数据库中不同商品(项)之间的联系,找出顾客购买行为模式,如购买了某一商品对购买其他商品的影响,分析结果可以应用于商品货架布局、货存安排以及根据购买模式对用户进行分类。 关联规则的相关术语如下: (1 )项与项集 这是一个集合的概念,在一篮子商品中的一件消费品即为一项(Item ),则若干项的集合为项集,如{啤酒,尿布}构成一个二元项集。 (2 )关联规则 一般记为的形式,X 为先决条件,Y为相应的关联结果,用于表示数据内隐含的关联性。如:表示购买了尿布的消费者往往也会购买啤酒。 关联性强度如何,由三个概念—— 支持度、置信度、提升度来控制和评价。 例:有10000 个消费者购买了商品,其中购买尿布1000个,购买啤酒2000个,购买面包500个,同时购买尿布和面包800个,同时购买尿布和面包100个。 (3 )支持度(Support) 支持度是指在所有项集中{X, Y} 出现的可能性,即项集中同时含有X和Y的概率: 该指标作为建立强关联规则的第一个门槛,衡量了所考察关联规则在“量”上的多少。通过设定最小阈值(minsup ),剔除“出镜率”较低的无意义规则,保留出现较为频繁的项集所隐含的规则。 设定最小阈值为5% ,由于{尿布,啤酒

Spark MLlib Logistic Regression逻辑回归算法

我只是一个虾纸丫 提交于 2020-03-25 08:27:07
3 月,跳不动了?>>> 1.1 逻辑回归算法 1.1.1 基础理论 logistic 回归本质上是线性回归,只是在特征到结果的映射中加入了一层函数映射,即先把特征线性求和,然后使用函数g(z) 将最为假设函数来预测。g(z)可以将连续值映射到0和1上。 它与线性回归的不同点在于:为了将线性回归输出的很大范围的数,例如从负无穷到正无穷,压缩到0 和1之间,这样的输出值表达为“可能性”才能说服广大民众。当然了,把大值压缩到这个范围还有个很好的好处,就是可以消除特别冒尖的变量的影响 。 Logistic 函数(或称为Sigmoid 函数),函数形式为: Sigmoid 函数在有个很漂亮的“S” 形,如下图所示: 给定n 个特征x=(x1,x2,…,xn),设条件概率P(y=1|x)为观测样本y相对于事件因素x发生的概率,用sigmoid函数表示为: 那么在x 条件下y不发生的概率为: 假设现在有 m 个相互独立的观测事件y=(y1,y2,…,ym),则一个事件yi发生的概率为(yi= 1) 当y=1 的时候,后面那一项是不是没有了,那就只剩下x属于1类的概率,当y=0的时候,第一项是不是没有了,那就只剩下后面那个x属于0的概率(1减去x属于1的概率)。所以不管y是0还是1,上面得到的数,都是(x, y)出现的概率。那我们的整个样本集,也就是n个独立的样本出现的似然函数为