GT | 易学教程

Cassandra最佳实践(3)配置篇

阅读更多关于 Cassandra最佳实践(3)配置篇

3 月，跳不动了？>>> 本篇文章我们主要介绍cassandra的相关配置，我把cassandra的相关配置中个人觉得相对比较重要的按照集群、节点这个横向维度进行介绍，可能有的配置我不会列在这里，那么具有见cassandra.yaml里面的详细介绍；如何配置cassandra，需要在集群启动的时候在conf目录下面的cassandra.yaml里面进行配置即可。此外我们的配置需要遵守yaml文件配置规则。本处以3.11.4进行介绍集群维度 cluster_name: //集群的名字，默认是Test Cluster，用''括起来。不同的cluster name的节点无法组成一个集群 num_tokens: 256 //集群中单节点的的分配token数，因为使用vnode，也就是vnode的个数，每个token是随机生成的，此外如果不使用vnode的话，可以使用每个节点预分配一个初始的token，通过下面的配置下； initial_token: //如果集群不想使用vnode的话，需要手工给每个节点进行token配置，手工计算节点的token数，但是扩容的时候建议是成倍扩容。vnode不需要 partitioner: //集群的数据分配算法，也就是常见的一致性hash算法中计算hash的那个模块，其中默认使用org.apache.cassandra.dht

Python类的方法(method):super的用法

阅读更多关于 Python类的方法(method):super的用法

3 月，跳不动了？>>> 一、问题的发现与提出　　在Python类的方法（method）中，要调用父类的某个方法，在Python 2.2以前，通常的写法如代码段1：代码段1： class A: def __init__ (self): print " enter A " print " leave A " class B(A): def __init__ (self): print " enter B " A. __init__ (self) print " leave B " >>> b = B() enter B enter A leave A leave B 即，使用非绑定的类方法（用类名来引用的方法），并在参数列表中，引入待绑定的对象（self），从而达到调用父类的目的。　　这样做的缺点是，当一个子类的父类发生变化时（如类B的父类由A变为C时），必须遍历整个类定义，把所有的通过非绑定的方法的类名全部替换过来，例如代码段2，代码段2： class B(C): # A --> C def __init__ (self): print " enter B " C. __init__ (self) # A --> C print " leave B " 　　如果代码简单，这样的改动或许还可以接受。但如果代码量庞大，这样的修改可能是灾难性的。　　因此，自Python 2

11-散列3 QQ帐户的申请与登陆 (25分)

阅读更多关于 11-散列3 QQ帐户的申请与登陆 (25分)

3 月，跳不动了？>>> 实现QQ新帐户申请和老帐户登陆的简化版功能。最大挑战是：据说现在的QQ号码已经有10位数了。输入格式: 输入首先给出一个正整数 NN （ ≤ 10^5 ），随后给出 NN 行指令。每行指令的格式为：“命令符（空格）QQ号码（空格）密码”。其中命令符为“N”（代表New）时表示要新申请一个QQ号，后面是新帐户的号码和密码；命令符为“L”（代表Login）时表示是老帐户登陆，后面是登陆信息。QQ号码为一个不超过10位、但大于1000（据说QQ老总的号码是1001）的整数。密码为不小于6位、不超过16位、且不包含空格的字符串。输出格式: 针对每条指令，给出相应的信息： 1）若新申请帐户成功，则输出“New: OK”； 2）若新申请的号码已经存在，则输出“ERROR: Exist”； 3）若老帐户登陆成功，则输出“Login: OK”； 4）若老帐户QQ号码不存在，则输出“ERROR: Not Exist”； 5）若老帐户密码错误，则输出“ERROR: Wrong PW”。输入样例: 5 L 1234567890 myQQ@qq.com N 1234567890 myQQ@qq.com N 1234567890 myQQ@qq.com L 1234567890 myQQ@qq L 1234567890 myQQ@qq.com 输出样例: ERROR:

java代码中操作Redis：单机redis、集群redis（spring+redis集成）

阅读更多关于 java代码中操作Redis：单机redis、集群redis（spring+redis集成）

3 月，跳不动了？>>> 一、准备关于redis的一些安装，可以查看我的几篇文章自行安装： Redis目录。一个web项目，我这边一直用的一个github项目是： https://github.com/gubaijin/buildmavenweb 导入java的Redis客户端依赖包Jedis: <dependency> <groupId>redis.clients</groupId> <artifactId>jedis</artifactId> <version>2.9.0</version> </dependency> 二、单机Redis 简单单机用代码测试： Jedis jedis = new Jedis("localhost"); jedis.set("foo", "bar"); String value = jedis.get("foo"); 跟spring集成，大家可以直接点击查看： J2ee项目从0搭建(十一):在项目中集成Redis,用于数据的存储或者缓存三、代码中连接redis集群 //使用jedis在代码中连接redis集群，因为是集群，可以自动发现，也同样只要一个地址就行了 Set<HostAndPort> jedisClusterNodes = new HashSet<HostAndPort>(); //Jedis Cluster will

Solr的安装与配制

阅读更多关于 Solr的安装与配制

3 月，跳不动了？>>> 一、下载solr solr 各种版本下载地址：http://archive.apache.org/dist/lucene/solr/ 我使用的是solr-6.0.0 二、下载tomcat8 tomcat8的各个版本的下载地址：http://archive.apache.org/dist/tomcat/tomcat-8/ 我使用的版本是：apache-tomcat-8.0.51 三、solr的环境搭建将tomcat、solr解压并将webapp重命名为solr 3.1 将【solr-6.0.0\server\solr-webapp】下的webapp文件拷贝到【apache-tomcat-8.0.51\webapps】目录下 3.2 将【solr-6.0.0\server\lib\ext】下的所有jar包拷贝到【apache-tomcat-8.0.51\webapps\solr\WEB-INF\lib】 3.3 将【solr-6.0.0\server\resources】下的log4j.properties配置文件拷贝到【apache-tomcat-8.0.51\webapps\solr\WEB-INF\classes】（如果WEB-INF下没有classes文件那么，就创建一个classes文件夹） 3.4 在【apache-tomcat-8.0.51

redis配置详解

阅读更多关于 redis配置详解

3 月，跳不动了？>>> ##redis配置详解 # Redis configuration file example. # # Note that in order to read the configuration file, Redis must be # started with the file path as first argument: # # ./redis-server /path/to/redis.conf # Note on units: when memory size is needed, it is possible to specify # it in the usual form of 1k 5GB 4M and so forth: # # 1k => 1000 bytes # 1kb => 1024 bytes # 1m => 1000000 bytes # 1mb => 1024*1024 bytes # 1g => 1000000000 bytes # 1gb => 1024*1024*1024 bytes # # units are case insensitive so 1GB 1Gb 1gB are all the same. ################################## INCLUDES ###########

Spark MLlib SVM算法

阅读更多关于 Spark MLlib SVM算法

3 月，跳不动了？>>> 1.1 SVM支持向量机算法支持向量机理论知识参照以下文档：支持向量机 SVM （一） http://www.cnblogs.com/jerrylead/archive/2011/03/13/1982639.html 支持向量机 SVM （二） http://www.cnblogs.com/jerrylead/archive/2011/03/13/1982684.html 支持向量机（三）核函数 http://www.cnblogs.com/jerrylead/archive/2011/03/18/1988406.html 支持向量机（四） http://www.cnblogs.com/jerrylead/archive/2011/03/18/1988415.html 支持向量机（五） SMO 算法 http://www.cnblogs.com/jerrylead/archive/2011/03/18/1988419.html SVM 的目标函数及梯度下降更新公式如下： MLlib 中 SVM的代码结构如下： 1.2 Spark Mllib SVM源码分析 1.2.1 SVMWithSGD SVM 算法的train 方法，由SVMWithSGD类的object定义了train函数，在train函数中新建了SVMWithSGD对象。 package

Spark MLlib Deep Learning Deep Belief Network (深度学习-深度信念网络)2.2

阅读更多关于 Spark MLlib Deep Learning Deep Belief Network (深度学习-深度信念网络)2.2

3 月，跳不动了？>>> Spark MLlib Deep Learning Deep Belief Network ( 深度学习- 深度信念网络)2.2 http://blog.csdn.net/sunbow0 第二章Deep Belief Network ( 深度信念网络) 2 基础及源码解析 2.1 Deep Belief Network深度信念网络基础知识 1 ）综合基础知识参照： http://tieba.baidu.com/p/2895759455 http://wenku.baidu.com/link?url=E8eett6R-mpVL-5AtO1yRNZR4DdEhW7YkQhDKY2CoYCiCQQYqdmWgrHQed2rsJZ8H2rwobpTgyjuXhdakD5QRv0OBWCUB8B2UA2iSNTcGeO 2 ）原著资料参照：《Learning Deep Architectures for AI 》 http://wenku.baidu.com/link?url=suD736_WyPyNRj_CEcdo11mKBNMBoq73-u9IxJkbksOtNXdsfMnxOCN2TUz-zVuW80iyb72dyah_GI6qAaPKg42J2sQWLmHeqv4CrU1aqTq 《A Practical Guide to Training

Spark MLlib FPGrowth算法

阅读更多关于 Spark MLlib FPGrowth算法

3 月，跳不动了？>>> 1.1 FPGrowth算法 1.1.1 基本概念关联规则挖掘的一个典型例子是购物篮分析。关联规则研究有助于发现交易数据库中不同商品（项）之间的联系，找出顾客购买行为模式，如购买了某一商品对购买其他商品的影响，分析结果可以应用于商品货架布局、货存安排以及根据购买模式对用户进行分类。关联规则的相关术语如下：（1 ）项与项集这是一个集合的概念，在一篮子商品中的一件消费品即为一项（Item ），则若干项的集合为项集，如{啤酒，尿布}构成一个二元项集。（2 ）关联规则一般记为的形式，X 为先决条件，Y为相应的关联结果，用于表示数据内隐含的关联性。如：表示购买了尿布的消费者往往也会购买啤酒。关联性强度如何，由三个概念—— 支持度、置信度、提升度来控制和评价。例：有10000 个消费者购买了商品，其中购买尿布1000个，购买啤酒2000个，购买面包500个，同时购买尿布和面包800个，同时购买尿布和面包100个。（3 ）支持度（Support）支持度是指在所有项集中{X, Y} 出现的可能性，即项集中同时含有X和Y的概率：该指标作为建立强关联规则的第一个门槛，衡量了所考察关联规则在“量”上的多少。通过设定最小阈值（minsup ），剔除“出镜率”较低的无意义规则，保留出现较为频繁的项集所隐含的规则。设定最小阈值为5% ，由于{尿布，啤酒

Spark MLlib Logistic Regression逻辑回归算法

阅读更多关于 Spark MLlib Logistic Regression逻辑回归算法

3 月，跳不动了？>>> 1.1 逻辑回归算法 1.1.1 基础理论 logistic 回归本质上是线性回归，只是在特征到结果的映射中加入了一层函数映射，即先把特征线性求和，然后使用函数g(z) 将最为假设函数来预测。g(z)可以将连续值映射到0和1上。它与线性回归的不同点在于：为了将线性回归输出的很大范围的数，例如从负无穷到正无穷，压缩到0 和1之间，这样的输出值表达为“可能性”才能说服广大民众。当然了，把大值压缩到这个范围还有个很好的好处，就是可以消除特别冒尖的变量的影响。 Logistic 函数（或称为Sigmoid 函数），函数形式为： Sigmoid 函数在有个很漂亮的“S” 形，如下图所示：给定n 个特征x=(x1,x2,…,xn)，设条件概率P(y=1|x)为观测样本y相对于事件因素x发生的概率，用sigmoid函数表示为：那么在x 条件下y不发生的概率为：假设现在有 m 个相互独立的观测事件y=(y1,y2,…,ym)，则一个事件yi发生的概率为(yi= 1) 当y=1 的时候，后面那一项是不是没有了，那就只剩下x属于1类的概率，当y=0的时候，第一项是不是没有了，那就只剩下后面那个x属于0的概率（1减去x属于1的概率）。所以不管y是0还是1，上面得到的数，都是(x, y)出现的概率。那我们的整个样本集，也就是n个独立的样本出现的似然函数为

订阅 GT