doc

Elasticsearch之路由(routing)

匿名 (未验证) 提交于 2019-12-02 23:55:01
路由   主要解决的是文档应该存储在哪个分片中   实际过程是根据公式计算出进行分配   1 # 路由哈希值 % 主分片的数量 2 shard = hash(routing) % number_of_primary_shards 3 # 路由默认值是文档的_id 自定义路由 1 PUT r1/doc/1?routing=user1 2 { 3 "title":"论母猪的产前保养" 4 } 5 PUT r1/doc/2?routing=user1 6 { 7 "title":"论母猪的产后护理" 8 } 这两篇文档都分配在一个分片上了 通过路由查询文档 GET r1/doc/1?routing=user1 # 结果如下 { "_index" : "r1", "_type" : "doc", "_id" : "1", "_version" : 3, "_routing" : "user1", "found" : true, "_source" : { "title" : "论母猪的产前保养" } } 通过路由值查找 1 GET r1/doc/_search 2 { 3 "query": { 4 "terms": { 5 "_routing":["user1"] 6 } 7 } 8 } 9 # 结果如下 10 { 11 "took" : 0, 12 "timed_out" : false

Windows下ElasticSearch的Head安装及基本使用

匿名 (未验证) 提交于 2019-12-02 23:49:02
前段时间,有一朋友咨询我,说es的head插件一直安装失败,为了给朋友解惑,自己百度博文并实践了一番,也的确踩了些坑,但我给爬了起来。今天就来分享下实践心得并跳过的坑。 ElasticSearch 是一个分布式、高扩展、高实时的搜索与数据分析引擎,它能很方便的使大量数据具有搜索、分析和探索的能力,简称es。本文分五部分描述,es的安装,head插件安装,es的基本概念,es的基本使用,问题总结。 Ŀ¼ es安装 head插件安装 es基本概念 es基本使用 问题总结 一、es安装 安装方式网络上有很多,这里简单说下步骤,具体实践是很简单的 ①配置java环境 需要java环境,最好是较新的java环境,java环境的配置就略过了 ②安装elasticsearch 下载地址: https://www.elastic.co/cn/downloads/elasticsearch ,最新版本已是7.2.0。下载后,解压到任意目录,我的路径是:D:\elasticsearch-7.2.0 ③启动elasticsearch es的配置文件在config目录下,常用配置在elasticsearch.yml文件。我这里只是做学习目的,所以不修改此文件而直接启动es。在windows环境下启动es方法为命令行进入到bin\目录下,执行elasticsearch.bat,或者双击此文件以启动es。

脚本_批量修改文件后缀名

匿名 (未验证) 提交于 2019-12-02 23:43:01
#!bin/bash #功能:批量修改文件的后缀名,比如: 将.txt文件修改为.doc文件 #作者:liusingbon #执行脚本时,需要在脚本名后面添加位置参数(文件后缀名) #例: 脚本名 txt doc (可以将以.txt结尾的文件修改为以.doc结尾) #例: 脚本名 doc jpg (可以将以.doc结尾的文件修改为以.jpg结尾) for i in "ls *.$1" do done

ES-2 基本操作

匿名 (未验证) 提交于 2019-12-02 23:42:01
上一节最后讲到,我们可以通过一些丰富的Rest API来对elasticsearch进行操作。 这些RestAPI的格式如下: <HTTP Verb> /<Index>/<Endpoint>/<ID> 本节就进行一些演示,主要有如下一些操作: 查看监控状况 显示所有的索引 创建索引 文档操作 删除索引 一、查看健康状况 我们可以通过restapi来查看整个集群中节点的健康状况: (一) 显示整个集群整体健康状态 curl -X GET “localhost:9200/_cat/health?v” 效果如下: epoch timestamp cluster status node.total node.data shards pri relo init unassign pending_tasks max_task_wait_time active_shards_percent 1558560046 21:20:46 elasticsearch green 1 1 0 0 0 0 0 0 - 100.0% 这里的status显示的是"green",实际上,可能出现如下三个参数: green:一切都很好(集群功能齐全) yellow:所有数据都可用,但尚未分配一些副本(群集功能齐全) red:某些数据由于某种原因不可用(群集部分功能) 注意:当群集为红色时

Github基础操作

匿名 (未验证) 提交于 2019-12-02 23:42:01
Git 文章目录 Git 一、为什么要使用Git? 1.传统文档管理 2.源代码管理的好处 3.Git的诞生 二、Git结构 1.本地代码管理 三、本地仓库操作 1.安装git 2.查看是否安装成功 3.创建项目 4.回退版本 5.撤销修改 7.文件删除 一、为什么要使用Git? 1.传统文档管理 在我们写毕业论文时可能会遇到,多次修改之后的论文命名方式: 论文 _ 改. doc 、论文 _ 改改. doc 、论文 _ 改改改. doc 、论文 _ 改改改改. doc 、论文 _ 改改改改再改. doc 、 论文 _ 改改改改再改 TM 不改了. doc 2.源代码管理的好处 方便多人协同开发 方便版本控制 3.Git的诞生 作者Linux之父: Linux Torvalds git开发目的:为了辅助 Linux 内核的开发 是 Linux Torvals 在 无奈被逼 的情况下创造的 2008年,GitHub 网站上线,为开源项目免费提供 Git 存储,无数开源项目开始迁移至 GitHub Git 迅速成为最流行的分布式版本控制系统(没有之一) 二、Git结构 1.本地代码管理 工作区(Workspace) :添加 、 修改 、 删除`文件 **暂存区(Index):**将工作区中的操作完成小阶段的存储,是版本库的一部分 本地仓库区(Respository):

HAP

匿名 (未验证) 提交于 2019-12-02 23:35:02
加载 // 从物理路径的文件加载 var doc = new HtmlDocument(); doc.Load(filePath);//文件路径 从Stream当中加载 var doc = new HtmlDocument(); doc.LoadHtml(html); // 从网页的Url链接加载 var url = “ http://www.cnblogs.com/xuliangxing/ ”; var web = new HtmlWeb(); var doc = web.Load(url); 获得节点的方法 var value = doc.DocumentNode .SelectNodes("//td/input") .First() .Attributes[“value”].Value; /下面的意思是:通过属性id的值,来定位header下的blogTitle节点信息 4 HtmlNode titleNode = doc.DocumentNode.SelectSingleNode("//div[@id=‘header’]/div[@id=‘blogTitle’]"); 备注:注意路径里"//“表示从根节点开始查找,两个斜杠‘//’表示查找所有childnodes;一个斜杠’/'表示只查找第一层的childnodes(即不查找grandchild);点斜杠”./

Docker常用命令及docker run 和 docker start区别

匿名 (未验证) 提交于 2019-12-02 23:30:02
1. docker images 查看镜像文件 2. docker ps 查看正在运行的容器 3. 查看所有的容器 4. docker container exec -it f0b1c8ab3633 /bin/bash 进入到容器 注意:f0b1c8ab3633 是容器id 根据自己启动容器来 填写自己的容器id 5. exit 退出 6. docker version 查看docker版本 7. 启动容器 docker run -d -p 81:80 nginx 启动nginx容器 注意1: -d表示后台启动 不加-d是在前台启动。 注意2: 81是对外接口 80是对内接口 进入容器里面用80访问 docker start mysql3308 启动mysql 注意:mysql3308 是容器名称 也可以是容器id docker run 与docker start的区别 docker run 只在第一次运行时使用 ,将镜像放到容器中,以后再次启动这个容器时,只需要使用命令docker start 即可。docker run相当于执行了两步操作:将镜像放入容器中(docker create),然后将容器启动,使之变成运行时容器(docker start)。而docker start的作用是,重新启动已存在的镜像 。也就是说,如果使用这个命令,我们必须事先知道这个容器的ID

Find out page numbers of PDF, Docx, Doc, Ppt, Pptx files with PHP [closed]

只愿长相守 提交于 2019-12-02 23:07:54
问题 Closed . This question needs to be more focused. It is not currently accepting answers. Want to improve this question? Update the question so it focuses on one problem only by editing this post. Closed 3 years ago . I want this functionality in my PHP application: When user upload a document (PDF, DOCX, DOC, PPT, PPTC extensions) then after uploading user get the total number of pages of document. But without using exec() function. 回答1: It is possible to do some formats right in PHP. The DOCx

pyquery用法

匿名 (未验证) 提交于 2019-12-02 22:56:40
from pyquery import PyQuery as pq html = """ <div> <ul> <li class="item-01"><a href="link1,html">one</a></li> <li class="item-1"><a href="link1,html">two</a></li> <li class="item-inactive"><a href="link1,html">three</a></li> <li class="item-1"><a href="link1,html">four</a></li> <li class="item-0"><a href="link1,html">five</a> </ul> </div> """ # 直接返回所有匹配的元素(html格式) 还会自动补全 doc = pq(html) # 可以传入网址以及本地文件 # print(doc(‘li‘)) # print(type(doc(‘li‘)) ) # 本地文件 filename # doc = pq(filename=‘test.html‘) # print(doc(‘li‘)) # 网址 url # doc = pq(url=‘http://www.baidu.com‘) # print(doc(‘div‘)) # 父节点 祖先节点 子节点

Python通过win32实现office自动化 - Word

匿名 (未验证) 提交于 2019-12-02 22:51:30
Python通过win32 com接口实现offic自动化小结 最近几天通过Python做一些自动生成office报表的东东,比如解析.xml文件,导出.html/WORD/PPT等格式,html不足一提,只需要简单的html静态网页知识即可,这儿要说的是怎么生成WORD/PPT格式。 首先介绍下office win32 com接口,这个是MS为自动化提供的操作接口,比如我们打开一个WORD文档,就可以在里面编辑VB脚本,实现我们自己的效果。对于这种一本万利的买卖,Python怎么能放过,它内置了对于win32 com接口的支持,我们可以方便的控制。 要想熟练使用office win32 com接口,没有什么比MS提供的API文档更加权威了,此处附上WORD和PPT的文档, 想看EXCEL就去GOOGLE,相信对你不是什么难事:) WORD中最重要的概念有几个: Application - 这个毫无疑问是我们的WORD应用程序 Document - 这个就是一个打开的文档对象 Range - 这个东东必须要好好利用,基本上所有对象都是有Range属性的,而这也为我们排版提供了极大的便利。。。 Paragraph - 顾名思义,这个是段落的意思,也就是我们文档中的一个段内容(可以是文本、图片等)。 Section - 在我学习的时候,这个东东给我制造了最大的障碍,因为我当时苦苦琢磨