搜索引擎

ElasticSearch入门 —— 集群搭建

爷,独闯天下 提交于 2019-12-10 10:09:01
一、环境介绍与安装准备 1、环境说明 2台虚拟机,OS为ubuntu13.04,ip分别为xxx.xxx.xxx.140和xxx.xxx.xxx.145。 2、安装准备 ElasticSearch(简称ES)由java语言实现,运行环境依赖java。ES 1.x版本,官方推荐至少使用jdk1.6的环境,建议使用oracle java,可以去 官网下载 ,本文使用j dk-7u51-linux-i586.gz 。ES可以去 官网下载 ,也可以在 这里下载 ,本文使用elasticsearch-1.0.1.tar.gz。 二、安装 1、安装JAVA 关于java的安装,请参照 这里 。 2、ES安装 (1)解压 elasticsearch-1.0.1.tar.gz,sudo tar -zvxf elasticsearch-1.0.1.tar.gz,在当前路径生成目录:elasticsearch-1.0.1;为该目录做一个软连接ln -s elasticsearch-1.0.1 elasticsearch。完成之后,目录结构如下图: (2)配置es。这里只做最简单的配置,修改ES_HOME/config/elasticsearch.yml文件,将node.name的值设置为“test-node1”,表示当前这个es服务节点名字为test-node1。 (3)启动ES。进入ES安装目录

搜索引擎关键技术:中文分词技术介绍

≯℡__Kan透↙ 提交于 2019-12-10 07:03:28
信息的飞速增长,使搜索引擎成为人们查找信息的首选工具,Google、百度等大型搜索引擎一直是人们讨论的话题。随着搜索市场价值的不断增加,越来越多的公司开发出自己的搜索引擎,阿里巴巴的商机搜索、8848的购物搜索等也陆续面世,自然,搜索引擎技术也成为技术人员关注的热点。 虽然在国外搜索引擎技术早就开始研究,但在国内还是陆续涌现出优秀的搜索引擎,像百度等。目前在中文搜索引擎领域,国内的搜索引擎已经和国外的搜索引擎效果上相差不远。之所以能形成这样的局面,有一个重要的原因就在于中文和英文两种语言自身的书写方式不同,这其中对于计算机涉及的技术就是中文分词。 什么是中文分词 众所周知,英文是以词为单位的,词和词之间是靠空格隔开,而中文是以字为单位,句子中所有的字连起来才能描述一个意思。例如,英文句子I am a student,用中文则为:“我是一个学生”。计算机可以很简单通过空格知道student是一个单词,但是不能很容易明白“学”、“生”两个字合起来才表示一个词。把中文的汉字序列切分成有意义的词,就是中文分词,有些人也称为切词。我是一个学生,分词的结果是:我 是 一个 学生。 中文分词和搜索引擎 中文分词到底对搜索引擎有多大影响?对于搜索引擎来说,最重要的并不是找到所有结果,因为在上百亿的网页中找到所有结果没有太多的意义,没有人能看得完,最重要的是把最相关的结果排在最前面

前端工程师与搜索引擎 网站SEO优化

拥有回忆 提交于 2019-12-09 21:45:41
标签语义话的好处: 1.提高搜索引擎 SEO(搜索引擎优化) 2.让代码开发者更加高效的工作,简化代码标签的使用 搜索引擎的工作原理 :网络蜘蛛爬虫,不断升温去收集关键字 前端工程师如何优化? 一关键词策划 1为了搜索引擎更好的识别网站的核心内容,关键词布局要合理 2.关键词布局合理的几点建议: 1网站的logo通过alt以及title标签来设置关键字 2导航是作为仅次于网站logo权重分配的地方,在导航上布局用户搜索的关键词 3.h1,h2,h3标签上做关键字 4在文章的段首,段中,段尾各穿插一个关键词,适当穿插,不影响阅读 3关键词密度保持在2%-8%之间。 4关键词密度过低:针对网站内容较少的情况,在图片穿插alt属性,增加title标签,适当做一些内链,不要刻意堆砌,集中在一个地方 5关键词密度过高:会对搜索引擎判断成优化过度。查看网页源代码,对关键词密集的地方进行处理,进行适当的删减 二网页布局策划与设计 1主导航覆盖面要广,尽量使用静态导航(网站导航主要功能在于引导用户方便网站内容网站导航栏覆盖面不广容易造成流量缺失) 2左侧尽量分出二级导航(二级导航可以直观的满足用户的需求,完成良好的用户体验) 3图文形式要做到产品在上,文字在下 4js特效要放在body之后(js放在后面可以提升网站的打开速度) 5首页栏目要多,尽量提升丰富度 6采用标准化的div网页布局

img和background加载图片区别

不羁的心 提交于 2019-12-08 14:44:37
目前前端页面显示图片的方式用两类,一类是使用 img 标签引入图片,一类是使用 background 属性来设置图片背景,那么这两类方法之间有区别吗?到底什么地方应该使用 background ,什么地方应该使用 img 呢?今天就从几个方面给大家分享一下如何认识这个两个标签,并且如何使用 <body> <img src="./a.png" alt="" style="display:none;"> //img标签 元素display:none 请求图片 <img src="./b.png" alt="" style="display: hidden;"> //img标签 元素display:hidden 请求图片 <div style="background:url('./c.png');display:none"></div>   //background 元素display:none 请求图片 <div style="background:url('./d.png');display:hidden"></div> //background 元素display:hidden 请求图片 <div class="father" style="display: none;"> //img标签父级元素 display:none 请求图片 <img src="./a1.png" alt=

在html页面上设置不缓存

自作多情 提交于 2019-12-07 19:46:12
<meta http-equiv="pragma" content="no-cache"> <meta http-equiv="cache-control" content="no-cache"> <meta http-equiv="expires" content="0"> 附:html页面中meta的作用   meta是用来在HTML文档中模拟HTTP协议的响应头报文。meta 标签用于网页的<head>与</head>中,meta 标签的用处很多。meta 的属性有两种:name和http-equiv。name属性主要用于描述网页,对应于content(网页内容),以便于搜索引擎机器人查找、分类(目前几乎所有的搜索引擎都使用网上机器人自动查找meta值来给网页分类)。这其中最重要的是description(站点在搜索引擎上的描述)和keywords(分类关键词),所以应该给每页加一个meta值。比较常用的有以下几个:    name 属性   1、<meta name="Generator" contect="">用以说明生成工具(如Microsoft FrontPage 4.0)等;   2、<meta name="KEYWords" contect="">向搜索引擎说明你的网页的关键词;   3、<meta name="DEscription" contect=""

前端性能优化相关问题

不羁岁月 提交于 2019-12-06 19:28:23
前端优化搜索引擎(seo): 合理的title,description,keywords 搜索引擎对这三项的权重逐个减小:title值强调重点即可,关键词设定要突出,重要的关键词不要出现超过两次,而且要靠前,不同页面的title有所不同;description围绕网站主题内容和目标关键字,对网站做概要介绍,要能突出特点,体现优势,不过分堆砌关键字,不同页面的description有所不同;keyword应将title中的关键词,包括长尾中的段关键词罗列。 语义化标签让搜索引擎容易理解网页:恰当使用语义化的html标签、class类名等内容,让页面具有良好的结构和含义,便于浏览器、搜索引擎解析。网站的导航尽量使用纯文字进行导航。 重要内容的html代码放在最前面:seo抓取html顺序是由上至下。 重要内容不用js输出:爬虫不会执行js获取内容。 少用iframe:搜索引擎不会抓取iframe中的内容。 非装饰性图片必须加alt。 提高网站速度:网站速度是搜索引擎排序的一个重要指标。 如何进行网站性能优化: 减少http请求:合并css、合并js、利用css sprtes图片精灵合并图片、用LazyLoad Images使得页面刚加载时减少http请求数。 将css放在页面最上部,使用<link>引入,不使用@import编写样式。 将js放在页面最下面,如果页面解析时就需要用到js

最近发现chrome默认搜索引擎是百度,而在地址栏搜索时会自动跳转到百度首页然后才可以搜索

廉价感情. 提交于 2019-12-06 11:47:05
这个问题我试着网上找了一下,发现是默认的问题,需要自己新建一个搜索引擎,照着原来的填也可以,第一二行无所谓,第三行得输入 http://www.baidu.com/s?tn=mswin_oem_dg&ie=utf-16&word=%s 然后将新建的设为默认就可以了 来源: https://www.cnblogs.com/san-sui/p/11981261.html

网站被克隆有什么影响如何解决呢

会有一股神秘感。 提交于 2019-12-06 05:36:24
随着互联网的发展,各行各业都开始了网站的建设与布局工作。在一些行业里,网站相关关键词的排名可谓竞争激烈,很同行之间在搜索引擎上花费的功夫和精力可以说是很多的。但是有的站长和 SEOer 们会发现一个怪现象,就是自己的站点被“克隆”了。说到“克隆站”可能有的人会比较陌生,其实说白了就是一个网站的设计结构与内容等等完全或者大部分被复制成了另外一个网站。因为网站作为一种数字资源,其处在的网络环境是开放共享的,因此也非常容易被一些别有用心的人拿来滥用。于是很多站长和 SEOer 对这些盗用自己网站资源的克隆站点极其厌恶,但却因为这些站点的管理者难以追查到踪迹而显得很无奈。那么,面对“克隆站点”对我们网站的影响该如何应对呢?下面就随天津推乐网络的小编来一起看看吧,希望对您能够有所帮助。 第一,针对克隆站点的出现,我们应该积极收集相关证据,在必要时刻使用法律武器来维护自己的利益。克隆网站的行为与盗版别人的文学或设计作品一样可耻,也一样不应该是被推荐的做法。首先各位网站站长与 SEOer 应该确立好自己原创的一些底稿和资料,接着想办法查看究竟是同行还是有其他人士恶意使坏。同时我们应该了解其使用的克隆技术是什么,例如是使用反代技术还是采用仿站后对内容进行采集。然后应该积极询问律师的意见与处理方式,对一些严重剽窃的站点进行起诉,并让他们赔偿相关损失与关闭克隆网站。 第二

web语义化之SEO和ARIA

人盡茶涼 提交于 2019-12-06 04:14:58
在 快速理解web语义化 的时候,只知道web语义化有利于 SEO 和便于屏幕阅读器阅读,但并不知道它是如何有利于 SEO 和便于阅读器阅读的,带着这个疑问,进行了一番探索总结。 SEO 什么是SEO? SEO (Search Engine Optimization,搜索引擎优化 ),是一种利用搜索引擎的搜索规则来提高目的网站在有关搜索引擎内的排名的方式。通俗来讲就是根据搜素引擎的规则来优化你的网站,让你的网站能够在用户的搜索结果中排在前面,提高网站的访问量。 SEO常用方式 采用DIV+CSS布局 采用div-css布局的网站对于搜索引擎很是友好,因此其避免了Table嵌套层次过多而无法被搜索引擎抓取的问题,而且简洁、结构化的代码更加有利于突出重点和适合搜索引擎抓取。 尽量不使用表格布局,因为搜索引擎对表格布局嵌套3层以上的内容懒的去抓取。 TDK优化 TDK,即 title , description , keywords 。 一、title 在 SEO 中,标题的优化占着举足轻重的地位,无论是从用户体验的角度出发,还是从搜索引擎的排名效果出发, title 都是页面优化最最重要的因素。 title 的分隔符一般有 , , _ , - 和空格。其中 _ 对百度比较友好,而 - 对谷歌比较友好,空格在英文站点可以使用但中文少用。 推荐做法: 每个网页应该有一个独一无二的标题

专为开发者开发的导航网站

时光怂恿深爱的人放手 提交于 2019-12-05 19:32:28
>当你打开浏览器第一个页面是什么?大部分人都是一个导航页,可是现在导航页到处都是广告,什么一刀999,元宝回收之类的,还有各种标题党的文章,有时候一个很吸引人的题目点进去后只想问候小编傻X,除了这些问题那些网址导航对我们开发者来说也没什么卵用,诸如此类问题把我惹怒了,作为一个经常加班都活力四射的程序猿,为何不自己开发一个好用的导航呢?于是就有了ITStart导航站( http://www.ITStart.fun ) 首页清爽干净 作为一个导航页,我摒弃了那些上来就一堆文字一堆导航的页面,保持首页的清爽干净,使人看到的第一眼就感觉很干净而不是杂乱无章的。 左上角是天气情况;右上角是登录和设置,“设置”可以设置自己的职业,系统会根据你设置的职业为你推荐合适的导航,有些人身兼多职所以这里的职业也可以多选;右边中部有个导航按钮,点击导航按钮可以显示出导航;右下角有个看板娘,你可以趁着代码编译的间隙逗逗她,可别被老板发现哦;右下角还有素质三连(点赞,收藏,转发),各位有素质的人不会不素质三连吧,千万不要说下次一定哦。 背景图片 打开网站背景图片是不是很漂亮,这个使用的bing的背景图,每天都不一样,让你在办公室坐着就能体会世界各地的美丽风景,最少可以愉悦心情~~ 添加自定义搜索引擎 一般的导航搜索引擎就那几个,自己有更好用的搜索引擎,可惜加不上去,只能打开新的页面,是不是太麻烦?这个大麻烦