索引

流畅的Python——切片

两盒软妹~` 提交于 2020-03-16 08:04:43
2.4 切片 在 Python 里,像列表(list)、元组(tuple)和字符串(str)这类序列类型都支持切片操作,但是实际上切片操作比人们所想象的要强大很多。 在我个人的使用经历来看,在算法实践中切片用的还以比较多的。 首先我们先来简单的温习一下切片的使用。 一、 Python可切片对象的索引方式 包括:正索引和负索引两部分,如下图所示,以a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]为例: 二、 Python切片操作的一般方式 一个完整的切片表达式包含两个“:”,用于分隔三个参数(start_index、end_index、step),当只有一个“:”时,默认第三个参数step=1。 切片操作基本表达式:object[start_index:end_index:step] step:正负数均可,其绝对值大小决定了切取数据时的‘‘步长”,而正负号决定了“切取方向”,正表示“从左往右”取值,负表示“从右往左”取值。当step省略时,默认为1,即从左往右以增量1取值。“切取方向非常重要!”“切取方向非常重要!”“切取方向非常重要!”,重要的事情说三遍! start_index:表示起始索引(包含该索引本身);该参数省略时,表示从对象“端点”开始取值,至于是从“起点”还是从“终点”开始,则由step参数的正负决定,step为正从“起点”开始,为负从“终点”开始

day04 列表

余生颓废 提交于 2020-03-16 06:47:42
01 上节内容回顾 替换 replace 替换 center 居中 默认填充物为空 upper lower 全大 全小 ftrip 默认去除前后空格,制表符,换行符 lstrip rstrip find index 通过元素找索引,可切片 find 找不到 -1 insdex 找不到报错 startswith endswith 以什么开头 以什么结尾 join 列表转换成字符串 列表必须是字符串类型 '连接符'.join(interablw) split 分割 ,默认以空格分割 ,默认全部分割 cout 数出元素的次数 isdigit 判断全部是数字 isalpha 判断全部是字母 isalnum 判断全部是数字或字母 swapcase 大小写翻转 title 每个单词字母所字母大写,非字母隔开 captilize 首字母大写其余字母小写 len 测量长度 format 格式化输出 '{}{}{}'.format('1','2','3') 02 作业讲解 03 列表初识 列表成为容器型数据类型 l1 = ['wusir','alex','laonanhai','ritian','taibai'] print(l1[0]) print(l1[1]) 04 列表索引切片 05 列表的增删减改及其它操作 增 appent 追加 l1.appent('女神') print(l1)

jQuery之选择器

被刻印的时光 ゝ 提交于 2020-03-16 03:45:33
一:基本选择器 1. #id:根据给定的id选择元素, 返回单个元素 ,例如$(“#test”),选取id为test的元素 2. .class:根据给定的类名匹配元素,返回集合元素,$(“.test”),选取所有class为test的元素 3. element:更加给定的元素名匹配元素,返回集合元素,$(“p”),选取所有的p元素 4. *:匹配所有元素,$(“*”),选取所有元素 5. selector1,selector2…selectorN,将每一个选择器匹配到的元素合并后一起返回$(“div,span,p.myclass”)选取所有<div>,<span>和拥有class为myclass的<p>的一组元素 二:层次选择器 返回的都是集合元素 <body> <div class="one" id="one"> id为one,class为one的div </div> <div class="one" id="two" title="test"> id为one,class为two,title为test的div <div class="mini" title="other">class为mini,title为other</div> <div class="mini" title="test">class为mini,title为test</div> </div> <div class

python基础学习day4

筅森魡賤 提交于 2020-03-15 22:19:42
列表的初识 why:int bool str str: 存储少量的数据。 str:切片还是对其进行任何操作,获取的内容全 都是str类型 。存储的数据单一。 what:list list = [66, 'im',True,[1, 2, ‘False’]] 承载任意数据类型,存储大量的数据。 python常用的容器型数据类型。list 列表,其他语言:Java: 数组。 列表是有序的,可索引,切片(步长)。 列表可以储存python中的任何对象:整数、浮点数、字符串、函数、布尔值、列表、元祖、字典等; 列表中的元素是有序且可变的; 索引,切片,步长。** li = [100, '我和你', True, [1, 2, 3]]# 索引 print(li[0], type(li[0])) print(li[1],type(li[1])) print(li[-1]) print(li[:2])# 切片 (顾头不顾尾) >>>100 <class 'int'> 我和你 <class 'str'> [1, 2, 3] [100, '我和你'] 相关练习题: li = [1, 3, 2, "a", 4, "b", 5,"c"] 通过对li列表的切片形成新的列表l1,l1 = [1,3,2] 通过对li列表的切片形成新的列表l2,l2 = ["a",4,"b"] 通过对li列表的切片形成新的列表l4

php+中文分词scws+sphinx+mysql打造千万级数据全文搜索

纵然是瞬间 提交于 2020-03-15 11:36:55
Sphinx是由俄罗斯人Andrew Aksyonoff开发的一个全文检索引擎。意图为其他应用提供高速、低空间占用、高结果 相关度的全文搜索功能。Sphinx可以非常容易的与SQL数据库和脚本语言集成。当前系统内置MySQL和PostgreSQL 数据库数据源的支持,也支持从标准输入读取特定格式 的XML数据。 Sphinx创建索引的速度为:创建100万条记录的索引只需3~4分钟,创建1000万条记录的索引可以在50分钟内完成,而只包含最新10万条记录的增量索引,重建一次只需几十秒。 Sphinx的特性如下: a) 高速的建立索引(在当代CPU上,峰值性能可达到10 MB/秒); b) 高性能的搜索(在2 – 4GB 的文本数据上,平均每次检索响应时间小于0.1秒); c) 可处理海量数据(目前已知可以处理超过100 GB的文本数据, 在单一CPU的系统上可处理100 M 文档); d) 提供了优秀的相关度算法,基于短语相似度和统计(BM25)的复合Ranking方法; e) 支持分布式搜索; f) 支持短语搜索 g) 提供文档摘要生成 h) 可作为MySQL的存储引擎提供搜索服务; i) 支持布尔、短语、词语相似度等多种检索模式; j) 文档支持多个全文检索字段(最大不超过32个); k) 文档支持多个额外的属性信息(例如:分组信息,时间戳等); l) 支持断词;

Lucene学习之四:Lucene的索引文件格式(1)

♀尐吖头ヾ 提交于 2020-03-15 08:35:50
本文转载自: http://www.cnblogs.com/forfuture1978/archive/2009/12/14/1623597.html Lucene的索引里面存了些什么,如何存放的,也即Lucene的索引文件格式,是读懂Lucene源代码的一把钥匙。 当我们真正进入到Lucene源代码之中的时候,我们会发现: Lucene的索引过程,就是按照全文检索的基本过程,将倒排表写成此文件格式的过程。 Lucene的搜索过程,就是按照此文件格式将索引进去的信息读出来,然后计算每篇文档打分(score)的过程。 本文详细解读了Apache Lucene - Index File Formats( http://lucene.apache.org/java/2_9_0/fileformats.html ) 这篇文章。 一、基本概念 下图就是Lucene生成的索引的一个实例: Lucene的索引结构是有层次结构的,主要分以下几个层次: 索引(Index): 在Lucene中一个索引是放在一个文件夹中的。 如上图,同一文件夹中的所有的文件构成一个Lucene索引。 段(Segment): 一个索引可以包含多个段,段与段之间是独立的,添加新文档可以生成新的段,不同的段可以合并。 如上图,具有相同前缀文件的属同一个段,图中共两个段 "_0" 和 "_1"。 segments

lucene索引

[亡魂溺海] 提交于 2020-03-15 08:19:27
一、lucene索引 1、文档层次结构 索引(Index):一个索引放在一个文件夹中; 段(Segment):一个索引中可以有很多段,段与段之间是独立的,添加新的文档可能产生新段,不同的段可以合并成一个新段; 文档(Document):文档是创建索引的基本单位,不同的文档保存在不同的段中,一个段可以包含多个文档; 域(Field):一个文档包含不同类型的信息,可以拆分开索引; 词(Term):词是索引的最小单位,是经过词法分析和语言处理后的数据;   文档是Lucene索引和搜索的原子单位,文档为包含一个或多个域的容器,而域则依次包含“真正的”被搜索内容,域值通过分词技术处理,得到多个词元。如一篇小说信息可以称为一个文档;小说信息又包含多个域,比如标题,作者、简介、最后更新时间等;对标题这一个域采用分词技术,又可以等到一个或多个词元。 2、正向索引与反向索引 正向索引:文档占据了中心的位置,每个文档指向了一个它所包含的索引项的序列。正向信息就是按层次保存了索引一直到词的包含关系: 索引 -> 段-> 文档 -> 域 -> 词 反向索引:一种以索引项为中心来组织文档的方式,每个索引项指向一个文档序列,这个序列中的文档都包含该索引项。反向信息保存了词典的倒排表映射:词 -> 文档   lucene使用到的就是反向索引。如下图所示: 二、索引操作   相关示例如下: 1 package

MySQL数据库优化(二)

别来无恙 提交于 2020-03-15 06:39:08
索引 索引是通过 BTREE 结构进行数据检索的,以平衡二叉树检索的方式缩短数据查询的时间。 索引类型 主键索引(primary),在innodb存储引擎下,由于数据和索引都在ibd文件里存储,所以数据的组织方式是由主键索引的 BTREE 结构,即聚簇索引,如果表没有主键系统会查找一列唯一数据列当主键,如果还没有唯一数据列,系统则虚拟主键索引。在innodb存储引擎下,其他索引都引用主键索引的地址,即非聚簇索引。 mysql> create table t1(id int primary key); #或 mysql> alter table t2 add primary key(id); 普通索引(normal) mysql> create index idx_name on t1(name); 唯一索引(unique) mysql> create table t1(id int unique); 全文索引(full)   由于MySQL默认的全文索引对中文的支持不好,所以通常使用别他工具来实现,比如:sphinx 或 coreseek 查询索引 mysql> show keys from table_name; mysql> show index from table_name; 删除索引 mysql> alter table table_name drop index

三、Pandas入门

本小妞迷上赌 提交于 2020-03-14 13:13:35
参考url: https://jakevdp.github.io/PythonDataScienceHandbook/00.00-preface.html 描述:笔记 目录 1、pandas对象简介   1.1 Pandas的Series对象   1.2 Pandas的DataFrame对象   1.3 Pandas的Index对象 2、数据取值与选择   2.1 Series数据选择方法   2.2 DataFrame数据选择方法 3、Pandas数值运算方法   3.1 通用函数:保留索引   3.2 通用函数:索引对其   3.3 通用函数:DataFrame与Series的运算 4、处理缺失值   4.1 选择处理缺失值的方法   4.2 Pandas的缺失值   4.3 处理缺失值 5、层级索引   5.1 多级索引Series   5.2 多级索引的创建方法   5.3 多级索引的取值与切片   5.4 多级索引行列转换   5.5 多级索引的数据累计方法 6、合并数据集:Concat与Append操作   6.1 知识回顾:Numpy数组的合并   6.2 通过pd.concat实现简易合并 7、合并数据集:合并与连接   7.1 关系代数   7.2 数据连接的类型   7.3 设置数据合并的键   7.4 设置数据连接的集合操作规则   7.5 重复列名

nginx模块1--索引autoindex_基于ip_监控模块status

旧城冷巷雨未停 提交于 2020-03-14 12:42:18
egrep -v '#|^$' /etc/nginx/conf.d/default.off > /etc/nginx/conf.d/default.conf /etc/nginx/conf.d/default.conf 中 目录索引 location /download {     #相对根目录下的download文件夹 root /test;     #根目录 autoindex on;        #开启目录索引 chareset utf-8,gbk;      #字符编码 autoindex_exact_size off;    #是否显示字节,关闭后根据实际大小显示m/g/t等数据 autoindex_localtime on;     #上传时间显示 } 基于ip访问,监控模块 location /status {     #相对根目录下的download文件夹 stub_status;     #开启监控 access_log off;        #关闭监控写入日志 deny 10.0.0.1;        #禁止该ip或网段访问 allow all;            #允许所有地址访问 } 监控可以看出长连接区别 server 连接数 accepts 连接成功数 requests请求数 如果长连接超时或者减少 刷新后连接数增加