元组

pandas将日期转换成timestamp

匿名 (未验证) 提交于 2019-12-03 00:27:02
OUTLINE 常见的时间字符串与timestamp之间的转换 日期与timestamp之间的转换 这里说的字符串不是一般意义上的字符串,是指在读取日期类型的数据时,如果还没有及时解析字符串,它就还不是日期类型,那么此时的字符串该怎么与时间戳之间进行转换呢? ① 时间字符串转化成时间戳 将时间字符串转化成时间戳分为两步: 第一步:将时间字符串转换成时间元组 第二步:将时间元组转换成时间戳类型 import time data ['timestamp'] = data [' OCC_TIM' ].apply ( lambda x : time . mktime ( time . strptime ( x ,'% Y -% m -% d % H :% M :% S ') )) 其中,strptime函数是将字符串按照后面的格式转换成时间元组类型;mktime函数则是将时间元组转换成时间戳。记住这两个常用函数。 ② 将时间戳转换成可读字符串 第一步:用localtime将时间戳转换成local_time,时间元组 第二步:用strftime将local_time转换成可读字符串 timestamp = 1.521708e+09 time_local = time.localtime(timestamp) time_local # 输出: # time.struct_time(tm

缺失值处理(Imputation)

匿名 (未验证) 提交于 2019-12-03 00:25:02
一、缺失值的处理方法 1. 忽略元组 当缺少类别标签时通常这样做(假定挖掘任务涉及分类时),除非元组有多个属性缺失值,否则该方法不是很有效。当每个属性缺少值的百分比变化很大时,它的性能特别差。 2.人工填写缺失值 一般该方法很费时,并且当数据集很大,缺少很多值时,该方法可能行不通。 3.使用一个全局常量填充缺失值 将缺失的属性值用同一个常数(如“Unknown”或 负无穷)替换。如果缺失值都用“unknown”替换,则挖掘程序可能会认为它们形成一个有趣的概念,因为它们都具有相同的值“unknown”。因此,虽然该方法很简单,但是它十分不可靠。 4.使用与给定元组属同一类的所有样本的属性均值 例如:将顾客按照credit_risk分类,则使用具有相同信用度的给定元组的顾客的平均收入替换income中的缺失值。 5.使用最可能的值填充缺失值 可以用回归、使用贝叶斯形式化的基于推理的工具或决策树归纳确定。例如,利用数据集中其他顾客的属性,可以构造一颗决策树来预测income的缺失值。 注意:缺失值并不总是意味着数据的错误!!!!!!! 二、缺失值处理的代码实现 class: ` Imputer`类提供了缺失数值处理的基本策略,比如使用缺失数值所在行或列的均值、中位数、众数来替代缺失值。该类也兼容不同的缺失值编码。 1、使用均值填充缺失值 import numpy as np from

【数据库】数据库错题集(一)

匿名 (未验证) 提交于 2019-12-03 00:22:01
GRANT QTY ON SPJ TO '李勇' GRANT UPDATE(QTY) ON SPJ TO '李勇' GRANT UPDATE (QTY) ON SPJ TO 李勇 GRANT UPDATE ON SPJ (QTY) TO 李勇 grant update (列名) on 表名 to 用户 部门(部门号,部门名,部门成员,部门总经理) 部门总经理 部门成员 部门名 部门号 部门成员为多个人,不符合第一范式 数据库的并发操作有可能带来的三个问题中包括( )? 数据独立性降低 无法读出数据 权限控制 丢失更新 数据库事务并发带来的问题有: 更新丢失、脏读、不可重复读、幻象读 (幻象读有时跟不可重复度归为一类) ________________ 属于信息世界的模型,是现实世界到机器世界的一个中间层次。 数据模型 概念模型 E-Rͼ 关系模型 概念模型对应的是模式,模式对外是与外模式的映射,对内是与内模式的映射。 SQL基本表的创建中是通过哪个子句实现实体完整性规则的。 外键子句 主键子句 检查子句 NOT NULL 关系模式中,满足2NF的模式,( )。 可能是1NF 必定是1NF 必定是3NF 必定是BCNF 1NF的定义为:符合1NF的关系中的每个属性都不可再分。1NF是所有关系型数据库的最基本要求。 2NF在1NF的基础之上,消除了非主属性对于码的部分函数依赖。

Numpy学习笔记

匿名 (未验证) 提交于 2019-12-03 00:22:01
Numpy是高性能科学计算和数据分析的基础包 02 ndarray瀵硅薄 ndarray是一种多维数组对象,其中的所有元素必须是相同类型的 ndarray对象有以下几个常用的属性: shape 一个表示各维度大小的元组 dtype 说明数组数据类型的对象 ndim 数组轴的个数 size 数组的元素个数 常见的创建方法有如下几种: array() 接受一切序列行的对象生成ndarray数组 zeros() 传入一个表示形状的元组,生成全0数组 ones() 传入一个表示形状的元组,生成全1数组 empty() 传入一个表示形状的元组,生成一个没有具体指的元组 tips: zeros_like(),ones_like(),empty_like()以另一个数组为参数,创建对应数组 arange() 类似内置的arange(),生成ndarray eye() identity() 创建一个正方的N*N单位矩阵 与列表最重要的区别在于,数组切片是原始数组的视图,视图上的任何修改都会直接反映到源数组上 若想得到数组副本而非切片,应显示使用复制操作。例如:arr1.copy() 转置操作返回的是源数组的视图 数组转置有transpose方法,swapaxes方法,T属性 最常用,最简介的还是使用T属性,例如:arr.T 通用函数是对ndarray数组的数据执行元素级运算的函数

连接

匿名 (未验证) 提交于 2019-12-03 00:19:01
给定一组域D1,D2,...,Dn,允许D1,D2,...,Dn的笛卡尔积为 D1×D2×...×Dn = {(d1,d2,...,dn)}称为n元组,或简称元 元组 。 连接又称为θ连接。它是从两个关系的笛卡尔积中选取属性间满足一定条件的元祖。 假设A和B分别为R和S上列数相等且 连接运算 是从R和S的笛卡尔积R×S中选取 R关系在A属性组上的值 与 S关系在B属性上的值 满足比较关系θ的元祖。 θ为“=”的连接运算称为 等值连接。 自然连接 是一种特殊的等值连接。它要求 两个关系中进行比较的分量必须是同名的属性组 。 两个关系R和S在做自然连接时,选择两个关系在公共属性上值相等的元祖构成新的关系。所以会产生悬浮元组。左连接时舍弃右边的悬浮元组。右连接时舍弃左边的悬浮元组。 转载请标明出处: 连接 文章来源: 连接

序列类型及操作

匿名 (未验证) 提交于 2019-12-03 00:18:01
1、序列类型定义 序列是具有先后关系的一组元素 - 序列是一维元素向量,元素类型可以不同 类似数学元素序列: s 0 , s 1 , … , s n-1 元素间由序号引导, 通过下标访问序列的特定元素 序列是一个基类类型 2、序列处理函数及方法 序列类型通用操作符 操作符及应用 描述 x in s 如果x是序列s的元素,返回True,否则返回False x not in s 如果x是序列s的元素,返回False,否则返回True s + t 连接两个序列s和t s*n 或 n*s 将序列s复制n次 s[i] 索引,返回s中的第i个元素, i是序列的序号 s[i: j] 或 s[i: j: k] 切片,返回序列s中第i到j以k为步长的元素子序列 列类型通用函数和方法 函数和方法 描述 len(s) 返回序列s的长度 min(s) 返回序列s的最小元素, s中元素需要可比较 max(s) 返回序列s的最大元素, s中元素需要可比较 s.index(x) 或 s.index(x, i, j) 返回序列s从i开始到j位置中第一次出现元素x的位置 s.count(x) 返回序列s中出现x的总次 数 3、元组类型及操作 元组是序列类型的一种扩展 - 元组是一种序列类型,一旦创建就不能被修改 使用小括号 () 或 tuple() 创建,元素间用逗号 , 分隔 可以使用或不使用小括号 def

序列之元组

匿名 (未验证) 提交于 2019-12-03 00:11:01
元组的创建 1. 通过()创建元组。小括号可以省略。 2.通过 tuple()创建元组 tuple(可迭代的对象) 例如: b = tuple() #创建一个空元组对象 b = tuple("abc") 来源:博客园 作者: 蚂蚁KO大象 链接:https://www.cnblogs.com/elephant-study/p/11572398.html

元组字典集合内置方法与拷贝

匿名 (未验证) 提交于 2019-12-03 00:08:02
''' 元组字典集合内置方法与拷贝 ''' # 什么是元组tuple(了解):只可取 不可更改 的列表,元组一创建就被写死了 lt = [1, 2, 3] lt[0] = 2 # 1. 作用:元组一创建就被写死了 # 2. 定义方式:()内用逗号隔开多个元素(可以为任意数据类型) lt = list([1,2,3]) tup = tuple((1, 2, 3)) print(tup, type(tup)) # 如果元组只有一个元素,必须得加逗号 tup1 = (1,) print(tup1, type(tup1)) # 3. 使用方法 # 1. 索引取值 print(tup[0]) # 2. 索引切片 print(tup[0:3]) # 3. for循环 for i in tup: print(i) # 4. 成员运算 print(0 in tup) # 5. len长度 print(len(tup)) # 6. index获取元素索引 print(tup.index(1)) # 7. count 计数 print(tup.count(2)) # 4. 有序or无序 # 有序 # 5. 可变or不可变: 压根不存这一说 # 字符串/列表/字典 --》 常用,他们三个就足够描述时间万物了 # 其他的数据类型可以被替代 --》 列表替代元组,redis数据库替代集合 # 1. 作用:

python基础 三元运算 bytes 列表 元组

瘦欲@ 提交于 2019-12-03 00:04:18
三元运算 1 #三元运算,if条件成立则将a赋值给c否则将b赋值给c 2 a,b = 5,6 3 c = a if a > b else b 4 print(c) #6 bytes数据类型 1 #将字符串转换为二进制,encode里面填写str的编码类型 2 str_bytes = "str".encode("utf-8") 3 print(str_bytes) #b'str' 4 #将二进制转换为字符串,decode里面为需要转换为何种编码类型的字符串 5 str_string = str_bytes.decode("utf-8") 6 print(str_string) #str 列表 1 #列表定义赋值,列表名 = [列表数据1, 列表数据2, ……] 2 l1 = ["list_1", 2, "list_3", 4] 3 #获取列表元素,列表名[元素下标],下标从0开始 4 print(l1[0]) #list_1 5 #列表切片,取第m - n下标的元素使用列表名[m:n+1],列表最后一个元素下标从后往前数为-1,-2依次类推 6 print(l1[1:4]) #取1 2 3这三个下标的元素 7 print(l1[:3]) #取0 1 2这三个值 8 print(l1[-2:]) #取最后两个元素 9 print(l1[::2]) #指定步长对列表进行切片 10