[python] xlrd操作Excel以及处理日期

若如初见. 提交于 2020-01-18 07:32:28

1、导入模块

import xlrd

2、打开文件

data = xlrd.open_workbook("data.xlsx")

3、获取sheet:

x1.sheet_names():获取所有sheet名字
x1.nsheets:获取sheet数量
x1.sheets():获取所有sheet对象
一般使用下列两种方法:
x1.sheet_by_name("test”):通过sheet名查找
x1.sheet_by_index(1):通过索引查找

4、获取sheet的汇总数据:

sheet.name:获取sheet名
sheet.nrows:获取总行数
sheet.ncols:获取总列数

5、单元格批量读取:

a、行操作:

sheet.row_values(0)  # 获取第一行所有内容,合并单元格,首行显示值,其它为空。
sheet.row(0)           # 获取单元格值类型和内容
sheet.row_types(0)   # 获取单元格数据类型

b、表操作

sheet.row_values(0, 6, 10)   # 取第1行,第6~10列(不含第10表)
sheet.col_values(0, 0, 5)    # 取第1列,第0~5行(不含第5行)
sheet.row_slice(2, 0, 2)     # 获取单元格值类型和内容
sheet.row_types(1, 0, 2)   # 获取单元格数据类型

6、特定单元格读取:

a、 获取单元格值:

sheet.cell_value(1, 2)
sheet.cell(1, 2).value
sheet.row(1)[2].value 

b、 获取单元格类型:

sheet.cell(1, 2).ctype
sheet.cell_type(1, 2)
sheet.row(1)[2].ctype

7、(0,0)转换A1:

xlrd.cellname(0, 0)   # (0,0)转换成A1
xlrd.cellnameabs(0, 0) # (0,0)转换成$A$1
xlrd.colname(30)  # 把列由数字转换为字母表示
例:
import xlrd
import os

filename = "demo.xlsx"
filePath = os.path.join(os.getcwd(), filename)
# 打开文件
x1 = xlrd.open_workbook(filePath)
sheet1 = x1.sheet_by_name("plan")
# (0,0)转换成A1
print (xlrd.cellname(0, 0)   # (0,0)转换成A1
print xlrd.cellnameabs(0, 0) # (0,0)转换成$A$1
print xlrd.colname(30)  # 把列由数字转换为字母表示

8、数据类型:

得到ctype的两种方法:
worksheet.cell_type(row_index, col_index)
worksheet.cell(i, j).ctype

空:0
字符串:1
数字:2
日期:3
布尔:4
error:5

问题

处理时间日期问题,xlrd遇到时间格式会转换为float类型,数字比较短,很明显不是时间戳,需要用xlrd的xldate_as_tuple将数据转换为一个6个元素的tuple,这样我们可以通过datetime构造日期类型,需要注意的是,这里仅限于日期,如果单单是时间格式,在year,month,day上的元素分别为0,这样会导致datetime out of range异常报错,在处理时间时,我的解决方法一般是判断这个是日期格式还是只有时间,如果是时间,将这个tuple例如(0,0,0,9,0,0)str 后,可以通过生成式[-3:]取切片,通过 : join之后,成为:“9:0:0”,通过字符串time.strptime转换为struct_time类型,再通过strftime转换为标准时间格式。

在遇到整数类型的表数据,也需要ctype判断下是否为2,然后int一下。

worksheet = ...
ctype = worksheet.cell_type(row_index, col_index)
if ctype == 2 and cell % 1 == 0:  # 如果是整形
	cell = int(cell)
elif ctype == 3:	#datetime类型
	cell = worksheet.cell_value(row_index, col_index)
	date = datetime(*xldate_as_tuple(cell, 0))	#0从1900,1从1904位基准,通常为0
    cell = date.strftime('%Y/%d/%m %H:%M:%S')


易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!