excel表格_excel函数公式大全_execl从入门到精通
Python利用openpyxl处理excel文件(openpyxl的安装及简介)2024-02-22 17:04:17
作为一名苦逼的文员,经常同word、excel、ppt打交道,有些工作,比如事务性的,敲几个文字,做几个图表,一般人都应该没有啥问题,很轻松就会搞定。但是在同excel打交道过程中,你会面对一系列公式、纷繁的统计和复杂数据分析,比如这个公式:=IFERROR(TRIM(IF(LEN(VLOOKUP(F7,Sheet3!$C$1:$D$10000,2,FALSE))>0,SUBSTITUTE(VLOOKUP(F8, Sheet2!$B$3:$A$30000, 1, FALSE), " ", ""),"")), ""),我相信大多数人要想理解这个公式,是很需要一段时间的,面对这种繁杂的公式,一般人肯定是力不从心的。但是试想,如果把上述excel公式变成诸如python中的if-else结构,其可读性肯定是不容置疑的……今天,我们来介绍一款excel处理利器—openpyxl(python库文件)。
根据openpyxl官方文档,结合个人近年来使用心得,总结openpyxl应用中以下几个知识点:
(一)openpyxl的安装、导入及相关注意事项;
(二)对excel文件的打开、读写、编辑、保存相关;
(三)对excel文件中样式的编辑;
(四)对excel文件中单元格及行列的操作;
(五)在excel文件中公式及图表的简单操作;
(六)在excel文件中打印机及打印选项设置;
(七)使用Pandas和Numpy在excel中进行数据操作。
对于openpyxl我们计划分七个专题进行讨论,每一个专题我们提供一到两个例子或实战项目,便于理解和应用,并结合应用过程对每一知识点的实战价值进行回顾和讲解。
一、学习目标
(一)openpyxl的安装。通过openpyxl的简单安装过程,熟悉python库文件安装的通用过程;
(二)openpyxl的导入及简单使用。学习openpyxl的简单使用。
二、系统需求及相关模块安装
Windows7 家庭版 + python(其它系统问度娘)+ Excel2010
需要模块openpyxl及相关依赖包
(一)在线安装
直接使用pip install openpyxl进行安装
z
(二)离线安装
1.首先在网站(https://www.lfd.uci.edu/~gohlke/pythonlibs/)下载以下几个文件:et_xmlfile-1.0.1-py2.py3-none-any.whl、jdcal-1.4-py2.py3-none-any.whl、openpyxl-2.6.0-py2.py3-none-any.whl;
2.将上述三个文件拷贝到python安装目录中的scripts文件夹下;
3.按照②、③、④的步骤依次安装*.whl文件;
4.安装成功。
离线安装成功 这个方法也是安装python库的通用方法。
三、openpyxl简介
openpyxl是一个开源项目,openpyxl模块是一个读写Excel 2010文档的Python库,如果要处理更早格式的Excel文档,需要用到其它库(如:xlrd、xlwt等),这是openpyxl比较其他模块的不足之处。openpyxl是一款比较综合的工具,不仅能够同时读取和修改Excel文档,而且可以对Excel文件内单元格进行详细设置,包括单元格样式等内容,甚至还支持图表插入、打印设置等内容,使用openpyxl可以读写xltm, xltx, xlsm, xlsx等类型的文件,且可以处理数据量较大的Excel文件,跨平台处理大量数据是其它模块没法相比的。因此,openpyxl成为处理Excel复杂问题的首选库函数。
在使用openpyxl前先要掌握三个对象,即:Workbook(工作簿,一个包含多个Sheet的Excel文件)、Worksheet(工作表,一个Workbook有多个Worksheet,表名识别,如“Sheet1”,“Sheet2”等)、Cell(单元格,存储具体的数据对象)三个对象。
具体的使用流程是:
1.导入openpyxl模块
2.调用openpyxl.load_workbook()函数或openpyxl.Workbook(),取得Workbook对象。
3.调用get_active_sheet()或get_sheet_by_name()工作簿方法,取得Wor ksheet对象。
4.使用索引或工作表的cell()方法,带上row和column关键字参数,取得Cell对象,读取或编辑Cell对象的value属性。
下面,通过例子简单掌握下其使用过程
四、openpyxl简单使用
import openpyxl
# 创建一个Workbook对象
wb = openpyxl.Workbook()
# 创建一个Sheet对象
mySheet = wb.create_sheet(index=0, title="Mysheet")
# 再创建一个Sheet对象
anotherSheet = wb.create_sheet(index=2, title="AnotherSheet")
# 获取活动的sheet
activeSheet = wb.get_active_sheet()
# 设置活动表颜色
activeSheet.sheet_properties.tabColor = "205EB2"
# 设置anotherSheet的标题
anotherSheet.title = "test"
# 选择Cell对象(B4单元格并赋值)
directionCell = activeSheet.cell(row=4, column=2)
directionCell.value = "找到这个单元格"
# 还可以知道单元格的行列最大指
anotherSheet['A1'].value = "activesheet最大行:" + str(activeSheet.max_row)
anotherSheet['A2'].value = "activesheet最大列:" + str(activeSheet.max_column)
# 最后保存workbook
wb.save("test.xlsx")
对其方法和属性进行了初步了解,下一篇我们将详细介绍openpyxl使用。
未完待续!
标签: r怎么读取excel文件