excel学习库

excel表格_excel函数公式大全_execl从入门到精通

Python利用openpyxl处理excel文件(openpyxl的安装及简介)

作为一名苦逼的文员,经常同word、excel、ppt打交道,有些工作,比如事务性的,敲几个文字,做几个图表,一般人都应该没有啥问题,很轻松就会搞定。但是在同excel打交道过程中,你会面对一系列公式、纷繁的统计和复杂数据分析,比如这个公式:=IFERROR(TRIM(IF(LEN(VLOOKUP(F7,Sheet3!$C$1:$D$10000,2,FALSE))>0,SUBSTITUTE(VLOOKUP(F8, Sheet2!$B$3:$A$30000, 1, FALSE), " ", ""),"")), ""),我相信大多数人要想理解这个公式,是很需要一段时间的,面对这种繁杂的公式,一般人肯定是力不从心的。但是试想,如果把上述excel公式变成诸如python中的if-else结构,其可读性肯定是不容置疑的……今天,我们来介绍一款excel处理利器—openpyxl(python库文件)。 根据openpyxl官方文档,结合个人近年来使用心得,总结openpyxl应用中以下几个知识点: (一)openpyxl的安装、导入及相关注意事项; (二)对excel文件的打开、读写、编辑、保存相关; (三)对excel文件中样式的编辑; (四)对excel文件中单元格及行列的操作; (五)在excel文件中公式及图表的简单操作; (六)在excel文件中打印机及打印选项设置; (七)使用Pandas和Numpy在excel中进行数据操作。 对于openpyxl我们计划分七个专题进行讨论,每一个专题我们提供一到两个例子或实战项目,便于理解和应用,并结合应用过程对每一知识点的实战价值进行回顾和讲解。 一、学习目标 (一)openpyxl的安装。通过openpyxl的简单安装过程,熟悉python库文件安装的通用过程; (二)openpyxl的导入及简单使用。学习openpyxl的简单使用。 二、系统需求及相关模块安装 Windows7 家庭版 + python(其它系统问度娘)+ Excel2010 需要模块openpyxl及相关依赖包 (一)在线安装 直接使用pip install openpyxl进行安装z (二)离线安装 1.首先在网站(https://www.lfd.uci.edu/~gohlke/pythonlibs/)下载以下几个文件:et_xmlfile-1.0.1-py2.py3-none-any.whl、jdcal-1.4-py2.py3-none-any.whl、openpyxl-2.6.0-py2.py3-none-any.whl; 2.将上述三个文件拷贝到python安装目录中的scripts文件夹下; 3.按照②、③、④的步骤依次安装*.whl文件; 4.安装成功。离线安装成功 这个方法也是安装python库的通用方法。 三、openpyxl简介 openpyxl是一个开源项目,openpyxl模块是一个读写Excel 2010文档的Python库,如果要处理更早格式的Excel文档,需要用到其它库(如:xlrd、xlwt等),这是openpyxl比较其他模块的不足之处。openpyxl是一款比较综合的工具,不仅能够同时读取和修改Excel文档,而且可以对Excel文件内单元格进行详细设置,包括单元格样式等内容,甚至还支持图表插入、打印设置等内容,使用openpyxl可以读写xltm, xltx, xlsm, xlsx等类型的文件,且可以处理数据量较大的Excel文件,跨平台处理大量数据是其它模块没法相比的。因此,openpyxl成为处理Excel复杂问题的首选库函数。 在使用openpyxl前先要掌握三个对象,即:Workbook(工作簿,一个包含多个Sheet的Excel文件)、Worksheet(工作表,一个Workbook有多个Worksheet,表名识别,如“Sheet1”,“Sheet2”等)、Cell(单元格,存储具体的数据对象)三个对象。 具体的使用流程是: 1.导入openpyxl模块 2.调用openpyxl.load_workbook()函数或openpyxl.Workbook(),取得Workbook对象。 3.调用get_active_sheet()或get_sheet_by_name()工作簿方法,取得Wor ksheet对象。 4.使用索引或工作表的cell()方法,带上row和column关键字参数,取得Cell对象,读取或编辑Cell对象的value属性。 下面,通过例子简单掌握下其使用过程 四、openpyxl简单使用 import openpyxl # 创建一个Workbook对象 wb = openpyxl.Workbook() # 创建一个Sheet对象 mySheet = wb.create_sheet(index=0, title="Mysheet") # 再创建一个Sheet对象 anotherSheet = wb.create_sheet(index=2, title="AnotherSheet") # 获取活动的sheet activeSheet = wb.get_active_sheet() # 设置活动表颜色 activeSheet.sheet_properties.tabColor = "205EB2" # 设置anotherSheet的标题 anotherSheet.title = "test" # 选择Cell对象(B4单元格并赋值) directionCell = activeSheet.cell(row=4, column=2) directionCell.value = "找到这个单元格" # 还可以知道单元格的行列最大指 anotherSheet['A1'].value = "activesheet最大行:" + str(activeSheet.max_row) anotherSheet['A2'].value = "activesheet最大列:" + str(activeSheet.max_column) # 最后保存workbook wb.save("test.xlsx") 对其方法和属性进行了初步了解,下一篇我们将详细介绍openpyxl使用。未完待续!

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

«    2024年12月    »
1
2345678
9101112131415
16171819202122
23242526272829
3031
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
    文章归档
      友情链接