excel学习库

excel表格_excel函数公式大全_execl从入门到精通

python完成excel文档合并和文档对比

最近遇到一个问题,就是遇到许多考试文档,有很多excel组成,同时有两个版本的文件。第一个需求就是需要做个excel文档合并,第二个就是对比两个版本的文件是否相同。想到之前使用python做的数据分析,于是就基于jupyter notebook来做做题库的数据分析,方便复习。

但是鉴于笔者来使用pandas来完成数据分析,于是换成pandas的read_excel函数来完成。

整个代码如下,查找目录下所有的xlsx文件(查找功能前期做过)并使用pandas.read_excel读取,pandas.concat合并各个DataFrame。如果需要的话,可以使用pandas.to_excel函数写入excel中,注意如果excel中中文的话,需要确定编码格式,笔者使用encoding='utf_8_sig'是可以的。

另外一个功能是对比两个excel文档,判断两个题库是否相同,下面是分析过程,注意使用df1.isin(df2).sum()来判断两个DataFrame的关系。

根据对比情况,df1[~df1.isin(df2)].index选择反集,选择出index,再根据index来选择不在旧题库中的试题。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

«    2024年12月    »
1
2345678
9101112131415
16171819202122
23242526272829
3031
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
    文章归档
      友情链接