经常有朋友问我建议:
想自己动手做一些数据分析,最简单的分析工具是什么?
我的推荐是:Excel 的数据透视表,它应该是职场人士必备的基本技能!
透视表的入门是极容易,你甚至不需要别人教,自己探索一下,花 1 个小时也能上手!
但如果你想进一步提升效率,以下这 10 个透视表技巧/习惯就必须要掌握了,将会帮助你轻松搞定日常应用场景!
基于「表」去生成透视表
如果透视表的数据源是需要增加行/列的,那么我推荐你更改数据源的存储形式,把「普通单元格区域」转换成「表」:
把「普通单元格区域」转换成「表」很多新人第 1 天做了个透视表报表,然后第 2 天给数据源增加了一些新的行数据,结果刷新透视表时却看不到第 2 天的新增数据!
这是因为用「普通单元格区域」做透视表是把数据源写成固定的区域范围了!要更新透视表就必须手工去更改透视表的数据源范围,这就有点麻烦了!
但如果你的透视表数据源是使用「表」结构,那当你增加/删除行列数据时,「表」结构会自动扩展/收缩,只要你刷新透视表,透视表就会自动识别数据源的更改。
使用标准的日期格式
先考考你,你觉得下方的哪一列属于标准日期格式?
几种常见的“日期”如果单从视觉上看…… 标准日期应该是第 ① 列,但最终仍应以列筛选时的显示为最终判定标准。
整列都是标准日期从上图的筛选弹窗中能看到,如果这一列的日期都是标准格式,则筛选时会有日期筛选
功能,下方也会有年
、月
、日
的层次筛选结构。
还有一种情况,就是一列数据里混杂了标准日期、非标准日期:
标准与非标准日期混杂这种情况应该把非标准的日期筛选出来,并转化它们成为标准日期格式,转换方法可以用分列实现,这里不再展开。
为什么要那么执着,一定要把日期规范化?
我们在分析数据时,经常要看年
、季
、月
这些时间维度的统计数据,如果你的日期不标准,那么年
、季
、月
的统计怎么能高效地算出来呢?把日期以规范的标准格式存储,就是很重要的一步!
然后我们就能利用透视表中的分组功能,根据一个日期列,生成年
、季
、月
等日期维度了!
行/列字段的手动排序
如果是按统计数字的大小排序,你肯定都知道怎么操作了。但有时我们就想按统计对象进行自定义排序怎么办?
例如,公司是习惯按北、上、广、深
的顺序看数据,最简单的方法,你可以手工拖动排序就能解决:
选中某一项,光标停留在其边框上,此时出现可移动的图标(四向箭头) 按住鼠标左键,把它拖动到你期望的位置再松手,就实现了拖动排序
如果你要调整列字段顺序,也是一样的操作方法。
不要直接更改数字显示格式
我们经常要改报表中的数字格式,例如把数字的单位改成「万」、或设置数字为货币格式。很多人会这样做:
错误示范正确的操作,应该是如下图所示:
正确示范正确的操作步骤其实也是很简单的:
右键值字段的任意一个数字 选择【数字格式】 设置你要的数字格式
这样做,有什么好处?
改变的是透视表字段的格式,而非单元格的格式 更改行列字段时,不需要重新调整单元格格式,行数变化也自适应 若选整列设置单元格格式,会影响了该列所有的单元格,导致卡顿
条件格式在透视表的作用区域
条件格式可以帮助我们更好地阅读报表数据,透视表配合条件格式 + 自定义格式是常用的优化技能。
在透视表中要设置条件格式,记得要正确设置作用区域。正确的姿势是:
透视表条件格式从上图可以看到,即使我更换了行字段,条件格式仍然存在,行数不一样了也还能自适应!
选中值字段的任意一个单元格,设置好条件格式 然后在该单元格右侧会有一个智能标记提示,点开它 所选单元格 → 就是仅指当前选定的单元格
选项简释:
所有显示为该值字段的单元格
:设置这个值字段有条件格式(行数会自适应)所有显示为“品牌”的值字段
:仅为“品牌”的值字段设置条件格式,切换成其他筛选字段就没了条件格式
双击下钻看明细
当你想看到某一项的明细时,你可以双击对应的项/值,去显示下层的数据或者明细的数据
透视表双击下钻双击有 2 种方式:
双击行列字段的项,可以选择下钻的字段 双击某项的值,会生成新的工作表显示明细
有些人可能看报表时就喜欢到处双击,老是弹出新工作表很烦?
也有解法,在数据透视表选项中是可以取消下钻功能的:
是否启用下钻设置取消 GetPivotData
GetPivotData
其实是可以帮我们动态获取透视表的指定数据,但大部分人都用不上,所以它反而造成了大家的不便!当你想基于透视表再去写公式时,点击透视表中的单元格,发现老是带着GetPivotData
,简直烦人得不行……
其实很简单,点击几下鼠标,就能取消这个功能了:
取消 GetPivotData取消自动调整列宽
每次刷新透视表、切换行列值字段时,列的宽度都动态在变化?
视觉上很晃,更是破坏了我们调整好的布局!
所以你必须要知道怎么取消这个选项:
取消自动调整列宽操作步骤为:
右键透视表任意单元格 → 数据透视表选项 切换至「布局和格式」的选项中,如上图所示 取消勾选“更新时自动调整列宽”
删除数据源,透视表还能拖拽!
当你插入透视表时,Excel 会把数据源都放入到工作簿级别的缓存中,后续的数据透视表操作都是基于透视表缓存去进行的。
所以当基于数据源生成透视表后,再删除数据源工作表,其实透视表还能正常运作。
这有什么用?或者有什么要注意的?
删除数据源后透视表还能运作,可以减少报表文件的大小,利于分发报表,报表打开的速度也会提升 删除数据源后,你还能通过上面介绍的透视表中双击下钻,查看到明细数据(这是方便,但也是风险,如果你不想别人看到数据源,建议把报表粘贴成值去分发) 注意:想再刷新透视表时,将会提示失败,因为连接不到数据源了
多数据源组合呈现在一个透视表
你可以把多张表的数据连接在一起,在一个透视表中使用。
例如零售企业都会有多张表:「订单表」、「产品表」、「门店表」等,传统做法都是用vlookup
整合成一张大表,然后再生成透视表。
数据量少的话问题不大,但如果数据量几十上百万,那你刷新个vlookup
公式都得好几分钟,实在令人难以忍受!
在 Excel 2016 以上,支持由 power pivot 数据模型中输出为透视表,这时你就无需vlookup
了!几百上千万行的数据量,也能高效地运算,也能灵活地创建指标,还支持导入到 power bi 中使用!