Excel是一个非常高效的工具,但是有一些的操作,比如导入和清理数据,仍是一项繁琐和耗时的工作,例如下图所示的数据集中,出现了一些数据的空白或断层。

当然,以上的数据集相对来说不是很多,所以我们可以通过一些小技巧或Excel中的某些内置功能快速对空白的数据进行处理。不过,当我们面对大量的数据集,并且可能会经常遇到数据清理的任务,这些操作便会耗费很多时间。
因此,我们在这里要介绍的是Power Query的应用,在Excel中,该功能在“数据”选项卡的“获取和转换数据”功能区。
Power Query究竟是什么?首先我们需要知道Power Query只在Windows系统中可使用,而无法在Mac系统中使用。在Excel 2010中,Power Query首次作为加载项引入到Excel中,自Excel 2016开始,该功能集成到“数据”选项卡下。
Power Query允许我们从各种来源提取数据,如数据库、Oracle、SQLServer,甚至SAP等。通过Power Query,我们还可以从在线网页上获取数据。

在将数据拉取至内存后,Power Query允许我们执行清理和转换数据的操作,使得数据完全转换为我们所需的格式。而最为精彩的部分是,在转换数据的过程中,它将每个操作记录为一个步骤,有点像录制宏,这意味着当底层数据更改或被替换时,只需点击刷新按钮,所有这些转换的操作便会再次执行。是不是一个非常强大的自动化工具?
为了更好地帮助我们了解Power Query功能,我们会以下面的“Training Courses”数据为例进行相关的演示。
第一个例子,我们会创建一个Query将A列的“Course Code and Description”分开。

点击数据中某个单元格,在“获取和转换数据”功能区中,选择并点击“来自表格/区域”按钮,因当前我们要执行操作的数据是在工作表中。

点击“确定”后,我们会来到Power Query编辑器的界面。

在Power Query编辑器中,数据会按照表格的方式进行排列,并且和Excel一样,其上方有很多功能选项帮助我们处理当前的数据。
点击“Course Code and Description”,在“主页”选项卡下,点击“拆分列”,在此功能下,有不同的选择,此例中我们选择的是“按分隔符”。

进入“按分隔符拆分列”的对话框中,我们在“选择或输入分隔符”的下拉框中可选择不同的分隔符,如当前所选的是“空格”,其他选择还有“冒号、逗号、分号、自定义”等等。此例中“拆分位置”,我们勾选的是“最左侧的分隔符”。

点击“确定”后,我们看到首列的数据被拆分成两列,分别放置Course Code和Description两部分。

我们分别将拆分后的两列数据按照其内容更改标签名称。

在右侧的“查询设置”面板中,我们可以看到此Query的步骤,并且可以修改查询的名称。

处理好数据后,我们点击“关闭并上载至”。

此时会跳转到“导入数据”对话框,默认情况下更新后的数据会上载到新工作表的新数据表格中。当然,我们也可以根据需要自行调整。

如果选择“仅创建链接”这一选项,处理后的数据不会上载到Excel中,但意味着我们可以使用此查询数据。
在此我们选择默认的选择,点击“确定”后,查询数据会自动放在一个新的工作表中“Course List”中。

如果我们修改了原始数据,例如填充了B9单元格(原为空单元格),查询数据会有什么变化呢?

在“Course List”工作表中的查询数据,此时并未自动更新。

我们需要点击“表设计”选项卡下“外部表数据”功能区的“刷新”按钮,数据才会进行更新。

以上我们简单介绍了一下Power Query及其一些简单的应用,在之后的分享中,我们会继续介绍更多Power Query的使用和功能,敬请期待!