excel学习库

excel表格_excel函数公式大全_execl从入门到精通

网络爬虫问题:如何将Office的功能图标全部导入Power BI使用?

秉纲而目自张,执末而本自从。
今天通过一个有趣的例子,讲一讲如何通过构建 URL 进行网络数据爬取,使用 Power BI 实现网络爬虫的功能。
我们都知道 Office 的功能区中每一个功能都对应一个设计精良的图标。
Excel 用户界面
Access 用户界面
我们在选择相应的功能时,首先要找的也许并不是文字,而是相应的图标。因为图标相对于文字能更加形象和快速地传递信息。
今天我们就尝试将这些图标从网络上抓取下来,导入 Power BI 中,效果如下:
一、找出imageMso图标URL规律
我们在之前的文章中曾经介绍过在线的图片可以通过矩阵或者是切片器展示。
所以我们可以先找到包含所有 imageMso 网站,然后观察每个图标对应网址的规律。最后想办法将其抓取到 Power BI 中。

通过搜索找到以下网址:https://www.ka-net.org/blog/?p=11333
这是一个日本 Excel 爱好者建立的网站,网站中有一些 Excel、PowerBI、Power Automate等相关的教程。博主最近更新了很多关于Power Automate教程,感兴趣的朋友可以去网站看看。
该网站将 Office 的imageMso文件按照字母进行分类,点击就字母就可以查看。

下面观察每个图标的 URL 是否有一定的规律,右击图片在新标签页中打开图像就可以看到图像的存储 URL了。
多打开几个图标 URL 就可以观察到,除了加粗部分以外其它部分都一样的。因此我们如果想要一次性构建出所有图标的 URL ,只需要获取所有图标英文名称。

www.ka-net.org/office/office365icon/large/
BibliographyAddNewSource.png
www.ka-net.org/office/office365icon/large/BuildingBlocksOrganizer.png
www.ka-net.org/office/office365icon/large/BookmarkInsertPublisher.png
而这些图标的英文名称,在原网站上都有,所以我们需要做的还是从网站上爬取。
NUM
A
二、获取imageMso名称
我们以获取 A 字母开头的图标为例,在 PowerBI 中选择从WEB获取数据。可以看到名称就在表 A 中。选择 A ,然后点击确定。
选择表 A,单击确定
可以看到名称存在重复,这里我们只要选择单数(或偶数)的列(1、3、5、7)就可以了
通过筛选去掉空行得到的表结构如下,这还不是我们最终想要的格式。
我们需要将这四列追加合并成同一列。先思考一下如何实现 ?
其实只要用到索引列和逆透视其它列两个功能。
为表格添加从1开始的索引列,并将列移动到第一列
单击选择索引列,然后选择逆透视其它列
经过以上步骤就能得到下表,删除不需要的索引及属性列即可。
接下来用同样的方法将其他字母开头的名称也抓取下来,追加到同一个表就可以直接用来构造 URL了。在将所有的表追加到一起时,不需要一个一个表执行追加,追加查询支持一次性追加多张表。
构造 URL 只需要一个自定义列即可:固定部分 + NAME 列 + .png
"https://www.ka-net.org/office/office365icon/large/"&[NAME]&".png"
当然按以上方法逐表抓取,然后在将表格追加并不是最高效的方法。我们可以结合之前讲过的参数及自定义函数相关知识,将所有表一次性抓取到 Power BI 中。
具体方法是:归纳规律 + 新建参数 + 构建 URL+ 创建并调用自定义函数。
我们将在下一篇文章中进行介绍。
扫码加入PowerBI知识星球,你将获得;
百余篇优质原创文章练习文件;
365天,不限次数解答问题;
持续更新的杂志级图表制作方法及源文件;
历次分享的 优秀可视化仪表板模板。
…………

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

«    2024年12月    »
1
2345678
9101112131415
16171819202122
23242526272829
3031
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
    文章归档
      友情链接