从网页抓取数据( PowerQuery的数据清洗功能(示例中的列)(组图))
优采云 发布时间: 2021-09-12 15:01从网页抓取数据(
PowerQuery的数据清洗功能(示例中的列)(组图))
1、点击“获取数据”>“网页”,在弹出的对话框中输入网址,点击“确定”
2、在弹出的“导航器”对话框中,选择左下角的“使用示例添加表格”。
3、接下来我们要做的就是提供一个我们需要在表中提取的数据的例子。
以抓取书名为例,可以看到,当我们提供两个书名时,Power BI 会自动为我们抓取其余的书名。
我们提供的示例越多,PowerBI 捕获的数据就越准确
4、 使用相同的方法分别捕获我们需要的其他字段。
5、单击“确定”>“转换数据”,我们已成功将数据捕获到 Power Query 查询编辑器中。
将“示例中的列”添加到 2Power Query
以上捕获的数据除了[作者]和[评级]列是正确的,其他列收录无用信息。 Power Query 提供了丰富的数据清理功能,可以帮助我们从杂乱的数据中提取信息。
“示例中的列”可以根据用户提供的示例提取信息。
1、选择[作者]栏,点击“示例中的栏”左下角的小三角符号“添加栏”,在弹出的下拉菜单中选择“来自选择”选项。
2、在[Column 1]中提供了一个例子,Power BI会智能识别我们需要的数据
这里是复制原创列数据的快速输入示例
点击右上角的“确定”后,作者姓名将被提取到一个新列中。
-结束-