chrome插件网页抓取(浏览器中为收集或存储有关任何个人用户的信息不使用持久存储)
优采云 发布时间: 2021-12-15 15:00chrome插件网页抓取(浏览器中为收集或存储有关任何个人用户的信息不使用持久存储)
此扩展程序允许您直接在浏览器中为任何公共 网站 生成站点地图。生成站点地图时,扩展会渲染网页并等待javascript加载,非常适合抓取使用angular、react等制作的动态单页应用。
这个扩展的工作原理是获取一些起始 URL,抓取页面以获得更多链接,然后递归地抓取这些页面以获得更多链接。检查找到的所有链接后,扩展程序将输出一个站点地图文件。
这种实现对于收录数万页的 网站 来说是不切实际的。但是,它可以在合理的时间内抓取数千个条目。
================================
隐私政策
================================
此应用程序不会采集或存储有关任何个人用户的信息。
此应用程序不使用持久存储。所有应用
数据仅保存在运行系统内存中。
当应用程序运行时,它将为特定域的用户生成站点地图
它已被选中,并且只有在用户明确授予这样做的权限之后。
应用程序执行结束后,所有数据和生成的站点地图
一旦内存被回收,它就会丢失。
此应用程序可能会采集匿名和汇总使用情况
根据谷歌分析tos数据改善用户体验
并确定关键功能。同样,这些信息不是
识别个人用户并遵循 GA tos