自媒体文章采集器(网页的图文素材采集的方法及注意事项!!)
优采云 发布时间: 2022-04-17 07:50自媒体文章采集器(网页的图文素材采集的方法及注意事项!!)
1、运行软件,在目的网址输入你需要的网站的地址采集,可以是图片站也可以是文章、小说、图文版本软件完全打开网页后,采集图片列表会自动列出页面中收录的图片链接。
根据您的网速,网页可能需要几秒钟才能打开。如果在此过程中弹出“Security Alert”对话框,询问是否继续,也就是Internet Explorer浏览器的安全设置提示,点击“Yes”继续访问采集的站点, if click "Yes" No" 会采集 not。有时可能会弹出脚本错误消息,忽略yes或no即可。
2、采集的网站图片链接全部出来后(鼠标移到软件浏览器窗口会提示“网页加载”),点击“抓取并保存文字” "按钮,即可以自动抓取网页中的文字,并自动保存在你标题指定的“存储路径”下(文章如果长度太长,右边的文字抓取框软件侧面可能无法完全显示,请此时打开)自动保存的文本采集文件查看)。
如果需要采集图片,点击“开始采集/压缩”按钮自动批量采集,图片会自动保存到你指定的“存储路径”文件夹中。当然你也可以选择只下载单个文件,可以点击“预览图片”按钮预览图片文件为采集。为了节省空间,在批量下载图片的同时,也可以勾选“自动压缩采集图片”选项,下载的图片会被自动压缩(当然会同步损坏图片质量)。如果在压缩前备份原创图像文件,您也可以勾选“压缩前备份图像”选项。
除了从远程采集压缩图片文件,批量压缩功能还可以批量压缩你(电脑)本地的图片文件。
3、完成当前网页的图文素材采集后,如果要采集下一栏或下一网页,需要点击网站@软件浏览器窗口用鼠标>相关栏目或“下一页”(“next page”),等到下一页完全打开后再采集。“设为空白页”旁边的小箭头可放大软件浏览器窗口,方便查看相关内容。
4、你每次输入的URL软件都会自动保存到下拉菜单中,方便你下次直接点击访问。如果内容太多,想清除,打开软件安装目录下的myurl.ini文件,整理删除URL。如果勾选“设为空白页”,则每次启动软件时不会自动打开网站主页。
5、采集日志保存在软件安装目录下的mylog.txt中。
另外,预览部分png图片或空URL图片可能会报错或崩溃,请忽略。