抓取网页数据php( 58手机号码识别插件和百度翻译插件的用法(组图))
优采云 发布时间: 2022-01-19 06:11抓取网页数据php(
58手机号码识别插件和百度翻译插件的用法(组图))
爬网数据工具优采云采集器插件说明
使用 优采云采集器 捕获网页数据时也使用插件。优采云采集器将采集中的数据传递给外部程序,我们称之为插件,插件然后处理数据,然后将数据返回给采集器。
优采云采集器V9支持PHP和C#插件编写,V9支持插件源代码编辑。网页数据抓取工具优采云采集器的插件可以应用于采集的结果处理、HTTP请求、文件下载。设置插件实现特定应用时,可以在插件管理器的下拉框中选择现有插件。
下面使用58手机号码识别插件和百度翻译插件来说明使用方法。
58个插件演示:
(1)首先我们需要把插件58验证码V9.dll放到采集器的Plugins目录下
(2)然后在“其他设置-插件-采集结果处理插件”中选择这个插件。
(3)最后我们需要创建一个名为“手机号”的标签,采集到手机号58的图片地址,这样运行的时候采集器会自动调用该插件将图像输出为转义的数字文本。
翻译插件演示:
(1)首先我们需要把插件百度翻译.dll放到采集器的Plugins目录下
(2)然后在“其他设置-插件-采集结果处理插件”中选择这个插件。
(3)最后,我们需要创建一个名为“翻译标签”的标签,并以固定字符串的形式写入需要翻译的字段名称。