【知识点】网页信息收集器的基本操作技巧！

优采云发布时间: 2021-04-26 04:05

　　网页信息采集器是绿色，紧凑且实用的网页信息采集软件。网页信息采集器功能强大且易于使用。它可以轻松地采集关于某个网站的信息。根据建立的任务信息保存和提取网页。您也可以通过“双击”任务来启动此功能。

　　[功能]

　　1、执行任务

　　根据已建立的任务信息保存和提取网页，或通过“双击”任务来启动此功能

　　2、创建，复制，修改，删除任务

　　新建，复制，修改，删除任务信息

　　3、默认选项

　　设置默认工作路径（默认为当前程序目录中的WorkDir文件夹）

　　设置提取测试的默认数量（默认为1 0)

　　设置默认的文本分隔符（默认为*）

　　4、创建和编辑任务信息

　　任务名称：在默认工作文件夹中生成一个以此名称命名的文件夹。

　　登录地址：对于需要登录以查看其网页内容的某些网站用户，请填写登录页面地址。执行任务时，软件将打开此登录页面，让您登录到此网站

　　常规格式类型网页，非常规格式类型网页：

　　此处的序数格式和非序数格式主要是指提取的地址是否只是数字更改。例如，类似：

　　①并且属于顺序格式

　　②并且属于非常规格式

　　列表地址：当类型为“非标准格式类型net”时，列表第一页的链接地址

　　检索地址：它由实际保存的网页地址+ *的公共部分组成。

　　例如，提取：

　　①然后提取地址为* .html

　　②然后提取地址为*。/ *。html

　　翻页地址：它是列表页面上“下一页”的链接地址，更改后的部分替换为*。

　　起始页码：开始获取的页数

　　页面数已满：停止获取的页面数

　　当前页码：已提取的当前页码

　　已保存页数：已保存页数

　　任务的详细说明：任务的详细说明

0

2021-04-26

网站内容采集器

0 个评论

要回复文章请先登录或注册