自动采集发布系统(数据库信息采集从FreeCMS2.1开始支持通过简单配置即可完成)
优采云 发布时间: 2022-04-12 19:22自动采集发布系统(数据库信息采集从FreeCMS2.1开始支持通过简单配置即可完成)
项目地址:
数据库信息采集
免费后支持cms 2.1
通过简单的配置即可抓取目标数据库信息,支持增量采集、关键字替换、定时采集、采集各种信息属性,自动审计和静态信息页面。
采集规则管理
点击左侧管理菜单中的采集规则进入。
添加 采集 规则
单击 采集 规则列表下方的“添加”按钮。
填写好相关属性后,点击“保存”按钮。
采集规则属性说明
采集规则属性分为基本、设置和关键词替换。
一般来说,可以通过在基本选项卡中填写相关属性来完成。如果需要更高级的设置,则可以使用后面的选项卡。
主要属性解释如下。
名称:采集规则的名称。
采集To Column:采集 的信息将被添加到该列。
采集调度:设置执行采集操作的时间。这个设置非常重要。采集 操作只有在设置了采集 调度系统时才能执行。
数据库类型:支持mysql、mssql、oracle。
IP 地址或服务器名称:目标数据库的地址。
服务器端口:目标服务器提供数据库服务的端口。mysql默认值为3306,mssql默认值为1433,oracle默认值为1521。
登录帐号:登录目标数据库的用户名。
登录密码:登录目标数据库的密码。
采集数据库名称:目标数据库的名称。
采集表名:设置上述属性后,系统会自动连接目标数据库,并提取表名和视图名显示在采集表名下拉列表中。如果没有提取到数据,说明数据库配置有问题,需要检查数据库配置。
主键字段名:设置采集表后,系统会自动提取该表下的字段。主键字段供系统判断这条数据是否已经采集。
排序字段名称:查询数据时使用的排序字段。
排序类型:根据排序字段正向或反向查询。
where条件语句:可以添加查询条件来过滤和提取内容。此处不需要填写 where 关键字,系统会自动添加。
信息属性字段:可以设置每个信息属性对应的目标表中的字段,可以设置标题、内容、摘要、点击次数、作者、来源、添加时间。
状态:系统将在启用状态下执行采集规则。
自动批准:将采集的信息直接设置为批准状态。
使用采集信息点击:默认采集对信息点击为0,设置此属性和内容点击开始和结束html,系统会拦截目标信息的点击,设置为采集 发布信息命中。
采集 内容最大条数:默认无限制,如果设置了该属性,系统会统计这条采集规则从采集中有多少条采集信息记录。直到采集内容,系统将不再采集。
将第一张图片设置为标题图片:如果信息内容中有图片,则提取第一张图片作为标题图片,并将信息设置为图片信息。
清除内容中的html标签:清除信息内容中的html标签,保留纯文本。
内容为空时是否采集:可设置为内容为空时不采集此信息。
使用采集信息添加时间:采集默认信息添加时间为当前时间。设置该属性和内容添加时间开始和结束html后,系统会截取目标信息添加时间,设置为采集发布信息添加时间。
采集信息添加时间格式:默认格式为yyyy-MM-dd。如果目标页面有不同的添加时间格式,这里需要设置为正确的日期格式。
采集开始时间:默认为当前时间。如果小于采集 开始时间,系统不会采集。
采集结束时间:默认为永不结束。如果超过采集的结束时间,系统不会采集。
使用关键词替换功能,可以将采集收到的信息中的关键词替换成你想要的关键词。
编辑 采集 规则
选择需要编辑的采集规则,点击“编辑”按钮。
注意:一次只能编辑一个 采集 规则。
填写好相关属性后,点击“保存”按钮。
采集
选择需要 采集 的 采集 规则,然后单击“采集”按钮。
注意:您一次只能对一个 采集 规则执行 采集 操作。
删除 采集 规则
选择需要删除的采集规则,点击“删除”按钮。
提示:可以同时删除多个采集 规则。
为防止误操作,系统会提示用户是否删除,点击“确定”即可完成删除操作。
查看 采集 记录
点击左侧管理菜单中的采集记录进入。
这里可以查看所有数据库采集记录,可以删除指定的采集记录,但是已经采集的信息数据不会被删除,选择采集即可被删除的记录,然后单击“删除”按钮。
提示:可以同时删除多条 采集 记录。
为防止误操作,系统会提示用户是否删除,点击“确定”即可完成删除操作。