官方数据:大数据目标栏目整体采集发布到CMS文章系统的指定栏目
优采云 发布时间: 2020-12-27 09:19官方数据:大数据目标栏目整体采集发布到CMS文章系统的指定栏目
作为整体的大数据目标列采集已发布到cms文章系统的指定列(实际战斗)准备:要下载采集器,您还需要下载Microsoft .NET Framework v2.0并在下载页面上注册帐号:根据需要填写注册信息,然后按确认进行注册,然后转到注册过程中填写的电子邮件地址以完成注册验证。软件安装:首先安装Microsoft.NET Framework v2.0,然后安装优采云采集器软件。 4:登录到软件单击桌面采集软件图标登录到该软件。首次登录时,该软件将自动升级,然后在您刚注册时填写信息。然后,我们完成了软件的下载,注册和安装。大数据目标列整体采集已发布到文章系统的指定列,我们首先登录采集软件并找到采集数据网站列页面(中间部分)标明域名),然后单击采集软件。项目管理在左上角-选择新项目(标准)以跳出项目名称并编写视频采集(您可以随意填写)其他默认值很好,单击左下角的下一个设置,然后在标题列表页面的起始地址采集地址中输入所需的地址,然后单击以开始预分析,然后弹出提示点:是,软件会自动找到标题页面的下一页和最后一页链接以及翻页次数。并列出了相应的值(我们是整体采集,所以我选择标题列表页面的页数为29),然后单击“下一步”进入内容选择页面以查看软件是否找到了我们的内容链接(在框中红色),然后单击下一步设置以进入内容页面模板管理。我选择了方法1,使用自定义模板(我个人喜欢使用此模板,可以使用有用的模板,而不能使用任何模板)使用此页面时忽略)要设置采集的内容,因为它是整个采集列,请在中间部分添加一个新模板,然后输入所需的内容页面的地址采集,(即,您想要采集 文章页面内容的详细信息)然后单击以添加一个新模板,我选择了“ fine”,然后单击以开始分析,采集自动为我们采集了标题和文本,但是还需要设置所需的标题和文本,然后我们选择[对于k15的内容],在表格中单击以启动所需的单词采集 文章,文章在右侧的红色区域中,但不完整,因此我们需要使用复合语句,单击[表中的k13],然后选择将采集存储表保存在采集中在下面的[]中,相应的字段名称是文本,检查复合句子,如果文章的内容不完整,请继续在表中单击。 采集 文章的内容,然后重复上述操作,直到文章的内容完成,并且我们的采集的工作在这里完成。
下一步,我将测试采集:该软件已经很容易地批处理采集到文章的标题和内容,让我进行最后一步并将其发布到我的网站: ,右键单击要发布到网站的列,然后执行以下步骤,最后选择数据模拟发布以启用模拟WEB发布采集的功能。选择发布机制采集后,可以同时进行发布,并且其他默认设置也可以,然后在登录参数设置和定义字段UserName =中填写网站用于后台登录的用户名,密码和身份验证代码。 =用户名PWD ==密码AdminLoginCode ==身份验证代码,我们可以轻松地验证并登录网站背景,下一步是设置发布页面,我们必须登录网站,找到背景地址发布文章页面,在文章系统上单击以填写文章,后台地址栏中显示的地址不是我们要发布文章页面的确切地址。我们想在后台发布文章页面,右键单击并选择属性,以便获得文章页面的确切地址,如图中红色圆圈所示。它是发布页面的特定地址。我们将其复制并粘贴到WEB发布页面的地址中。然后采集软件会一次自动分析并列出发布页面表的值。首先,选择要发布的文章对应的列,单击并按OK,选择疾病,然后设置文章的标题和文本,然后选择方法1从采集的结果中进行选择,[刚刚测试的k13]已成功发布,并且设置完成。稍后,按确认按钮,然后进入采集发布的最后阶段,单击开始和运行按钮,嘿,开心一点,然后源源不断的信息将存储在采集中。