精选文章:刘连康：织梦实现发布文章主动推送（实时）给百度的方法

优采云发布时间: 2022-10-02 20:08

　　织梦内容管理系统（Dedecms）是一个非常古老的程序。它主要以其简单、实用和开源而著称。很多建站的初学者都是第一次做网站。使用织梦。然而，织梦也有它的缺点。比如我们用织梦发布文章后，需要手动提交链接到百度。是不是很麻烦？

　　所以康哥今天分享了一个简单的修改织梦(dedecms)后台实现织梦网站后台发布文章主动推送到百度的方法，并且是实时的。

　　那么，利用百度的主动推送功能，我们会达到什么样的效果呢？

　　康认为有两点：

　　1、可以被百度搜索引擎爬虫及时发现

　　如果我们在发布文章后主动将链接提交给百度搜索引擎爬虫，岂不是可以缩短百度搜索引擎爬虫发现你网站新链接的时间？这样新发布的页面就可以在第一时间被百度收录。

　　2、也可以保护原创

　　世界文章是大抄袭，你讨厌那些抄袭者吗？明明是我自己写的原创文章，却被别人网站抄了，没什么。但是那些抄袭的文章，他们的排名居然比你高，你不生气吗？不怪杜娘技术不好？

　　所以只要使用百度的主动推送功能，就可以通过这种方式将网站的最新原创内容快速通知给百度，让内容在转发之前被百度发现，从而开始保护原创的效果。

　　好了，康哥现在就教大家如何使用织梦实现向百度发布文章主动推送（实时）的方法。为了方便说明，今天康哥就以新上线的广西特产网为大家做示范。

　　一、在织梦后台添加一个文档原创属性判断框

　　我们在织梦后台添加文档原创属性判断框主要是添加织梦的自定义文档属性，当勾选文档原创属性判断框时，将作为原创 @原创链接提交，否则作为普通链接提交。

　　先登录织梦网站后台，然后找到System-SQL命令行工具，执行如下SQL语句：

　　INSERT INTO `dede_arcatt` VALUES('9','y','原创');

alter table `dede_archives` modify `flag` set('c','h','p','f','s','j','a','b','y') default NULL;

　　然后，在运行SQL命令行一栏中，我们要选择多行命令，那么我们就直接复制上面的sql语句，点击OK，最后你会惊喜的看到2条SQL都执行成功了. 陈述！

　　详情请参考下图：

　　成功执行这条sql语句后，我们可以在织梦后台系统-自定义文档属性中看到如下结果：

　　那么，当我们在织梦后台发布文章时，只需勾选文档原创属性判断框即可，如下图所示：

　　二、加入百度主动推送代码做推送判断

　　我们主要在织梦的后台修改article_add.php和article_edit.php这两个文件来达到推送判断的效果。登录FTP，可以根据这个织梦网站的后台路径wwwroot//dede/找到article_add.php和article_edit.php这两个文件。

　　注：康哥以文章页面模型为例。如果要修改产品页面，可以修改相应的模板。

　　我们先修改文件article_add.php。康哥建议大家使用代码编辑器Notepad++进行修改。

　　打开文件article_add.php后，直接Ctrl+G定位到第259行左右（每个人的网站代码不一样，自己找大概位置），然后我们会主动推送百度核心代码直接复制粘贴到第259行以下的位置，如下图所示：

　　康哥这里把这段代码分享给大家，然后大家可以将代码中的API接口调用地址修改为自己的。

　　//主动推送核心代码开始

else{

$urls[]='http://'.$cfg_baiduhost.'/'.$artUrl;

$api = 'http://data.zz.baidu.com/urls?site=www.gxtcnet.cn&token=RyVub75SqbRkLu0k';

$ch = curl_init();

$options = array(

<p>

CURLOPT_URL => $api,

CURLOPT_POST => true,

CURLOPT_RETURNTRANSFER => true,

CURLOPT_POSTFIELDS => implode("\n", $urls),

CURLOPT_HTTPHEADER => array('Content-Type: text/plain'),

);

curl_setopt_array($ch, $options);

$result = curl_exec($ch);

}

//主动推送核心代码结束</p>

　　百度主动推送核心代码添加后保存，再发回FTP覆盖原文件。

　　如果想要织梦backend文章发布成功后这样的推送效果，可以在下面287行左右添加这段代码：百度提交返回“.$result.”，如如下图所示：

　　接下来我们再次修改article_edit.php文件，修改方法和上一个文件一样。

　　打开article_edit.php文件后，Ctrl+G直接定位到242行左右，然后我们直接将内容模块下的主动推送代码复制粘贴到242行以下的位置，如下图：

　　康哥这里也将这段代码分享给大家，然后大家可以将代码中的API接口调用地址修改为自己的。

　　//修改内容模块下的主动推送代码开始

else{

$urls[]='http://'.$cfg_baiduhost.'/'.$artUrl;

$api = 'http://data.zz.baidu.com/urls?site=www.gxtcnet.cn&token=RyVub75SqbRkLu0k';

$ch = curl_init();

$options = array(

CURLOPT_URL => $api,

CURLOPT_POST => true,

<p>

CURLOPT_RETURNTRANSFER => true,

CURLOPT_POSTFIELDS => implode("\n", $urls),

CURLOPT_HTTPHEADER => array('Content-Type: text/plain'),

);

curl_setopt_array($ch, $options);

$result = curl_exec($ch);

}

//修改内容模块下的主动推送代码结束</p>

　　当我们在内容模块下添加主动推送代码并保存时，同样会发送回FTP覆盖原文件。

　　如果想要织梦backend文章发布成功后这样的推送效果，可以在下面关于第270行添加如下代码：Baidu submit returns ".$ result."，如图在下图中：

　　在这两个判断文件中加入push判断代码后，就完成了大半的工作。织梦的后台还有两个关键点需要我们操作，那就是新增两个变量！

　　到目前为止，还有很多朋友不知道如何在织梦dedecms中添加新的变量，所以在这里给大家一个技巧。

　　我们先添加第一个变量，进入织梦(Dedecms)的后台，依次打开系统-系统基本参数-添加新变量，然后就可以看到如下所示的内容现在图：

　　变量名：指要调用的函数，请填写以cfg_开头的英文或数字，我们这里直接写：cfg_baiduhost

　　变量值：指输入框中填写的内容，我们这里写自己的网站域名：

　　变量类型：指的是文本或数字，这里我们可以选择文本。当然，如果你添加的变量内容较长，可以选择多行文本。

　　参数说明：指的是中文名称，方便我们知道这个新变量是干什么用的。我们在这里写：百度推送域名。

　　组：这是指您希望在哪个管理组中看到这个新变量。这里我们可以直接选择默认站点设置。

　　设置好后我们点击保存变量，第一个变量添加成功。

　　好的，让我们看看第二个变量是如何添加的。康哥已经给大家介绍了这些变量的相关术语，这里就不多说了，直接上干货吧！

　　变量名：cfg_baidutoken

　　变量值：RyVub75SqbRkLu0k（注：主动推送接口的参数值请从百度搜索资源平台链接提交获取）

　　变量类型：文本

　　参数说明：主动推送接口

　　组成员：站点设置

　　设置完成后，我们点击直接保存变量。此时第二个变量添加成功。以下屏幕截图显示了通过添加第二个变量显示的内容：

　　那么你看到系统基本参数底部的这两个新内容了吗？一是百度推送域名，二是主动推送接口。有关详细信息，请参阅下面的屏幕截图：

　　如果你看到上面新增的两个变量，那么康哥会恭喜你，说明你大功告成了！

　　以上截图是康哥随机放出的测试文章，你看到这个效果了吗？关键是截图中的代码，{"remain":4999954,"success":1},"remain":4999954,"这段代码的意思是：返回的数字是可以提交的数字，"success":1这段代码的意思是：返回的数字是成功提交的百度搜索引擎爬虫数量，表示上一次提交成功向百度搜索引擎爬虫提交了新链接。

　　本文为原创文章，版权归作者所有。未经授权，禁止抄袭！

　　分享文章:如何批量下载微信公众号文章？

　　由于历史原因，早期的公众号没有打赏，原创这些功能，所以你实际搜索到的文章数量会比显示的文章数量多。在后面的教程中，文字部分直接参考官方文档。

　　01

　　第一步：开通公众号

　　打开电脑版微信登录。登录微信后，打开需要采集的公众号。

　　以公众号【晶莹*敏*感*词*】为例。打开公众号后，首先点击进入公众号，然后点击右上角的三个点。

　　选择目标公众号

　　02

　　第二步：进入历史消息界面

　　打开如上图界面后，点击右上角的三个点，然后在下图所示界面点击查看历史消息。

　　点击查看历史新闻

　　如果点击上图历史消息界面提示“请在微信客户端打开链接”，打开PC端微信设置-通用设置，取消勾选系统默认浏览器打开网页。

　　在微信电脑客户端打开链接

　　修改设置取消系统默认浏览器打开网页

　　03

　　第 3 步：开始抓取文章

　　然后在软件的采集界面，点击开始采集按钮（点击后，360等安全软件可能会有拦截提示，请务必点击允许，第一次使用可能还会提示您安装证书，请务必同时单击允许）

　　等待按钮名称更改为收听，然后刷新公众号历史消息界面。

　　注意公众号历史消息界面刷新了，如下图第二张，其他任何界面都不起作用。

　　点击刷新按钮开始*敏*感*词*cookies

　　点击采集开始采集

　　04

　　第四步：输入文章抓取

　　刷新后，软件会自动采集history文章。建议将加载间隔设置为 10 秒。采集完成后，可以导出文章或浏览。

　　采集结束

　　佩哥为大家制作了动图教程，官网也有视频教程供大家参考。

　　批量下载微信公众号历史文章GIF教程

　　再找一个公众号，从零开始全面演示。

　　硅谷网川微信历史文章采集GIF教程

　　注意：

　　可以，等待按钮名称变为*敏*感*词*，然后刷新历史界面；

　　是刷新历史消息界面，不是刷新文章内容页面，千万不能出错；

　　采集过程中无需刷新历史消息界面，刷新一次即可；

　　05

　　导出为 PDF、WORD、HTML

　　以上就是内容爬取工作的完成，接下来要做的就是以本地可读的方式备份数据。常用的格式有 PDF、WORD 和 HTML 三种。

　　我选择HTML进行备份，因为我还需要将这些爬取的数据批量导入印象笔记，而HTML是最友好的格式，导入后直接可读，也可以全文搜索。操作方法如下，

　　点击左上角的ID，全选，右击列表中任意一个文章，弹出选择菜单，点击Export File，选择Export as HTML。

　　全选并导出文章

　　下一步就是将下载的文件批量导入印象笔记，方便使用时进行全文搜索。

　　关于如何从印象笔记批量导入文件，请参考《》

　　导入印象笔记后的效果

　　在印象笔记中搜索

　　比如我知道汪川是特斯拉的铁粉，那么铁粉到底有多铁？让我们在川哥的历史文章中找回[特斯拉]这个关键词。在文章的607篇文章中，共有152篇文章出现在特斯拉，频率25%！川哥真是特斯拉的忠实粉丝！

　　在指定笔记本中精确搜索

　　这种方式有点像舆情监控，可以看到别人对一个公司或者一个事件的看法。

　　如果你有更好的工具，比如词频统计分析，以这些数据为基础，下一步也很容易。

　　备份到本地文章批量导入印象笔记

0

2022-10-02

实时文章采集

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

精选文章:刘连康：织梦实现发布文章主动推送（实时）给百度的方法

0 个评论

发起人

AI时代内容工厂

精选文章:刘连康：织梦实现发布文章主动推送（实时）给百度的方法

0 个评论

发起人

相关问题