解决方案:PHP封装的微信公众平台接口开发操作类完整示例
优采云 发布时间: 2022-11-27 12:17解决方案:PHP封装的微信公众平台接口开发操作类完整示例
, 结束识别; 本人正则匹配水平有限,只能这样写了。希望有人能指出更好的正则匹配方法。
另请注意:此匹配规则可能会在一段时间后发生变化。本文将尽量保持更新。如果你按照我的文章做了一个采集
系统,哪天失效了,别忘了回来看看文章有没有更新。
2)内容处理:
通过上面的方法,我们获取到了文章内容的html,但是当你展示文章内容后,你会发现图片和视频无法正常显示。因为这个html还需要一些处理:
首先是图片,在微信文章中
标签中的 src 属性全部替换为 data-src 属性。它只会在显示时被替换。所以我们也有两个选择,直接替换源码,或者显示的时候用js替换。先介绍下直接替换html的方法:
然后是视频。视频显示不正常。经过长时间的测试,发现只能替换一个页面地址。过程就不说了,直接说结果:
" />
经过这两次替换,文章内容html中的图片和视频都正常了。
3)公众号相关信息:
通过本专栏之前的文章,我们介绍了我们使用微信客户端随机打开公众号的历史新闻页面。系统从数据库中识别出biz的值,如果发现数据库中没有记录,就会插入一条新记录。后续采集队列会根据这个biz周期性的获取这个公众号的历史消息列表。
但是我们只获取了公众号的biz,公众号名称,头像这两个重要信息还是没有获取到。主要是历史新闻页面没有这两条信息。但是我们可以从文章页面获取。
在微信文章页的html底部,有一些js变量赋值代码。经过正则匹配,我们可以得到这两个公众号的信息:
通过这两个正则匹配,我们可以获取到公众号的头像和昵称,然后根据文章地址中的biz保存到对应的微信ID数据表中。
3. 物品的储存和加工
前面的代码已经将文章的内容获取到一个变量中。如何挽救其实每个人可能都有自己的想法。下面介绍一下我保存内容的方法:
将文章内容的html保存为html文件,以数据库id为文件名,以biz字段为目录。
<p>
" />
</p>
上面的代码是标准的创建文件夹和保存文件的php代码。您可以根据自己的实际情况安排保存方式。
之后在我们的服务器上可以得到一个html文件,里面的内容就是公众号的文章内容。我们可以从浏览器打开看看。这时候你可能会发现镜像防盗链!无法正常显示!包括数据库中保存的文章封面图,公众号头像都是防盗链的。
不用担心,这个问题很容易解决,把图片保存到自己的服务器就行了,以后会占用自己的服务器空间和带宽。
图片防盗链的原理是,当网页上显示一张图片时,图片服务器会检测引用该图片的服务器域名,当发现该服务器域名不收录
or时,会换成防盗链图片。
但是如果无法检测到引用页面的域名,是可以正常显示的,所以我们可以通过php的函数file_get_content()获取图片的二进制编码,然后以文件名保存在自己的服务器上按照我们自己的想法。这是保存图片的另一种方法。我目前正在使用腾讯云的“万象优图”通过他们提供的api将图片保存到云空间。这样做的好处是在读取图片的时候,直接在图片的链接地址中添加 可以通过指定想要获取的图片大小参数直接获取缩略图。比拥有自己的服务器方便得多。阿里云应该也有一样的产品,好像叫对象存储。
另外,我采集
公众号内容的目的是做一个新闻APP。在app中显示html代码后,由于app也没有域名,所以防盗链服务器也不会认为图片被盗链了。这样就可以直接显示图片了。
解决方案:梦行傻瓜式企业自助建站系统与老Y文章管理系统下载评论软件详情对比
" />
老Y文章管理系统是一款小巧精致的ASP源码软件,界面简洁清爽。老Y功能强大全面,操作简单方便,特色鲜明。新版老Y文章管理系统效率高,更人性化,非常实用。Laoy文章管理系统是Laoy基于Asp+Access/Mssql环境开发的一款开源建站产品。很大程度上满足了初级个人用户和企事业单位、团体、事业单位等的建站需求,不需要建站人员懂复杂的程序代码,只需轻点鼠标,即可搭建专业级网站功能齐全!是初学者的首选。会员群、QQ用户登录等功能,投票调查、评论、广告系统可以增强网站的互动性,同时为网站的发展带来一定的盈利模式。该程序可以通过三种方式浏览:动态、无组件伪静态、URL_ReWrite伪静态(需要空格支持)。老y文章管理系统本着安全第一的原则,解决了ASP程序的常见漏洞。程序本身没有后门,严格的代码过滤为网站的安全运行提供了可靠的保障。和 URL_ReWrite 伪静态(需要空间支持)。老y文章管理系统本着安全第一的原则,解决了ASP程序的常见漏洞。程序本身没有后门,严格的代码过滤为网站的安全运行提供了可靠的保障。和 URL_ReWrite 伪静态(需要空间支持)。老y文章管理系统本着安全第一的原则,解决了ASP程序的常见漏洞。程序本身没有后门,严格的代码过滤为网站的安全运行提供了可靠的保障。
" />