如果公众号写文章也须要加入【参考文献】……

优采云 发布时间: 2020-08-24 17:45

  如果公众号写文章也须要加入【参考文献】……

  而这两个数据,也是全部可以得到。

  文章引用行为的获取

  我们打开一篇“引用了”其他文章的公众号文章,F12检测文章的源代码可以看见,文章是以超链接的方式出现的:

  

  文章源代码

  所以在采集文章时,如果在源代码中采集到

  文本

  的数组,则可以觉得此处有“引用”行为。

  引用来源剖析

  找到了文章的引用行为,我们须要对被引用的文章进行剖析,分析的核心在就于这篇文章的链接,也就是刚刚herf旁边的那一串。

  幸运的是,微信在链接里保存了我们须要的所有数据。

  以昨天那篇文章的链接为例:

  #wechat_redirect

  我们把链接分为三部份:

  /s?

  __biz=MzU1MTAwNzY4Mg==&mid=2247483897&idx=1&sn=893614b6d6fd28d04b0f51e7c857c876&chksm=fb96a554cce12c4266018f581467f009021b89f5df0d546b1d08f4a08055ce17916f2ae74745&scene=21#wechat_redirect

  了解链接组成的同学们应当晓得,前两部份是链接的主题,每个文章的链接都是一样的。关键信息在于“?”后面的部份。

  在链接里,“?”后面的部份是链接的传参,顾名思义,就是向服务器传递的参数,是对链接的解释(或者叫备注)。

  观察链接里的参数,有五个:

  __biz

  mid

  idx

  sn

  chksm

  我们这儿只用到前两个参数:

  __biz可以觉得是微信公众平台对外公布的公众账号的惟一

  idmid是图文消息id

  通过__biz参数可以获得公众号的ID数据,是惟一辨识的,目前技术上可以转化成帐号的;

  通过mid参数,我们则可以定位到文章的ID,也是惟一辨识的。

  到此,对于文章引用行为技术层面的问题都早已解决。

  “被引量”的使用

  和学术领域相同,一篇文章被引用一次,则代表该文章影响力+1,被引量越多,文章影响力就越高。

  对于公众号而言,可以使用帐号所有文章的被引量估算帐号的“影响因子”,可以使用SCI的估算方式,也可以使用GoogleScholar的H-index的估算方式。

  和学术领域相同,文章也存在”自引“和”负引用“的问题。

  自引在学术领域是一个不怎样受待见的事情,因为“被引量”这个指标早已作为一种评价标准,引用自己的文章给自己+1这些行为不是很好看。

  负引用这件事在学术领域还不这么严重,一篇论文的推论不管对错,学术层面的价值是存在的。但是在媒体行业就不同了,毕竟媒体好多时侯传递的是价值观。比如某篇文章观点狭隘,被全网喷,我们只能说那篇文章影响力高,但是价值就没多少了。

  这里我们就不深入讨论了。

  最后说点啥

  目前的内容行业,充斥着营销号、流量号,一群自媒体人聚在一起不是讨论什么样的文章有价值、什么样的内容有深度,而是讨论明天的利润怎样、多少阅读量才会开通流量主。

  我们每晚仅有的几分钟阅读时间里,有一半浪费在这些“耸人听闻”但毫无营养的标题党上,反而这些报导事实、传递价值的深度内容或由于文字很长、或由于标题不够吸睛,被吞没在这爆燃的信息海洋中。

  是时侯该有人站出来做点哪些了,比如给内容行业加入一个早已谋害学术圈的“影响因子”。

  本文首发自我的个人公众号喜新(ID:noyanjiu),请随意转载,不用告诉我。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线