事实:自媒体素材平台有哪些?这里的内容够你用很久

优采云 发布时间: 2022-11-22 09:15

  事实:自媒体素材平台有哪些?这里的内容够你用很久

  自媒体素材平台有哪些?这里的内容足够你使用很久了。当你在自媒体平台上创作内容时,总会有陷入瓶颈期的时候,做自媒体不仅仅是做内容。是时候发布了。

  最近总有读者问我哪些自媒体素材平台比较靠谱,因为采集

素材是一件很麻烦的事情,也是最费时费力的事情。如果您快速采集

材料,您可能可以在一两个小时内创建内容。如果你慢一点,时间就会无限延长,更长的时间也是可以的。

  如何采集

自媒体素材?

  

" />

  第一个:亦传素材平台

  我相信每个人都应该知道这个平台。很多人认为它只是做原创测试。其实它还可以采集自媒体素材,采集文章和视频素材,过滤自媒体平台和发布时间。如果要下载更多素材的话,也可以批量下载。

  第二:聚焦热点平台

  热点平台就像那些微博热搜榜、百度风云榜,都是实时更新的。不管作者在哪个领域,最好关注这两个平台,因为热点的流量还是很大的,如果你的内容正好撞上了热点,那么收入也会增加。对于本素材,您只需点击关键词即可看到大量类似内容。

  

" />

  第三种:直接搜索关键词

  这种方法也比较简单快捷。如果你有好的题目,可以直接在搜索引擎上搜索相关的关键词,然后直接找到素材。这种方式对于那些已经想好了话题框架的自媒体人来说,这种方式的创作会快很多。

  第四:知乎

  知乎也算是一个素材比较多的平台。知乎是一个问答网站。里面有各种奇怪的问题。搜索一下,说不定会有意想不到的灵感,再用蚂蚁小二一键分发内容,同样省时省力。

  真相:如何从新闻中识别骗子们的小套路

  *原作者:西交边MR,本文属于FreeBuf原创打赏计划,未经允许禁止转载

  电信诈骗猖獗,已成为国家重点打击的对象,但亲友被骗的悲剧仍时有发生。笔者认为,或许可以从新闻中提炼出电信诈骗的特征信息,提醒家中的长辈和亲人,做到防患于未然。

  笔者以某新闻网站为平台,对电信诈骗相关新闻进行了提取分析,试图从获取的信息中分析出诈骗者的小“套路”。(PS:我曾经写过一篇文章,希望能给大家提供一个从新闻中建立模型的思路,不足之处请指正)

  1.开始采集

  获取信息,当然需要爬虫。这是我使用的库:

  笔者首先浏览了一个大型网站,在搜索栏中搜索了关于电信诈骗的新闻报道,但是在翻页过程中其url似乎没有变化,firefox也没有看到post和get。

  但是看了他那个页码的链接,还是有点激动,因为它的url里面收录

了totalPage=63&pageNum=2这两个内容,所以自己写url吧。

  Beautifulsoup 是一个强大的库,这里我从属性 a 获取源代码中的链接。至于request库,笔者发现urlopen打开的网站源码和requests+header的内容不一样,requests返回的网站源码更完整。

  接下来的步骤和上面的方法类似,然后采集

每个网站中的所有链接,写成一个列表,然后我们需要分析我们需要的网站的url的特征,使用正则表达式来获取链接, 并粘贴以下代码:

  拿到链接后,我们就可以浏览新闻了,应该也能得到新闻信息。

  

" />

  新闻有上万种类型,有图,无图,有视频,无视频,文中有图片链接,还有一大堆段落属性。当我读到它时,我真的很难过。让我们先抓住它并谈论它。

  笔者观察网站后,将其分为四类,有的是两张图片夹着文字,有的是纯文本等。笔者根据这些内容,使用Beautifulsoup对所有内容进行了爬取(Beautifulsoup实在是太强大了,强行安利一下)。当然,爬取的文本也是看不见的。幸运的是,我们只需要中文内容和数字。

  然后是正则表达式,因为用的是gbk编码,所以pattern=[0-9\x80-\xff]+,如果是utf-8就是pattern=[0-9\u4e00-\u9fa5]+,下面贴上代码:(PS:大家使用的时候一定要注意编码类型,这个很烦人。)

  由于一些需要,我还获取了文本的标题、作者、hash等。大家可以根据自己的需要爬取相应的内容。

  2.下来提取关键词

  为什么 python 是一种非常有用的脚本语言?因为集成了很多库,这里给大家介绍一下jieba的中文分词词库。点击阅读原文获取其地址。

  pip install jieba pip install jieba.analyse 这里笔者使用了jieba.analyse.extract_tags(a,topK=10)函数,a为文本内容的str变量,topK中出现频率较高的10个词,全部输入可用关键字列表,并粘贴源代码:

  python好用怎么样

  3. 关键词处理

  我们获得了每篇文章的top10关键词,小作者目前正在看《Python自然语言处理》这本书。

  

" />

  此处解释了文本功能。笔者认为,无论诈骗情况多么逼真,与真实情况总会有差异。例如,某些词的出现频率和位置会与普通文本不同,因此作者尝试对关键词的出现频率进行处理。

  我们之前获取的关键字是一个列表,里面有很多重复的词,所以我们需要先将列表转换为设置格式

  例如:

  <p>keyword1 = set(keyword)

  result = {}

  for key in keyword1:

  count = keyword.count(key)

  result[key] = count</p>

  如果你使用的是 python2.7,你可以

  from 采集

s import Counter,然后:

  作者暂时只写到这里。您还可以根据需要从文本中获取关键词的位置、类型、逻辑关系,构建诈骗类文本特征库。当然,这些都是另外一回事了。

  笔者目前正在朝这个方向努力。希望笔者能为大家提供处理电信诈骗*敏*感*词*的思路,与大家交流学习。(PS:一定要注意编码!!!)

  最后贴上我自己的结果:

  年未过,笔者在此也祝大家新年快乐,多多阅读Freebuf,涨知识。

  *原作者:西交边MR,本文属于FreeBuf原创打赏计划,未经允许禁止转载

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线