解决方案:CNVD - 5000w通用产品的收集方法

优采云 发布时间: 2022-10-20 00:28

  解决方案:CNVD - 5000w通用产品的收集方法

  挖了一个多月的cnvd,终于挖了3个洞,拿到了证书。这里跟大家分享一下资产信息采集的思路——如何快速找到符合cnvd证书条件的通用系统。

  我相信很多人一开始都和我一样。他们想获得证书,但他们无法开始。我希望这个 文章 可以解决你的一些烦恼。

  一是征集一些注册资本5000w的公司。可以使用爱奇查、奇查查等(提示:爱奇查最近有一个活动,可以免费获得一年会员),但是爱奇查导出速度慢,价格贵,可以选择查看。

  这里我以爱奇茶为例。搜索建议如下。除了查看注册资金5000w之外,还要查看软件版权和网站信息。如果您想采集更多,您可以取消选中这些,因为您只能导出一次。10,000条,所有资产信息可通过区域划分逐步导出。

  导出资产后,将公司名称复制到 txt 文本中。一开始我是手动把他们的公司名放在fofa上搜索,或者找某个技术支持,看看首url标题的数量能不能达到10个以上,如果超过10个,那可能是通用系统.

  或者如果独立IP数量较多,可能会有fofa自动推荐的通用系统。

  

  由于手动效率太慢,后来写了一个爬虫来解决。

  脚本的思路是判断站点标题是否达到15,如果能独立达到300,就写到正文中(不需要fofa会员)

  脚本缩短了部分公司名称,去掉了括号和*敏*感*词*的多余关键词,以防止这些多余的关键词与公司产品不匹配。

  同时,由于fofa在短时间内搜索到不同的关键词,会造成站点延迟错误,而且这个错误经常发生。过几天可能ip被fofa封了,解封后界面可能会限速(别问我怎么知道的)

  所以我这里使用ip代理池分享请求,使用github的免费代理池项目

  需要启动redis来配合代理池项目。具体使用见项目说明。项目启动后,可以配合如下爬虫脚本使用。

  脚本下载地址及使用:

  运行结果:

  

  导出结果:

  导出结果中的标题没有过滤菠菜站点的标题,可能需要手动区分。

  只要采集到一定数量的通用产品,接下来就是一个一个测试。我不会在这里过多地谈论渗透的想法。小心测试应该测试的地方。如果仍然不起作用,请更换它。一直以来,5000w的产品很多,有些孔其实也不难用。关键是你能否找到并采集到那个点。

  问题解答:

  脚本如何导入IP代理地址?

  作者:可以到proxy_pool的项目地址看大概步骤,下载代理池项目,然后启动redis服务,然后启动代理池项目:python proxypool.py schedule python proxypool.py server 启动后完成后,代理池会打开一个端口来下发代理ip。现在您可以通过使用 python 访问该端口来获取 ip。我已经在我的项目中写了所有这些。启动代理池项目后可以直接启动我。该项目已被爬取

  最后,祝各位高手好运,早日拿到证书。

  技巧:伪原创工具对SEO优化有效吗?

  对于SEO来说,每天写原创文章很无聊,但是如果网站不更新文章,排名就没有保障。因此,一些SEO人员专注于伪原创工具。事实上,伪原创工具已经存在,这种情况并不少见,尤其是近年来,人工智能也加入了伪原创大军。

  那么,伪原创 工具对 SEO 有效吗?

  一、伪原创工具的原理

  要知道伪原创工具是否有效,您首先需要了解它是如何工作的

  

  ① 同义词替换

  常用的伪原创工具用同义词代替,比如用today代替today,用搜索引擎优化代替seo等。其实这个伪原创工具已经过时了。搜索引擎可以很容易地分辨同义词之间的区别。搜索引擎通过对页面进行索引,将页面变成一组hash值,将同义词替换内容变成一组hash值。经过哈希值转换后,可以有效避免同义词,只保留原创指纹,所以这个伪原创工具无效,不使用。

  ② 解读

  一些人工智能伪原创工具真的可以在一个句子中做同样的事情,只是方式不同。事实上,大多数 AI 伪原创 都是假的。它们只能通过翻译软件重复翻译。如果相似度低,需要多次翻译,但可读性差。这种翻译可以适当地使用。

  ③人工智能创造

  

  也有真正的人工智能创作,比如百度人工智能,但仅限于创作一些固定格式的内容,比如股票信息、天气信息等,不能*敏*感*词*使用。

  2. 不同的需求

  但是,伪原创工具对SEO没有影响,不同的需求有不同的影响

  ① 批量创建

  当权重较高的网站需要维持或进一步提高其排名,需要大量内容时,可以使用互译伪原创工具创建批次文章。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线