自动识别采集内容( 基于内容的网络水军检测方法及系统的社交网络识别)
优采云 发布时间: 2021-09-19 20:24自动识别采集内容(
基于内容的网络水军检测方法及系统的社交网络识别)
本发明涉及社交网络的网络海军识别领域,具体涉及一种网络海军的自动识别方法和系统,以实现社交网络中网络海军的更自动、更准确的识别
背景技术:
随着社交网络相关应用的快速发展,越来越多的活动转移到社交网络。社交网络通常包括国外的Facebook、Google+、twitter等以及国内的新浪微博、腾讯微博、人人网等,但目前社交网络中存在着大量的网络水资源。社交网络中的网络水资源通常有助于网络信息的传播或恶意攻击某些社交网络帐户。他们在政治和商业利益的驱使下,通过操纵软件机器人或海军账户,在互联网上制造和传播虚假意见和垃圾邮件,以达到影响网络舆论、扰乱网络环境等不正当目的。这些行为严重影响了社交网络用户体验,也带来了严重的安全问题
在现有的社交网络中,网络识别方法主要利用社交网络的消息内容。一种相对简单的基于内容的网络检测方法(k.lee,j.Caverley,ands.webb.《发现社交Pammers:socialhoneypots+machinelearning.InProcedingsofSigir》,2010)这是一个有监督的学习问题。这些方法从社交网络的消息内容中提取有效的文本特征来建立分类器。给定一个新用户,分类器将分类标签输出给j判断新用户是否是社交网络然而,这些方法通常需要大量的标记数据(这些数据通常是人工标记的),耗时费力,而且人工标记的数据集很小,这给社交网络中的网络检测带来了很大的挑战
技术实现要素:
由于以往的社会网络识别方法大多将其视为一个分类问题,需要使用大量的标记数据集,而标记数据需要大量的人力,且标记数据集的规模一般较小,训练模型的泛化能力较弱
基于此,本发明的目的是提供一种网络海军的自动识别方法和系统,该方法和系统不需要对数据集进行人工标注,避免了费时费力的标注工作,不需要模型训练,能够在社交网络中快速有效地识别网络海军劳动
鉴于上述缺点,本发明采用的技术方案为:
本发明涉及一种网络海军的自动识别方法,包括以下步骤:
1)采集社交网络中身份验证帐户的消息信息以及每条消息下的评论信息
2)监控上述每条消息下的每条评论信息是否被删除,如果是,则读取与评论信息对应的帐户历史记录中已删除评论的数量
3)如果上述账户历史记录中删除的评论数符合预设条件,则该账户为在线账户
此外,步骤1)包括以下步骤:
模拟1-1)社交网络用户登录
1-2)获取社交网络中的认证账号列表,采集获取每个认证账号的消息信息
1-3)获取每条消息下的消息列表和采集评论信息
此外,步骤1)中的认证账户是指社交网络正式认证的账户,认证账户的类型包括政府机构账户、国际组织账户、新闻媒体账户和个人账户
此外,在步骤1),消息信息包括但不限于消息URL、消息内容、消息发布时间、消息评论数量、消息转发数量和消息喜好数量;评论信息包括但不限于评论URL、评论内容、评论时间和评论用户
此外,如果步骤1)中的消息信息的释放时间超过一个月,则删除消息信息
此外,步骤2)如下:获取每条消息下评论信息的评论列表,监控评论列表中每个评论信息的删除;如果评论信息被删除,则读取评论信息对应账户的历史删除评论
此外,步骤3)中的预设条件包括:
1)da≫=10;其中Da表示帐户历史记录中已删除注释的总数
2)da/na>;=0.2;其中Na表示帐户上的评论总数
3)account历史记录中第一条删除的评论与最近一条删除的评论之间的时间间隔超过一周
本实用新型涉及一种网络海军自动识别系统,包括数据采集模块和海军识别模块
数据采集模块用于采集社交网络中认证帐户的消息信息以及每条消息下的评论信息
海军识别模块用于监控和区分上述信息和每条信息下的评论信息
此外,该系统还包括数据存储模块,用于存储上述消息信息和每条消息下的注释信息
此外,海军识别模块包括评论监控模块和海军识别模块
评论监控模块用于监控每条消息下的每条评论信息是否被删除,如果被删除,则读取该评论信息对应账户的历史删除评论数
海军识别模块用于确定上述账户的历史删除评论数是否符合预设条件,如果符合,则该账户为网络海军
传统的网络海军识别方法一般采用机器学习的监督学习方法,需要大量的标注数据集进行模型训练,这些数据集通常需要大量的人力进行标注,本发明提供了一种网络海军的自动识别方法和系统,该方法和系统具有以下特点:具有以下优点:
1、此方法和系统消除了手动标记和模型培训
2、该方法和系统能够快速有效地识别社交网络中的在线海军,即当账户评论信息历史记录中删除的评论数量满足预设条件时,确定该账户为在线海军
3、该方法和系统适用于多个社交网络,可以跨平台运行
图纸说明
图1是本发明提供的网络海军的自动识别系统的框图
图2是本发明提供的网络设备的自动识别方法的流程图
具体实施例
为了使本发明的上述特征和优点更加明显和易于理解,下面给出实施例,并结合附图给出详细描述
本发明提供了一种网络海军的自动识别方法和系统,见图1,该系统包括数据采集模块、数据存储模块和海军识别模块
数据采集模块用于采集社交网络中认证帐户的消息信息以及每条消息下的评论信息
数据存储模块用于存储每条消息下的消息信息和评论信息
海军识别模块用于监控和区分上述信息和每条信息下的评论信息
海军识别模块还包括评论监控模块和海军识别模块;评论监控模块用于监控每条消息下的每条评论信息是否被删除,如果被删除,则读取与评论信息对应的账户的历史删除评论;海军识别模块该模块用于判断该账户的历史删除评论是否符合预设条件,如果符合,则该账户为在线用户
本发明的方法主要包括两部分:
1)采集社交网络中认证账号下的用户消息:利用Ajax仿真技术模拟用户访问社交网络的方式,设计并实现了社交网络中用户消息的采集和存储,如图1所示,数据采集部分和数据存储部分获取了一些用户的消息信息通过采集在社交网络中验证帐户,并获取每条消息下的评论。验证帐户指社交网络正式验证的帐户(每个帐户对应一个用户).一般来说,认证账号的头像右下角标有V;用户消息是指用户在社交网络上发布的信息,具体包括消息内容、消息发布者、消息发布时间等
2)识别社交网络中的网络水军:使用评论监控模块实时监控每条消息下的评论信息,并通过与现有评论进行比较来监控评论的删除。如果