网站不良信息云检测系统支持自定义关键字策略规则
优采云 发布时间: 2021-05-16 04:11网站不良信息云检测系统支持自定义关键字策略规则
网站不良信息云检测服务使用网站不良信息云检测系统,该技术基于网络爬虫技术采集基于关键字匹配来主动获取Internet 网站系统内容数据(文本,图片),自然语言处理,智能图像识别,图像目标检测,样本图片匹配和识别以及其他技术手段,可帮助客户了解互联网网站系统(文本,图片)中收录的*敏*感*词*,政治信息,邪教迷信,欺诈性*敏*感*词*等)深入检测不良信息,准确定位,有效采集证据并及时发出警告
通过检测方法,可以满足不良信息监管的要求,提高了网站系统服务的“软质量”,防止了不良信息的隐患,履行了社会责任,避免了政治风险。
系统功能架构分为三层:网站数据采集,网站数据分析层和网站检测应用程序。
Ø网站数据采集
基于用户提供的网站域名,网站爬虫技术用于获取用户指定的受监视网站的URL钻取,网页文本和图像数据采集。
Ø网站数据识别
关键字匹配
基于系统预设的策略规则,用于标识30,000多个不良信息的关键字,关键字匹配和标识由采集器获得的网站文本数据,以及查找收录不良信息关键字网站文本内容的可疑不良信息。
系统支持添加自定义关键字策略规则。
自然语言处理
该系统配备了基于深度学习的自然语言处理技术。通过使用无监督数据训练词向量,提高了泛化能力,提高了不良文本信息的发现和发现率,弥补了关键词匹配预设策略不完整的不足,有效识别*敏*感*词*,淫秽,政治敏感和不良关键字策略以外的信息。
智能图像识别
该系统采用智能图像识别技术,通过连续训练大量相同类型的图像数据,并频繁进行迭代模拟,以形*敏*感*词*脑对相同类型/相似场景(例如*敏*感*词*场景,反恐怖分子的恐怖主义标志,特定的文字,特定的字符,特定的场景等)以检查网站图片,从而可以智能地识别相同类型/相似场景的图片,从而发现网站。
图像目标检测
系统使用目标检测技术来准确识别图片中出现的标志和徽标。目标检测技术可以准确地找到给定图片中对象的位置,并标记对象的类别。这项技术可以有效地识别网站中收录的特定目标图片(例如:非法标志,徽标)。
样本图像匹配识别
基于系统积累的5,000多个与政治相关的敏感样本图片建立的特征库,将采集获得的监视的网站图片与样本图片的特征库进行比较和分析,得出发现它们收录与政治相关的特征。敏感的图像内容。系统支持添加自定义样本图片。
Ø网站检测应用
提供系统监视策略的集中管理,可疑警报的手动审核,不良信息的集中管理,系统权限的集中管理等。