基于人工智能自动阻止或提示软文广告的方法,系统和过程
优采云 发布时间: 2020-08-07 10:19
本发明涉及网络应用和人工智能技术领域,尤其是一种基于人工智能自动屏蔽或提示软文广告的方法和系统.
背景技术:
写得很广的广告通常是指公司计划在报纸,杂志,互联网或其他促销媒体上发布的一些促销和解释性文章,这些文章可以增强公司的品牌形象和知名度,或者可以促进公司销售,包括特定新闻报告,深入的文章,付费的简短广告,案例研究等. 软文通常是指收录软宣传的所有文本内容. 与刚性广告相比,它是由企业的营销计划者或广告公司的广告撰稿人撰写的“文字广告”. 与硬性广告相比,软性文字被称为软性文字的原因在于“软性”一词的微妙之处,就像隐藏在棉花中的针头一样,该针头没有被暴露,从而击败了看不见的人. 当您发现它是一个软文时,您已经被冷落了. 进入精心设计的“软广告”的陷阱.
在当前的网络环境中,在线广告逐渐成为在线广告的主流载体. 同时,由于其强大的影响力和传播能力,它们对消费者群体的影响是巨大的,目前的在线媒体平台为了保护自己的利益,基本上对广告采取放任自流的态度. 消费者群体迫切需要通过技术手段有效地过滤和阻止在线软文.
技术实现要素:
本发明的技术任务是解决上述缺点,并提供一种基于人工智能自动屏蔽或提示软文广告的方法和系统,可以有效地区分和屏蔽软文广告,并减少上网时用户受到软文广告的干扰. 节省时间.
本发明为解决其技术问题而采用的技术方案是:
基于人工智能的自动阻止或提示软文广告的方法. 该方法通过设置拦截软件获取网页主要文本的文本内容,并通过自然语言分析卷积神经网络对获取的文本内容进行分类;
通过自然语言分析和卷积神经网络分类预测,将正文中收录广告内容的网页定义为软文文章;
根据设置,定义为软文的网页无法打开,或者在打开后的明显位置标记为软文.
在使用之前,对其中描述的自然语言分析卷积神经网络进行了训练,并设置了区分软文文章的标准. 使用时,它会根据用户的标记进行培训和更新.
具体来说,此方法的实现步骤如下:
所述拦截软件在用户点击链接后预先扫描网页内容,并通过html标签获取网页主体的内容,包括文本内容和图像内容;
将获取的网页主要内容的文本部分保存为待处理数据,并通过图像转换文本软件对网页的图像部分进行转换,并将图像转换的文本也存储在要处理的数据;
对要处理的数据进行预处理以满足卷积神经网络的输入要求,并将预处理后的数据用作卷积神经网络的输入数据,以进行自然语言分析;
利用卷积神经网络进行自然语言分析,确定网页内容是否为软广告;
如果确定是软文广告,则将根据用户设置阻止该网页,或者在加载网页时添加软文广告徽标,以提醒用户注意.
优选地,数据预处理使用正则表达式从要处理的数据中删除不满足神经网络输入要求的数据,展平数据并重新分配权重.
此外,不满足神经网络输入要求的数据包括数字,符号和英语.
优选地,数据处理还包括分词和词频计算.
具体地,当自然语言分析卷积神经网络对数据进行分析时,设置广告成分阈值,由卷积神经网络进行的自然语言分析获得广告成分在数据中的比例. 当比例超过全部如果达到阈值,则确定网页的内容是软广告.
本发明还公开了一种基于人工智能的自动屏蔽或提示软文广告的系统,包括数据采集模块,数据分析模块,数据处理模块和自然语言分析模块,
数据采集模块,用于获取网页的正文内容,包括文本内容和图像内容;
数据分析模块,用于对数据采集模块采集的网页内容进行分析,并将文本内容直接发送至数据处理模块;图像内容被转换为文本并发送到数据处理模块;
数据处理模块用于从待处理数据中删除不符合自然语言分析模块的元素,将数据展平并重新分配权重;
自然语言分析模块通过卷积神经网络获取广告成分在数据中所占的比例,并将其与阈值进行比较. 当广告成分所占比例超过阈值时,确定网页内容为软文广告并被处理.
具体来说,数据处理模块使用正则表达式删除要处理的数据中的数字,符号和英文.
此外,数据处理模块的数据处理还包括分词和词频计算.
此外,该系统还包括一个用户定义的模块,该模块用于设置被判定为软文广告的网页,阻止该网页或在该网页上添加醒目的徽标,并解释和提醒用户软文字广告.
与现有技术相比,本发明基于人工智能的自动屏蔽或提示软文广告的方法和系统具有以下有益效果:
此方法可以使用户有效区分或阻止软文广告,减少对广告的干扰程度,提醒用户正在浏览收录广告的文章,防止广告主的心理策略和以消费为导向的灌输,并保持用户的自由选择权获取信息的权利和公平性.
通过使用该系统来确保用户的互联网环境,识别网页中的软文广告,有效地识别和判断网络软文,根据用户设置将其屏蔽或在显眼位置进行标记,有效地保护权利消费者.
图纸说明
图1是本发明基于人工智能自动阻止或提示软文广告的系统*敏*感*词*.
具体的实现方法
下面将结合具体实施例进一步描述本发明.
基于人工智能的自动阻止或提示软文广告的方法. 该方法设置了阻止软件,该阻止软件在用户浏览网页之前获取网页的文本内容,并将获取的文本内容通过自然语言分析传递. 产品神经网络进行分类;
通过自然语言分析和卷积神经网络分类预测,将正文中收录广告内容的网页定义为软文文章;
根据设置,定义为软商品的网页无法打开,或者在打开后的明显位置被标记为软商品. 这样可以保证用户上网质量,减少广告干扰,为用户节省时间,保证用户的网络环境.
在使用之前,对其中描述的自然语言分析卷积神经网络进行了训练,并设置了判断软文文章的标准. 使用时,它会根据用户的标记进行持续培训和更新. 通过使用卷积神经网络,可以确保随着广告的不断创新实时地优化广告的识别,并不断优化网络环境以确保用户的权利.
具体来说,此方法的实现步骤如下:
用户单击链接后,网页内容首先由阻止软件加载,以预先扫描网页内容. 拦截软件通过html标签获取网页的主要内容,包括文本内容和图像内容.
将获取的网页主要内容的文本部分保存到待处理的数据中,并通过图像转文字软件转换网页主体的图像部分. 图像到文本软件的选择没有限制. 可以实现此功能. 可以使用所有软件,并且将从图片转换成的文本也存储在要处理的数据中.
然后,通过各种技术手段对要处理的数据进行预处理,使其满足卷积神经网络的输入要求. 预处理后的数据用作卷积神经网络的输入数据,用于自然语言分析;预处理包括但不限于通过正则表达式删除要处理的数据中不满足神经网络输入要求的数据,展平数据,重新分配权重,分词,计算词频等. ,不符合神经网络输入要求的数据包括数字,符号和英语.
预处理数据将用作卷积神经网络的输入数据,以进行自然语言分析. 卷积神经网络执行的自然语言分析将确定网页的内容是否为软文字广告. 这里应该注意的是,卷积神经网络只是自然语言分析和结论的一种方法. 这是一项众所周知的技术,为此目的的卷积神经网络的详细建模方法也不会脱离本发明的保护范围.
当自然语言分析卷积神经网络分析数据时,设置广告成分阈值,然后由卷积神经网络执行的自然语言分析获得广告成分在数据中的比例. 当比例超过阈值时,确定网页内容为软文广告.
如果被判断为软文字广告,则根据用户设置,阻止访问该网页,或在加载网页时添加醒目的软文字广告徽标,并说明和提醒该软文字的性质文字广告.
<p>在本发明的另一个实施例中,一种基于人工智能的自动屏蔽或提示软文广告的系统,该系统包括数据采集模块,数据分析模块,数据处理模块和自然语言分析模块. ,其中