本发明的一种网页内容识别方法及系统实现要素
优采云 发布时间: 2021-03-31 23:22
本发明的一种网页内容识别方法及系统实现要素
本发明涉及互联网技术领域,尤其涉及一种识别网页内容的方法和系统。
背景技术:
作为重要的信息传播和传播媒介,互联网正以惊人的速度不断发展和壮大。互联网虽然具有速度快和信息量大的特点,但它也具有许多特点,例如动态性,开放性,互动性,匿名性和异性。结果,到目前为止,还没有一个网络管理机构来传播有关它的信息。当前的监管状态已导致充斥着各种敏感的网页,例如*敏*感*词*,*敏*感*词*,暴力,邪教等。因此,研究和开发适用于的自动识别和过滤技术将阻止日益增长的趋势。有效地检测和过滤敏感信息已成为网络信息安全的重要研究课题。
人们搜索页面时,经常会弹出一些错误的网页。这些网页一旦进入计算机,将浪费大量存储资源,容易导致计算机系统卡住,并且很容易单击内容,最终将导致系统崩溃。损坏或入侵我们的计算机将最终降低计算机的安全性。因此,如何安全地识别网页内容并隔离不必要的网页对于提高网络安全性尤为重要。
技术实现要素:
本发明的目的是提供一种用于识别网页内容的方法和系统,以解决现有技术的上述缺点。通过预先认证Web开发客户的安全性,并在创建网页时将特定符号添加到网页的相应URL,然后在用户使用特征符号下载时(用于识别网络内容时),网络内容已预先判断网站安全吗?一旦安全,就可以对网络内容进行识别,最终解决了在真实意义上难以识别当前网络内容安全性的问题,最终实现了对网络内容的安全识别,隔离了不必要的网页。最终提高网络安全性。
为了达到上述目的,本发明设计的网页内容识别方法具体包括以下步骤:
a)预先生成两个可下载的网络数据包,这两个数据包都收录一个特定的符号;其中一个网络数据包用作网络内容设计者的创建包,另一个网络数据包用作网络用户的包。创建包需要客户注册,然后他们才能看到其中的特定符号。包装中的特定符号已加密;
b)用户在可以连接到网络的相应终端中下载使用包,创建者在可以连接到网络的相应终端中下载创建包;并注册为安全的Web开发客户,并生成注册的帐户和密码;
c)根据注册的帐号和密码登录,即可获得在移动终端下载的特定符号来创建套餐;
d)在开发网页和网页内容时,安全网页开发的客户会在创建包中向网页URL添加特定符号;指示该网页内容是安全的网页内容;
e)当用户需要打开相应的网页时,系统会自动获取该网页的所有网址,并将下载的用户包中的特定符号与该网页上的特定符号进行比较。如果它们匹配,则说明网络内容。为了安全起见,此时请删除网页中的特定符号,并立即跳转至该网页对应的内容以快速识别;如果标识不匹配,将立即显示。网页内容不安全,禁止打开。
此外,在步骤d中,将特定符号添加到网页URL的末尾。
进一步,在步骤b中,在创建安全的网页开发客户端时,根据创建的帐号和密码自动生成QR码,并将对应的帐号和QR码发送给安装了对应创建包的移动终端。在步骤c中,将所创建的账户,密码和对应的QR码与移动终端进行比较。一旦这三个相同,创建包中的特征符号将被安全的Web开发客户端立即使用。
本发明还公开了一种网页内容识别系统,包括使用该网页内容识别方法,还包括以下模块:
用于存储下载的数据和已发送的数据的数据存储库,
用于获取网络URL的获取模块,
用于比较数据库中数据的比较模块,
用于删除安全URL中特定符号的删除模块,
获取模块和数据存储单元分别连接到比较模块,比较模块连接到移除模块。识别网络地址通过获取模块获取,然后发送给对应的比较模块,比较模块发送对应的数据库。将网站中的特征符号与获取的网站进行比较。比较成功后,立即将网站发送到删除模块,并通过删除模块删除网站中的特征符号,并最终由相应的浏览器打开以标识网络内容。
此外,它还包括一个二维代码比较模块,该模块用于将正确的二维代码与数据存储库中的二维代码进行比较,以确定该客户是否是安全的Web开发客户。
本发明所获得的用于识别网页内容的方法和系统,其通过预先认证网页开发客户端的安全性,并在创建网页时将特定符号添加到网页的相应URL中,然后下载特征符号在用户内部,当用于识别网络内容时,预先判断网络内容的网站是否安全。一旦安全,就可以识别网络内容,最终解决了难以真正识别当前网络内容安全性的问题。
图纸说明
图1是本实施例中的Web内容识别方法的示意性流程图。
图。图2是本实施例中的网页内容识别的结构*敏*感*词*。
在参考符号中:1.数据存储库; 2.采集模块3.比较模块; 4.拆卸模块; 5.二维码比较模块。
具体的实现方法
下面将参考附图和实施例进一步描述本发明。
示例:
如图1、和图2所示,本实施例提供的Web内容识别方法具体包括以下步骤:
a)预先生成两个可下载的网络数据包,这两个数据包都收录一个特定的符号;其中一个网络数据包用作网络内容设计者的创建包,另一个网络数据包用作网络用户的包。创建包需要客户注册,然后他们才能看到其中的特定符号。包装中的特定符号已加密;
b)用户在可以连接到网络的相应终端中下载使用包,创建者在可以连接到网络的相应终端中下载创建包;并注册为安全的Web开发客户,并生成注册的帐户和密码;
c)根据注册的帐户和密码登录,以获取在移动终端中下载的特定符号以创建软件包;
d)在开发网页和网页内容时,安全网页开发的客户会在创建包中向网页URL添加特定符号;指示该网页内容是安全的网页内容;
e)当用户需要打开相应的网页时,系统自动获取该网页的所有网址,并将下载的用户包中的特定符号与该网页上的特定符号进行比较。如果它们匹配,则说明网络内容。为了安全起见,此时请删除网页中的特定符号,并立即跳转至该网页对应的内容以快速识别;如果标识不匹配,将立即显示。网页内容不安全,禁止打开。
此外,在步骤d中,将特定符号添加到网页URL的末尾。
进一步,在步骤b中,在创建安全的网页开发客户端时,根据创建的帐号和密码自动生成QR码,并将对应的帐号和QR码发送给安装了对应创建包的移动终端。在步骤c中,将所创建的账户,密码和对应的QR码与移动终端进行比较。一旦这三个相同,创建包中的特征符号将被安全的Web开发客户端立即使用。
本实施例还公开了一种网页内容识别系统,包括使用上述网页内容识别方法,还包括以下模块:
数据存储库1,用于存储下载的数据和发送的数据,
获取模块2以获得网络URL,
比较模块3,用于比较数据库中的数据,
删除模块4,用于删除安全网址中的特定符号,
获取模块2、数据仓库1分别与比较模块3连接,比较模块3与删除模块4连接,通过获取模块2获取标识网络地址,然后发送至比较模块3将对应数据库中的特征符号与获得的URL进行比较。一旦比较成功,立即将网站发送到删除模块4,删除模块4删除URL中的特征符号,最后打开相应的浏览器,即可识别Web内容。
此外,它还包括一个二维代码比较模块5,用于将正确的二维代码与数据存储库1中的二维代码进行比较,以确定客户端是否是安全的网页开发客户端
通过预先认证网页开发客户端的安全性,并在创建网页时在网页的相应URL中添加特定符号,然后在用于识别网络内容的用户内部下载特征符号,预先判断网络内容网站是否安全,一旦安全就可以识别网络内容,最终解决了真正意义上识别当前网络内容安全性的难题。 ,最终实现了对网页内容的安全识别,并删除了不必要的网页。隔离并最终提高网络安全性。