稿件采集( 一种新闻稿件的编辑方法及新闻字符串系统的实现要素)

优采云 发布时间: 2022-03-27 10:13

  稿件采集(

一种新闻稿件的编辑方法及新闻字符串系统的实现要素)

  

  本发明涉及电子信息技术领域,具体涉及一种稿件撰写机器人,尤其是一种新闻稿编辑方法及新闻稿稿件撰写机器人系统。

  背景技术:

  随着电子信息技术的发展,新闻工作越来越接近互联网的发展。现有的互联网新闻主要是人工录入和转载。目前的新媒体和自媒体的发展速度越来越快,但随着侵权事件的发生越来越多,现有的新闻稿主要是人工录入的。对于新媒体和自媒体来说,效率慢,侵权更严重。

  技术实施要素:

  有鉴于此,本发明的主要目的在于提供一种新闻文章编辑方法和一种新闻文章撰写机器人系统。

  它采用的技术方案有:

  一种新闻稿编辑方法,包括以下步骤:

  访问互联网上的新闻页面;

  将获取到的新闻网页通过加载模块上传给写稿机器人;

  书写机器人通过内置的采集模块获取网页中的字符串;

  确定符合预设规则的字符串;

  通过处理模块对符合预设规则的字符串进行处理,处理模块用于对符合预设规则的字符串进行识别和语义分析,得到符合预设规则的字符串的“时间”和“位置”规则。, "person", "event" 键字符串;

  通过写作模块加载词库、语义字符库和关键字符串生成新闻文章字符串,

  调用排序模块对新闻文章字符串进行排序;

  调用修正模块对排序后的新闻文章字符串进行修正;

  通过字符串转换模块转换输出形成新闻文章。

  进一步,通过以下步骤确定符合预设规则的字符串:通过设置过滤模块对采集模块获取的网页中的字符串进行过滤,过滤掉音频、视频、图片和链接。字符串组;通过排序模块对过滤后的字符串进行基本排序,通过修正模块对基本排序字符串进行修改,得到符合预设规则的字符串。

  此外,还包括将修改后的新闻文章字符串存储在语义字符库中。

  进一步地,处理模块对符合预设规则的字符串进行识别和语义分析的步骤如下:

  识别符合预设规则的字符串,包括:

  判断是否收录字符串特征“时间”;

  判断是否收录字符串特征“location”;

  判断是否收录“person”的字符串特征;

  判断是否收录“event”的字符串特征;

  对识别出的字符串特征进行语义分析,包括:

  “时间”的字符串特征的重复性和顺序性;

  “位置”的字符串特征的重复性和顺序;

  “人”的字符串特征的重复性和顺序,以及人的描述特征;

  “事件”关键词的字符串特征的重复性、流行度和频率。

  进一步地,写作模块生成新闻文章字符串的步骤如下:

  步骤1)加载词库、语义字符库和关键字符串;

  步骤2)是将关键字符串按照“时间”、“地点”、“人”、“事件”的顺序进行排序,形成新闻稿初稿字符串组;

  步骤3)是通过词库填写构成新闻稿初稿的字串组;

  步骤4)通过语义字符库对上述填词进行分析判断分析;

  Step5)Repeat Step3), Step4) 进行多个循环。

  本发明还提供了一种撰写新闻文章的机器人系统,包括加载模块、采集模块、过滤模块、处理模块、语义字符库、写作模块、排序模块、校正模块。 ,一个转换模块和一个规则库,在,

  加载模块用于上传新闻网页;

  采集 模块用于获取新闻网页中的字符串;

  规则库用于设置和存储预设规则;

  语义字符库用于存储生成的语义字符,并将语义字符库加载到书写模块;

  排序模块用于对新闻文章字符串进行排序或通过排序模块对过滤后的字符串进行基本排序;

  修正模块用于对排序后的新闻文章字符串进行修正或修改基本排序后的字符串,通过修正模块得到符合预设规则的字符串;

  过滤模块用于过滤掉音频、视频、图片和链接字符串组,

  处理模块用于对符合预设规则的字符串进行处理,对符合预设规则的字符串进行识别和语义分析,得到“时间”、“地点”、“人”、“事件”的关键字符串";

  加载模块用于加载词库、语义字符库和关键字符串,生成新闻文章字符串。

  本发明提供了一种写稿机器人,可以通过自学习获取关键字符,分析新闻文章的字符信息,形成新的新闻稿,并且通过长期的自学习也可以不断改进技术。

  图纸说明

  图1为本发明的架构原理图;

  无花果。图2为本发明的配置流程图。

  详细说明

  下面结合附图和具体实施例对本发明进行详细说明。本发明的示例性实施例和描述用于解释本发明,但并不用于限制本发明。

  如图1至图2所示,本发明公开了一种新闻文章的编辑方法,其特征在于,包括以下步骤:

  访问互联网上的新闻页面;

  101、将获取的新闻网页通过加载模块上传给写稿机器人;

  102-书写机器人通过内置的采集模块获取网页中的字符串;

  103-确定符合预设规则的字符串;具体地,通过以下步骤确定符合预设规则的字符串: 通过设置过滤模块对采集模块获取的网页中的字符串进行过滤,并对字符串进行过滤。除了音频、视频、图片和链接字符串组;排序模块对过滤后的字符串进行排序,校正模块对基本排序后的字符串进行校正,得到符合预设规则的字符串。

  104、通过处理模块对满足预设规则的字符串进行处理,处理模块用于对满足预设规则的字符串进行识别和语义分析,得到待处理的“时间”、“时间”和“时间”。符合预设规则的字符串。“位置”、“人”、“事件”的关键字符串;处理模块对符合预设规则的字符串进行识别和语义分析的步骤如下:

  识别符合预设规则的字符串,包括:

  判断是否收录字符串特征“时间”;

  判断是否收录字符串特征“location”;

  判断是否收录“person”的字符串特征;

  判断是否收录“event”的字符串特征;

  对识别出的字符串特征进行语义分析,包括:

  “时间”的字符串特征的重复性和顺序性;

  “位置”的字符串特征的重复性和顺序;

  “人”的字符串特征的重复性和顺序,以及人的描述特征;

  “事件”关键词的字符串特征的重复性、流行度和频率。

  105、通过写作模块加载词库、语义字符库和关键字符串生成新闻文章串,写作模块生成新闻文章串的步骤如下:

  步骤1)加载词库、语义字符库和关键字符串;

  步骤2)是将关键字符串按照“时间”、“地点”、“人”、“事件”的顺序进行排序,形成新闻稿初稿字符串组;

  步骤3)是通过词库填写构成新闻稿初稿的字串组;

  步骤4)通过语义字符库对上述填词进行分析判断分析;

  Step5)Repeat Step3), Step4) 进行多个循环。

  106-调用排序模块对新闻文章字符串进行排序;

  107-调用修正模块对排序后的新闻文章串进行修正;

  108 - 通过字符串转换模块转换输出形成新闻文章。

  本发明还提供了一种撰写新闻文章的机器人系统,包括加载模块、采集模块、过滤模块、处理模块、语义字符库、写作模块、排序模块、校正模块。 ,一个转换模块和一个规则库,在,

  加载模块用于上传新闻网页;

  采集 模块用于获取新闻网页中的字符串;

  规则库用于设置和存储预设规则;

  语义字符库用于存储生成的语义字符,并将语义字符库加载到书写模块;

  排序模块用于对新闻文章字符串进行排序或通过排序模块对过滤后的字符串进行基本排序;

  修正模块用于对排序后的新闻文章字符串进行修正或修改基本排序后的字符串,通过修正模块得到符合预设规则的字符串;

  过滤模块用于过滤掉音频、视频、图片和链接字符串组,

  处理模块用于对符合预设规则的字符串进行处理,对符合预设规则的字符串进行识别和语义分析,得到“时间”、“地点”、“人”、“事件”的关键字符串";

  加载模块用于加载词库、语义字符库和关键字符串,生成新闻文章字符串。

  例子

  本发明提供新闻稿。

  “2011年9月3日,小明在自家后院种了一棵树。[附图]在小明的照料下,这棵树茁壮成长,枝叶繁茂。[附图]5年后,小明的父亲砍掉了这棵树。建造一个宠物屋[附照片]。”

  第一步:获取新闻稿网页;

  第二步:通过加载模块将网页上传到写稿机器人,

  第三步:通过设置过滤模块过滤采集模块得到的网页中的字符串,过滤掉[附一张照片]链接的字符串组;

  过滤后的字符串根据排序模块进行排序。“2011年9月3日,小明在自家后院种了一棵树。几年后,小明的父亲砍掉了这棵树,建了一个宠物屋。”

  通过修正模块修正基本排序后的字符串,得到符合预设规则的字符串;

  “2011年9月3日,小明在自家后院种了一棵树。五年后,小明的父亲砍掉了这棵树,建了一个宠物屋。”

  第四步:通过处理模块对满足预设规则的字符串进行处理,处理模块用于对满足预设规则的字符串进行识别和语义分析,得到满足预设规则的字符串的“时间”。、“位置”、“人”和“事件”键字符串;处理模块对符合预设规则的字符串进行识别和语义分析的步骤如下:

  识别符合预设规则的字符串,包括:

  确定是否收录“时间”的字符串功能;“2011 年 9 月 3 日”、“5 年后”、

  确定是否收录“位置”的字符串特征;“自己的家”、“后院”、

  判断是否收录“person”的字符串特征;“小明”、“父亲”、

  确定是否收录字符串特征“event”;“种了一棵树”,“砍掉了这棵树”,“建了一个宠物屋”。

  对识别出的字符串特征进行语义分析,包括:

  “时间”的字符串重复性和顺序;“2011年9月3日”确定为第一个,“5年后”确定为最后一个。

  “位置”的字符串重复性和顺序;先确定“自己的家”,再确定“后院”。

  “字符”的字符串特征的重复性和顺序,以及字符的描述特征;“小明”、“父亲”、

  “事件”关键词的字符串特征的重复性、流行度和频率。

  “种了一棵树”,“砍掉了这棵树”,“建了一个宠物屋”。

  第五步,通过写作模块加载词库、语义字符库和描述的关键字符串生成新闻文章字符串,写作模块生成新闻文章字符串的步骤如下:

  步骤1)加载词库、语义字符库和关键字符串;

  步骤2)是将关键字符串按照“时间”、“地点”、“人”、“事件”的顺序进行排序,形成新闻稿初稿的字符串组;即“2011年9月3日”、“5年后”、“我自己的家”、“后院”、“小明”、“父亲”、“种了一棵树”、“砍掉这棵树”、“建宠物屋”。

  步骤3)是通过词库填写构成新闻稿初稿的字串组;

  步骤4)通过语义字符库对上述填词进行分析判断分析;

  Step5)Repeat Step3), Step4) 进行多个循环。

  第六步:调用排序模块对新闻文章字符串进行排序;

  步骤7:调用修正模块对排序后的新闻文章字符串进行修正;

  第八步:通过字符串转换模块转换输出形成新闻文章。

  “小明的爸爸把小明五年前种的一棵树砍下来,做了一个宠物房。”

  以上对本发明实施例公开的技术方案进行了详细介绍。本文通过具体实施例对本发明实施例的原理和实现方式进行说明。以上实施例的描述仅用于帮助理解本发明实施例。同时,对于本领域的普通技术人员来说,根据本发明的实施例,其具体实施方式和应用范围将会有所变化。综上所述,本说明书的内容不应视为对本发明的限制。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线