事实:读者来信｜想了解新技术，如何搜集专利情报关键词？

优采云发布时间: 2022-11-18 09:17

　　作者丨齐海洋

　　写在最上面：我们最近开通了“读者来信”。如果您在工作中也遇到专利和研发相关的问题，欢迎您在后台留言或发问题给我们。我们将有资深的行业分析师，智慧芽学院的老师们会定期选择回答您的一些问题。

　　【本期读者来信】

　　老师您好，我们公司专注于手机硬件的研发。为了适应市场的需要，我们要开发新的手机天线。我们知道，目前市场上最流行的是苹果的框缝天线，兼顾了美化和扁平化结构的优点。那么，为了尽快了解目前这项技术的发展趋势，我司研发人员应该如何快速搜集资料，找到这些技术资料呢？

　　1个

　　今天，智芽学院齐海洋老师就来和大家聊一聊这个问题。

　　专利信息一般通过专利检索获得。做好专利检索可以说是专利情报预警分析、挖掘布局或管理运营的基础和关键。

　　当我们面对一个相对陌生的技术领域时，能够快速准确地找到合适的关键词是实现快速高效检索的捷径。这条捷径帮助技术研发人员提高信息检索的针对性，掌握技术发展现状，为企业项目研发方向的确定提供有价值的参考，甚至为企业产品推向市场发展、稳定市场保驾护航。

　　因此，快速准确地获取关键词的重要性不言而喻。

　　2个

　　今天我们通过智慧芽系列产品介绍三种常见的关键词采集方式：

　　1. 关键词助理

　　它基于微软的bing智能语义检索实现的关键词智能过滤。登录智慧芽搜索页面后，点击搜索页面“所有字段”填写框后面的关键词助手按钮，在弹出框中输入相关词。

　　比如这里我们在框架槽天线主题中输入“天线”，然后直接分析。这时候会弹出很多语义相关的词供我们选择，我们可以从中选择更贴近或者更真实的表达方式。

　　这里我们选择与天线相关度高、匹配度高的词：

　　比如：microstrip line, microstrip, trace，点击选中，再次点击过滤，后台会根据我们选择的这些词做进一步的索引处理，推送更多相关的词，这时候你会发现更多的“微” With patch, microstrip antenna, strip line”其实是框架缝隙天线非常相关的表达方式；

　　关键词助手除了选择近词过滤外，还支持逆向删除：

　　如果有些词非常不相关，我们可以双击该词，此时该词的背景颜色会被标记为红色。再次过滤时，背景会自动避开红色标记的词。在关键词助手的帮助下，我们可以对关键词进行一个比较初步的了解和筛选。

　　2. 大概的文献回顾

　　除了直接使用关键词助手，还可以关键词通过查找类似的专利文献来聚焦。如果文档的主题是“Bezel Slot Antennas”，则必须有一个与该主题密切相关的关键词。

　　第 1 步：简单搜索

　　在全文字段中键入“frame slot antenna”。虽然这里的表述非常具体和详细，但是最容易获得非常相似的相关文档。浏览附图后发现，这些专利都是关于这个主题的非常具体的相关文件。查阅和整理这些专利后，可以快速采集到合适的关键词。

　　第二步：相似专利索引

　　在上一步的基础上，如果你想找到更多相似的专利进行筛选，当你阅读一个非常相关的文献时，你可以在该专利文献的专利详情页面点击页面左侧的“相似专利”查看智能语义分类的一系列相关专利文献进一步采集。

　　第三步：语义检索

　　如果我们已经掌握了相关关键词的更具体的特征，比如该主题近200字的文字描述，我们可以选择智慧芽首页提供的“语义搜索”模块，直接搜索将这些描述性特征放到智能语义搜索模块中，点击搜索，系统会直接匹配相似的文档，这也是一种比较快捷的方法。

　　3、统计分析

　　在做一些大型分析项目时，对全面性的要求往往高于对准确性的要求，一般需要进行统计分析，以获得更全面的数据情报。

　　这里仍然以框槽天线为例，在智能芽产品的Insights中编辑“框槽天线”查询创建技术报告。

　　选择科技报告左侧“创新词云”导航栏，系统自动生成关键词标签云图和圆形图表。这些关键词涉及到很多与该主题相关的专利文献关键词的智能统计，可以为技术主题分析提供全面的关键词情报。

　　如果行业内某个特定技术领域存在巨头，我们也可以针对该领域的个别巨头公司进行单独统计分析。

　　例如，我们了解到苹果公司是框架槽天线技术的先驱，并且发展良好。这时候我们可以通过Smart Buds的3D地图来分析苹果的相关专利。打开3D图，输入Apple关于天线场的搜索公式：(border) AND (AN:(apple orapple) OR AN_ST:(apple or apple) OR ANC:(apple or apple) ），生成专利图，点击在地图选项卡上在网上找到对应的框槽天线模块，筛选相关专利，通过对行业巨头的了解，更直接、更全面地获取相关情报信息。

　　已经购买智慧芽数据库产品的客户，可以到智慧芽学院（）的“客户专区”栏目，学习齐海洋老师的完整视频教程。其他同学也可以在慧芽学院学习专利情报相关的其他课程（）。

　　扫描二维码免费试用智慧芽所有产品

　　通过关键词助手，文献查阅，统计分析

　　快速采集专利信息

　　解读:如何采集微信公众号历史消息页的详解

　　微信公众号文章采集的录入历史新闻页面的获取方式我已经给大家讲解过了，有需要的朋友可以参考此内容。

　　采集微信文章和采集网站的内容是一样的，都需要从列表页开始。而微信文章的列表页就是公众号里的查看历史新闻页。网上其他一些微信采集器现在都用搜狗搜索，采集虽然方法简单多了，但是内容不全。所以我们还是要采集来自最规范最全面的公众号历史新闻页面。

　　由于微信的限制，我们复制的链接不完整，无法在浏览器中打开内容。所以我们需要使用anyproxy通过上一篇文章介绍的方法获取微信公众号历史新闻页面的完整链接地址。

　　%2BBoEMdPDBtOun1F%2F9ENSz&wx_header=1

　　上一篇文章文章中提到，biz参数是公众号的ID，uin是用户的ID。目前uin在所有公众号中是唯一的。另外两个重要参数key和pass_ticket在微信客户端是辅助参数。

　　所以在这个地址过期之前，我们可以通过在浏览器中查看原文，得到历史消息的文章列表。如果我们要自动解析内容，我们也可以做一个程序保存key和提交pass_ticket的链接地址，然后通过php程序获取文章列表，例如。

　　最近有朋友告诉我，他的采集目标是做一个公众号，所以我觉得没必要用上一篇文章写的批量采集方法。那么我们来看看如何获取历史新闻页面中的文章列表。通过分析文章列表，我们可以得到这个公众号的所有内容链接地址，然后采集内容就可以了。

　　在anyproxy web界面，如果证书配置正确，可以显示https的内容。Web界面的地址是：8002 其中localhost可以换成你自己的IP地址或域名。从列表中找到以getmasssendmsg开头的记录，点击后右侧会显示这条记录的详细信息：

　　红框部分为完整链接地址。前面拼接微信公众平台的域名后，就可以在浏览器中打开了。

　　然后将页面下拉到html内容的末尾，我们可以看到一个json变量就是文章历史消息列表：

　　我们复制msgList的变量值，用json格式化工具分析，可以看到json有如下结构：

　　{

"list": [

{

"app_msg_ext_info": {

"author": "",

"content": "",

"content_url": "http://mp.weixin.qq.com/s?__biz=MzA5MzEzNDg3MQ==&mid=2652767427&idx=1&sn=37da0d7208283bf90e9a4a536e0af0ea&chksm=8b882dbbbcffa4ad2f0b8a141cc988d16bace564274018e68e5c53ee6f354f8ad56c9b98bade&scene=4#wechat_redirect",

"copyright_stat": 100,

"cover": "http://mmbiz.qpic.cn/mmbiz/MofBAcBsJ6X0xGrQ2XK5yQjzwb2eswxkRNBTgLtcqGziaFqwibzvtZAHCDkMeJU1fGZHpjoeibanPJ8rziaq68Akkg/0?wx_fmt=jpeg",

"digest": "擦亮双眼，远离谣言。",

"fileid": 505283695,

"is_multi": 1,

"multi_app_msg_item_list": [

{

"author": "",

"content": "",

<p>

"content_url": "http://mp.weixin.qq.com/s?__biz=MzA5MzEzNDg3MQ==&mid=2652767427&idx=2&sn=449ef1a874a37fed2429e14f724b56ef&chksm=8b882dbbbcffa4ade48a7932cda4263687e34fca8ea3a5a6233d2589d448b9f6130d3890ce93&scene=4#wechat_redirect",

"copyright_stat": 100,

"cover": "http://mmbiz.qpic.cn/mmbiz_png/MofBAcBsJ6XyaIn0qEDSSicBUBZbMYHYrhibia89ZnksCsUiaia2TLI1fyqjclibGa1hw3icP6oXeSpaWMjiabaghHl7yw/0?wx_fmt=png",

"digest": "12月28日，广州亚运城综合体育馆，内附购票入口~",

"fileid": 0,

"source_url": "http://wechat.show.wepiao.com/detail/ff764b0731b7465db03b56b998e1f2b8?detailReferrer=1&from=groupmessage&isappinstalled=0",

"title": "2017微信公开课Pro版即将召开"

},

...//循环被省略

],

"source_url": "",

"subtype": 9,

"title": "谣言热榜 | 十一月朋友圈十大谣言"

},

"comm_msg_info": {

"content": "",

"datetime": 1480933315,

"fakeid": "3093134871",

"id": 1000000010,

"status": 2,

"type": 49 //类型为49的时候是图文消息

}

},

...//循环被省略

]

}</p>

　　登录复制

　　简单分析一下这个json（这里只介绍一些重要的信息，其他的省略）：

　　"list": [ //最外层的键名；只出现一次，所有内容都被它包含。

{//这个大阔号之内是一条多图文或单图文消息，通俗的说就是一天的群发都在这里

<p>

"app_msg_ext_info":{//图文消息的扩展信息

"content_url": "图文消息的链接地址",

"cover": "封面图片",

"digest": "摘要",

"is_multi": "是否多图文，值为1和0",

"multi_app_msg_item_list": [//这里面包含的是从第二条开始的图文消息，如果is_multi=0，这里将为空

{

"content_url": "图文消息的链接地址",

"cover": "封面图片",

"digest": ""摘要"",

"source_url": "阅读原文的地址",

"title": "子内容标题"

},

...//循环被省略

],

"source_url": "阅读原文的地址",

"title": "头条标题"

},

"comm_msg_info":{//图文消息的基本信息

"datetime": '发布时间，值为unix时间戳',

"type": 49 //类型为49的时候是图文消息

}

},

...//循环被省略

]</p>

　　登录复制

　　这里还要提一下，如果想获取时间较长的历史消息内容，需要在手机或者模拟器上下拉页面。当你下拉到底部时，微信会自动读取下一页内容。下页链接地址和历史新闻页链接地址也是getmasssendmsg开头的地址。但是内容只有json，没有html。直接解析json就可以了。

　　这时候可以使用前面文章介绍的方法，使用anyproxy匹配msgList变量的值，异步提交给服务器，然后使用php的json_decode将json解析成数组从服务器。然后遍历数组。我们可以得到每一个文章的标题和链接地址。

　　如果您只需要单个采集公众号的内容，您可以在每天群发后通过anyproxy获取带有key和pass_ticket的完整链接地址。然后自己做一个程序，手动提交地址给自己的程序。使用php等语言定时匹配msgList，然后解析json。这样就不需要修改anyproxy的规则，也不需要创建采集队列和跳转页面。

0

2022-11-18

自动关键词采集

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

事实:读者来信｜想了解新技术，如何搜集专利情报关键词？

0 个评论

发起人

AI时代内容工厂

事实:读者来信｜想了解新技术，如何搜集专利情报关键词？

0 个评论

发起人

相关问题