诀窍:收罗最合适新手的四个采集器,自媒体入门的不二选择!

优采云 发布时间: 2022-10-20 15:39

  诀窍:收罗最合适新手的四个采集器,自媒体入门的不二选择!

  采集工具目录

  1.易于编写

  这个网站非常适合自媒体新手,有很多视频和图形材料,并且可以使用各种小工具,例如热点跟踪,爆文分析,质量检查,标题助手,视频批量下载,内容分析等。

  

  2.小火花自媒体工作助手

  这是自媒体员工常用的操作工具,可以进行多账户管理数据监控、群组管理、官方授权海量资源排名等

  3. 乐观

  

  它是基于大数据的一站式交付管理平台,提供爆文材料,原创检测,一键分发,主题选择分析和标题掌握。

  4. 淘金网格

  页面整洁易懂,有些功能可用,乍一看名字就觉得是古色古香的网站,乍一看是一个资料的集合,还有很多自媒体平台文章呈现,每个自媒体平台都有文章区、视频区、图集区,还有专门的销售区,还有一些小玩意儿

  行业解决方案:移动云九天AI赋能机器人 通用文字识别应用技术

  image_sub = rospy.Subscriber("/arm_camera/color/image_raw", Image, self.Imagecallback)

  该方案设置为图像采集在机械臂末端启动*敏*感*词*,因此订阅“/arm_camera/color/image_raw”主题节点。实际操作中,可以使用“rostopic list”命令查看当前订阅的主题目录,根据实际需要进行修改。imagecallback 是接收到主题消息后的回调函数。图像格式的转换、显示和处理都在这个回调函数中。

  1.2 Imagecallback回调函数

  图片格式转换、显示、等待按钮触发、图片处理等功能都在回调函数中实现。图像格式转换需要用到cv_bridge函数包,用于实现ROS中的图像数据与OpenCV格式图像的相互转换。其中,imgmsg_to_cv2()接口可以将ROS图像数据转换为OpenCV图像数据。

  图5 cv_bridge函数包

  桥= CvBridge() cv_image = bridge.imgmsg_to_cv2(数据,“bgr8”)

  通过OpenCV库中的imshow()接口可以实现图像的实时显示。

  cv2.imshow("图像", cv_image)

  此时主程序进入阻塞状态,等待按键触发。waitKey() 接口等待键盘输入并返回键的 ASCII 码。当按下esc键时(对应的ASCII码为27),主程序退出;当按下回车键时(对应的ASCII码为13),进行图像处理操作。为了不阻塞主函数的流程,设计了多线程架构,并开辟了一个新线程进行图像处理操作,异步执行。

  key = cv2.waitKey(3)# key 退出图片处理 采集 进程 if key == 27:os._exit(0) # key 进入图片处理进程 elif key == 13: thread.start_new_thread( self.img_process, (cv_image, ))

  1.3 图像处理流程

  在图像处理流程中执行图像存储和字符识别。存储图像的命名方法是通过收录时间戳信息,调用OpenCV中的imwrite()接口,文本识别调用移动云九天人工智能通用文本识别API实现的。

  这部分将在下一章详细介绍。

  def img_process(self, image): '''完成图像处理过程,包括图像保存和图像文本识别。:param image: 要处理的图像 ''' img_name = str(int(round(time.time() * 1000))) + '.png' cv2.imwrite(img_name, image) rospy.loginfo("image采集Completed!!")#识别图片中的关键词 self.recog.recognition(img_name)

  1 文本识别

  ROS机器人移动到指定位置后,利用机械臂上的*敏*感*词*对真实环境进行data采集,识别场景中的关键文本信息。文字识别模块主要通过调用移动云九天人工智能平台通用文字识别API实现。该模块的整体流程如图3所示。

  

  1.1 获取 API_KEY 和 SECRET_KEY

  这个过程的前提是用户订阅了移动云九天人工智能平台的通用文本识别产品,并获得了产品的API_KEY和SECRET_KEY(见图6)。

  1.1 获取OCR_URL

  OCR_URL是用户订购的移动云产品的请求地址。在这种情况下,通用字符识别产品的请求地址如下:

  OCR_URL = ":8444/ecloud/ai/v1/ocr/v1/webimage"

  1.2 获取access_token

  在使用移动云九天人工智能平台的通用文本识别API进行图像文本识别之前,必须先获取用户的Access Token。使用API​​ KEY作为用户名,SECRET KEY作为密码,通过访问token url可以方便快捷的获取Access Token。具体代码实现如下:

  def fetch_token(self):'''获取移动云账号的Access Token。:return: string -- access_token'''param = {'grant_type': 'client_credentials', 'client_id': self.API_KEY, 'client_secret ': self.SECRET_KEY} # 通过get请求获取Access Token。请注意,此处设置了 verify=False 以避免 ssl 身份验证。token_response = requests.get(self.TOKEN_URL, params=param, verify=False)result = token_response.json()if 'access_token' in result.keys():return result['access_token']else:print('请检查你的 API_KEY 和 SECRET_KEY')exit()

  1.3 Base64编码图片

  使用移动云九天人工智能平台提供的API进行图片文字识别,需要先对图片进行Base64编码。Base64 编码是一种图像处理格式,通过特定算法将图像编码成一长串字符串,以减少 HTTP 网络请求。使用Python base64库可以快速实现图片的Base64编码。具体代码实现如下:

  导入 base64with open(img, 'rb') as f:image_base64 = base64.b64encode(f.read()).decode("utf-8")

  1.4 调用API进行文本识别

  移动云九天人工智能平台通用文本识别产品支持微博、电商、用户ugc等在线图文信息的非结构化识别,在复杂背景下仍能保持较高的准确率。在这种情况下,我们利用移动云的AI能力,赋能ROS机器人识别和提取图片中的关键文本信息。Mobile Cloud Universal Text Recognition API 的 HTTP 请求方式为 POST。本例的请求URL为:8444/ecloud/ai/v1/ocr/v1/webimage,请求的Header如下:

  参数名称

  价值

  内容类型

  应用程序/json

  

  移动云通用文本识别API的请求参数如下:

  参数名称

  参数类型

  有必要吗

  参数说明

  图像文件

  细绳

  是的

  图片的base64编码不收录header格式信息。目前图片格式支持jpg、jpge、png、bmp。具体请参考接口请求说明。图片的长宽要求最短边大于10px,最长边小于2048px。

  调用移动云通用文本识别API识别图片关键信息的具体实现如下:

  request_param = {'imageFile' : image_base64}json_param = json.dumps(request_param)request_response = requests.post(request_url, data=json_param, headers=header, verify=False) result = request_response.json()

  1.5 提取关键信息

  可以根据移动云通用文本识别API的返回参数信息描述提取返回信息中的关键参数。在这种情况下,主要提取返回参数中的单词(文本行内容)对应的信息并打印到屏幕上。具体代码实现如下:

  text_info = result['body']['content']['prism_wordsInfo']对于 text_info 中的信息:print(info['word'])

  2 测试结果

  综合上述技术,在配备机械臂和*敏*感*词*模块的复合型AGV机器人中实现机器人控制、图像采集处理,并调用移动云端AI能力,完成通用文本识别的应用。测试结果如图7所示。左图为实验机器人本体,右图左半部分为处理后的*敏*感*词*图像,包括“Learn PYTHON Happy”、“Learn Python Happy”、“Learn Python”轻松快乐”。Jane so Fashion!”三行文字,识别结果显示在右侧的cmd窗口中,以上文字均能正确识别。

  综上所述,调用移动机器人进行现场图像采集和文本识别的应用对于场景理解等下游业务具有较高的应用价值。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线