vba抓取网页数据(百度的文字识别可以让C#、Python等语言调用。)
优采云 发布时间: 2021-12-23 18:02vba抓取网页数据(百度的文字识别可以让C#、Python等语言调用。)
通常需要将照片中的文字转换为可编辑的文字。
百度的文字识别可以用C#、Python等语言调用。我将其集成到 API 打包库中。
API包库的下载和部署请参考以下帖子:
下面我来演示一下如何在VBA中调用API包库中的Image2Character函数来提取照片中的数据。
在 Excel VBA 中添加外部引用 API 和正则表达式。
模块中的代码如下:
Private S As String
Sub GetData()
Dim B As New API.Baidu
Dim Result As String
S = B.Image2Character(imagepath:="E:\粉煤灰\2.jpg")
Debug.Print S
End Sub
Sub Split()
Dim Reg As RegExp, MC As MatchCollection, M As Match
Set Reg = New RegExp
With Reg
.Global = True
.Pattern = Chr(34) & "([0-9\.]+)mg/L" & Chr(34)
Set MC = .Execute(S)
For Each M In MC
Debug.Print M.SubMatches(0)
Next M
End With
End Sub
GetData 负责从计算机中的图片中提取文本并将其分配给变量 S。
Split 负责按照指定的模式对变量 S 进行分解。
本例涉及化学物质含量检测的科研图片。图片收录两个样本L22和L23的数据。我关注的是Conc栏,就是单位是mg/L。