智能标签采集器-自动标注完成数据采集(图)
优采云 发布时间: 2021-04-01 18:01智能标签采集器-自动标注完成数据采集(图)
智能标签采集器-自动标注完成数据采集
如果有办法的话,让每个标签生成独一无二的序列号。采用post提交post请求时,可以带上标签和标签序列号,防止信息泄露。
数据库加标签分表啊,再加标签注释什么的,整的富文本库,
加注释,怎么像什么程序员了。学点标注的方法,
可以用程序采集人站的完整流程采集网站的数据然后做标注
你只要假设人人站都能采集就行。如果没法验证就采集完整流程。
也许用,你可以将不同标签的数据采集为一个数据库。这样做等于基于项目实现一个接口对人站程序采集人站数据进行集成处理。接口采集人站数据时候可以监控用户浏览的网站内容是什么。
关键要知道最终的用户数据是什么类型,字段数和大小。
你就给个sql查询语句,根据这个语句来采集数据,然后数据库再做标注,一般没问题。如果数据量还比较大,数据库访问量大,你就可以考虑自己造对象。
设计语言,请大神的时候,
做php和java
数据量大就用正则表达式吧
可以选择合适的库并且静态化,具体怎么做,还要具体的考虑,总之,建议数据采集这块,
github有个项目,你可以参考一下,