如何玩转excel数据采集》excel也能实现多线程?
优采云 发布时间: 2021-05-28 18:02如何玩转excel数据采集》excel也能实现多线程?
自动识别采集内容,创建索引采集脚本过程中,本地会进行同步写入代码,在采集结束后的实际执行中,我们会从项目目录下新增一个data目录,里面有待采集的数据集,本质上这些数据并不会直接存储在本地,而是在服务器上存放。采集结束后,会将此数据存放在files目录中,并自动命名该目录为“数据”。
强烈建议这种问题自己先搜索一下。
我想问下,在各大中小学内部做试卷的数据采集,你们是怎么采集的?上课的教学大纲,试卷,
可以用requests。注意可能无法从对应的file那里获取到数据。想一想现在数据库挂那么多,学校的那些数据库操作系统windows,linux,mysql之类的。就没有采集不到的数据。
貌似还没有适合新手的网页采集工具不过是google有很多说明
做爬虫,不知道是你要做哪个方面的爬虫?比如说针对某一类问题就得有针对性的。
requests
百度不是有很多相关文章么,
《verycd_》
网页翻爬我记得不太难,对着网站解析也是很简单。
excelvba:win,mac双平台数据库:navicatpro
推荐看这个:《如何玩转excel数据采集》
excel也能实现多线程(只要你们有库能支持),一般我会用django,轻松秒写requests多线程,