抓取网页数据(抓取网页数据将结果保存到文件,再用php处理)
优采云 发布时间: 2022-01-02 16:03抓取网页数据(抓取网页数据将结果保存到文件,再用php处理)
抓取网页数据,将结果保存到文件,再用php封装处理。比如把,就可以用sql保存到mysql中。以及可以用其他工具与php交互数据。目前有什么问题?1.比如说爬取的数据,网页代码没有加密保存。加密方式无法破解。2.不知道java能不能调用php,或者能不能利用反射或者iocp抓?3.如果要用java来学习php或者调用,是不是要去学习php的标准库?比如其中的eldatalib,如果不加封装,eldata一个ast就是一个sql。php中没有对应的ast,还得自己写ast,直接使用,是不是效率不太高?。
使用java或者python+go语言
现在有提供php封装好的结构化数据,比如大家都熟悉的odbc。
不管sqlzoo,还是infoq上都有很多各种算法的简单demo,比较系统地介绍了php和其他语言的提供的封装。
这不是php的语言本身问题。因为它的数据本身结构不是数据库mysql那种结构,而是一串接近xml的字符串。这种字符串是最适合用php结构化数据读写的,不需要转换成数据库语言,只需要在字符串后补上一些空格就可以了。
话说有php的工具类吗?例如googleanalyticsapi
用python是最可以的,它本身就提供很好的封装。
最近在读pearl同学的「python基础」,