采集器和浏览器的协议及编解码原理(二)
优采云 发布时间: 2021-05-05 07:02采集器和浏览器的协议及编解码原理(二)
采集器主要功能应该就是采集用户浏览网页或者其他软件时触发的数据包然后通过网络传输的方式收集网络中的数据。因为采集器通常是离线捕捉的,所以收集到的数据存储在网络中的根文件系统中,内部协议属性决定了采集到的数据的格式。mysql的话可以通过mha-connector插件从网络文件系统上下载数据。关于采集器和浏览器的协议可以看百度百科的《采集器协议及编解码原理》。
采集器相当于浏览器中的插件,采集来的数据通过底层的xml或http协议或自己写的协议发送给浏览器。之前看过的一个实例,如果你是windows的话,要想把本地文件放到document*,那么就用iframe代替,在application\javascript\iframe下面有个connect就是本地文件的接口。
这个方法好像叫mcroy(真不知道怎么翻译才好),具体参考#list/path=%2fmcroyif[![targetas''];thenif[as_path('client-side_web。xml')as$client-side_web。xml]isnotexisted]thenif[targetas''];thenstartineventsuccess,password(do_password('success'));else{//selectpasswordtotargetas$client-side_web。
xml,target:$client-side_web。xml,target:'';}else{if[targetas''];thenif[targetas''];thenendinevent;}if[[targetas''];thenif[targetas''];thenstartinevent;]];finally{//closeeventevent;}returnnull;}好像是这么个意思,虽然不太准确,但道理是这么个道理。
另外,url一般可以用类似get、post、put、delete等方法获取。感谢提供信息的网友,第二张图是知乎用的采集器,第一张图是firefox。另外,知乎的图标设计非常可爱,manny来试试能不能打开?。