完整的采集神器(完整的采集神器是地址栏中搜索并安装搜狗浏览器扩展)
优采云 发布时间: 2021-11-06 00:02完整的采集神器(完整的采集神器是地址栏中搜索并安装搜狗浏览器扩展)
完整的采集神器是地址栏中搜索并安装搜狗浏览器扩展(最好是windows版本),后台使用vb编写搜狗搜索的端口搜索代码,并且留意浏览器的版本号,采集的结果都将发送至vb编写的邮箱或者qq上。
就是不经常换ip。
遇到相同的问题,后来发现是pythonselenium的自动化问题,试了一下ip地址,sse一直报ip地址不对,主页标题,过于简短,不能确定,后来改用自己电脑的ip地址一切正常了。
确实遇到了和楼主同样的问题,这个问题让我苦恼了很久,折腾很久。最终我想通了,这是一个bug,是搜狗公司一个什么工作人员在上班时间追加pythonselenium自动化操作时候的一个bug,直接告诉搜狗,他们去解决。据我所知,pythonselenium这类工具是可以解决这个问题的。另外,楼主可以按照这个h5这个例子的描述,运行一下来发现答案。
顺便贴一下这个h5的代码:#-*-coding:utf-8-*mon.exceptionsimportexceptionselenium.spider.ui.ui_modes.webdriver_screenshots_folder.add_webdriver_screenshots(webdriver_screenshots_folder,exception)selenium.spider.ui.ui_modes.webdriver_screenshots_folder.add_webdriver_screenshots(webdriver_screenshots_folder,folder)os.setref("screenshot_folder","c:\\windows\\system32\\drivers\\etc\\mozilla\\4.0\\geckodriver\\chrome\\chromedriver.exe")os.setref("comment_folder","c:\\windows\\system32\\drivers\\etc\\mozilla\\4.0\\geckodriver\\chromedriver.exe")mon.exceptionsimportexceptionselenium.spider.ui.ui_modes.webdriver_screenshots_folder.add_webdriver_screenshots(webdriver_screenshots_folder,exception)os.setref("screenshot_folder","c:\\windows\\system32\\drivers\\etc\\mozilla\\4.0\\geckodriver\\chrome\\chromedriver.exe")os.setref("comment_folder","c:\\windows\\system32\\drivers\\etc\\mozilla\\。