python梦编织自动采集和更新脚本
优采云 发布时间: 2020-08-08 06:04上次我共享一个自动采集和存储脚本(phpcms),建议将一些童鞋更改为提交表单的表单,毕竟数据库存储代码更改的成本相对较高,并且通过表单发布数据只需更改Cookie即可运行频道ID. 因此,这次我主要使用pycurl模块和fiddler捕获工具来演示dedecms如何提交数据.
尝试过贴鞋后贴数据的童鞋可能已经发现,梦境编织贴后的数据与一般数据有些不同. dedecms post数据格式是多部分的. 使用数据包捕获工具,您会发现很多东西: Content-Type: multipart / form-data; boundary = --------------------------- 249724317605,例如:
那么我该如何提交?有两个要点(邮寄地址,Cookie,频道ID和其他问题由您自己解决):
1,标题添加Content-Type: multipart / form-data,如下所示:
2,通过提琴手将提交的数据下载到本地(单击下图中的红色框以保存到本地,无需更改编码),并将其命名为data.txt.
data = open('data.txt'). read(),数据可以直接用作邮寄表格的数据.
事实上,到目前为止,您已经能够成功提交,这很简单吗?
在实际使用中,我们不能总是将要更新的文章标题和内容写成txt. 如何将标题,内容等转换为变量?只需一行代码:
data = data.replace('title @ 123456',title).replace('content @ 123456',content)
只需将data.txt文章标题的文本更改为“ title @ 123456”,将内容更改为“ content @ 123456”,然后替换它们. 以下是完整的代码地址: