php网页抓取乱码(GBK/GB2312编码转换为UTF-8编码的步骤方法)

优采云 发布时间: 2022-01-01 01:21

  php网页抓取乱码(GBK/GB2312编码转换为UTF-8编码的步骤方法)

  1、为什么MIP只支持utf-8

  目前百度 MIP 要求网页使用 UTF-8 编码。 GBK 或 GB2312 网页呢?是否可以将 GBK 或 GB2312 编码转换为 UTF-8 编码?答案是肯定的。

  那为什么百度MIP只支持UTF-8编码呢?因为手机浏览器只支持网页的UTF-8编码,所以手机显示的GBK或GB2312网页是乱码,所以百度MIP官方规定MIP网页的编码必须是UTF,为了兼容移动网页。 -8 编码。建议您以后在设计网页时也尽量选择UTF-8编码。 UTF-8 编码不仅是国际主流编码,而且减少了网页占用的空间。以下教程也适用于其他 PHP 程序cms系统。

  GBK/GB2312编码转UTF-8编码的大致步骤是先将网站程序替换成UTF-8编码,然后对网站模板进行转码,最后进行数据库转换编码转换,具体步骤和方法说明如下:

  2、备份原GBK或GB2312网站程序

  转码网站编码前,先备份GBK(GB2312)原网站程序,步骤如下:

  (1)使用织梦cms程序后台数据库备份功能备份网站数据库,步骤是点击系统-系统设置-数据库备份/恢复,点击下方的“提交”按钮备份原程序数据库。备份的长度取决于数据库的大小。

  

  (2)网站数据库备份完成后,将网站根目录下的所有文件打包下载到本地,防止转码失败,导致< @网站无法正常运行,完整的织梦网站分为三部分,一是织梦cms的官方程序,二是前端- 网站的结束模板程序,最后一个是网站数据库文件,这三部分需要依次转码。网站数据库备份王可以用来转码 模板传输代码操作。

  第一步,在本地电脑浏览器地址栏输入您的域名/install/index.php,开始安装织梦程序

  

  第 2 步,勾选“我已阅读并同意此协议”并点击继续进行程序的下一次安装。

  

  第3步,如果上图中的“继续”按钮是可点击的,点击“继续”进行程序的下一次安装,出现的红叉会被忽略。如果无法点击“继续”按钮,说明您的多站空间有问题,请与空间服务商联系或自行查找原因。

  

  这一步是最重要的一步。我们不需要对上图中的“模板选择”进行任何操作。在“数据库设置”中,根据空间提供者提供的信息输入“数据库主机”、“数据库名称”、“数据库设置”。 “数据库用户”、“数据库密码”、“数据表前缀”、“数据库代码”、“数据表前缀”可更改或不更改,默认“数据库代码”无需更改。

  “管理员账号密码”,设置你的网站后台管理账号和密码,自己记住就好,cookies和密码千万不要改。

  “网站设置”部分,在网站名称中填写你的网站品牌名称,其他地方不用移动,“安装初始化数据体验”不要勾选这个复选框,最后点击“继续”按钮完成程序的安装。 织梦cms程序安装的参数设置如下图所示。可以参考一下。

  

  如果出现下图所示的界面,则证明您的织梦和旭安装成功

  

  织梦cms 程序的转码部分到这里就完成了。

  5、网页首页模板转码

  此步骤必须使用专业的网页编辑软件进行转码,例如dreamweaver或Notepad+。也可以用网站GBK的小工具软件(gb2312)转码utf-8,前程切记转码操作不要用记事本。

  先下载原版GBK(gb2312)网站前端模板,一般在templates文件夹下的default文件夹下。下面是dreamweaver网页编辑软件,教你如何转换GBK (gb231 2)模板转utf-8.

  用dreamweaver网页编辑软件打开一个前端模板文件,在软件菜单中点击修改—页面属性—标题/代码—代码,如下图:

  

  我们选择了原创模板文件简体中文(GB2312)到Unicode(UTF-8),

  

  点击确定,此模板文件转UTF-8编码成功,重复上述方法将其他所有前端模板文件转为UTF-8编码。

  6、恢复网站

  网站前端模板文件转码完成后,网站转码还没有完全完成,数据库也没有恢复。在这里,我们将再次使用“帝国数据备份王”。恢复网站的数据库,步骤如下: 点击“备份和恢复数据库”下的恢复数据,然后选择数据源目录,即刚刚备份的数据库目录,选择“ Database to Import”下方,然后选择数据表(原网站数据表),点击开始恢复。

  恢复网站数据库后,GBK(gb2312)编码的网站已经转为utf-8编码。这一步我们可以纠正网站模板经过MIP转换。

  7、转码注意事项

  1)如果原GBK(gb2312)编码程序经过二次开发或其他程序改动,不建议转码;

  2)程序转码完成后,我们需要在后台进行一步确认操作,方法步骤是系统设置-系统基本参数,最后点击确定;

  3)如果更新网站出现错误,请在后台点击生成-自动任务-更新系统缓存,尽量不要解决你的问题;

  4)织梦 模板标签尝试使用兼容的模板标签。

  织梦的转码操作教程也可以应用到其他PHP程序cms系统,如果你有其他的首相,请在下方留言,我们会及时回复你。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线