phpQuery乱码解决经验分享

发布:2018-08-07 07:53   点击80次   评论:0
phpQuery乱码解决经验分享
http://blog.csdn.net/yyyfff43/article/details/17263163


之前使用phpQuery采集页面信息,但是取过来后中文总是乱码,上网搜了一下别的同僚的解决方案,
其中最有用的一篇是http://blog.ihipop.info/2011/08/2647.html/comment-page-1 作者的解决方案很详细,
但是按照方案实行了一遍后,发现还是没解决我的问题,于是又装回了原版的phpquery,
然后继续在编码上来回转换解决问题。

我需要完成的任务是从http://v.17173.com/dota2抓到数据来用,我本地是uff-8的,但是目标页面是utf-8编码,
抓过来后以utf-8的编码输出会是乱码,很奇怪,
原因之一就是上边同僚提到的,phpquery在抓取目标页面代码时,
未能获取到meta中的编码信息时一律转换为ISO-8859-1编码,

于是我本地先将抓来的中文由utf-8转换为ISO-8859-1 如下
mb_convert_encoding($zn_str,'ISO-8859-1','utf-8') ,
然后输出中文时就发现他们变成了比较熟悉的gbk乱码形式,
然后再从gbk转换成utf-8即可,mb_convert_encoding($zn_str,'utf-8','GBK'),前后转了两次解决了问题

关于 GitHub 导航 部门 反馈

提示:`/home.php`入口数据仅为演示功能,不构成任何交易凭证,也不承担相关风险和责任!

Copyright © 2011-2018 xxxxx.com All rights reserved.

Run:3.331/28.906(ms); 7(sql)/2.877(MB); comm:news/detail; Upd:2024-03-28 21:35:18