file_get_contents乱码问题

采集奴一枚。

今天遇到个采集乱码的问题,以前也遇到过,好像都忽略过去了,今天百度了下终于有了新发现。

乱码地址:http://v.bitauto.com/vplay/401235.html

乱码结果:����{w�W�/�wz�|��:;��H��[�v����}����w���ף$���I��J


file_get_contents乱码问题_第1张图片

下面介绍一些解决方案:

1. 使用自带的zlib库

如果服务器已经装了zlib库,用下面的代码可以轻易解决乱码问题。

$data=file_get_contents("compress.zlib://".$url);

2. 使用CURL代替file_get_contents

function curl_get($url, $gzip=false){

$curl = curl_init($url);

curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);

curl_setopt($curl, CURLOPT_CONNECTTIMEOUT, 10);

if($gzip) curl_setopt($curl, CURLOPT_ENCODING, "gzip"); // 关键在这里

$content = curl_exec($curl);

curl_close($curl);

return $content;

}


原文:http://www.nowamagic.net/librarys/veda/detail/1770

类似:http://www.cnblogs.com/keygle/archive/2012/08/16/2642092.html

你可能感兴趣的:(file_get_contents乱码问题)