cnakill 发表于 2011-07-26 15:12

我觉得是你抓过来的内容有图片,导致输出有乱码,不信你可以将抓过来的代码保存到文本分析一下!~

poper168 发表于 2011-07-26 16:53

主要是你想在本地存储为什么编码?如果你存储的是utf-8,那么下载utf-8的页面的话就不需要编码转换。如果下载的页面是gb2312的话你在存储前转成utf-8的就可以了。

lsstarboy 发表于 2011-07-26 22:30

看那乱码,一般是编码的问题。

网虫2 发表于 2011-07-29 05:45

我抓取一切正常!无出现乱码。。

shudehuiyi 发表于 2012-06-25 16:43

PHP的file_get_contents获取远程页面内容,如果是gzip编码过的,返回的字符串就是编码后的乱码


1、解决方法,找个ungzip的函数来转换下
2、给你的url加个前缀,这样调用
$content = file_get_contents("compress.zlib://".$url);
无论页面是否经过gzip压缩,上述代码都可以正常工作!


使用curl模块同样可解决问题
function curl_get($url, $gzip=false){
      $curl = curl_init($url);
      curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
      curl_setopt($curl, CURLOPT_CONNECTTIMEOUT, 10);
      if($gzip) curl_setopt($curl, CURLOPT_ENCODING, "gzip"); // 关键在这里
      $content = curl_exec($curl);
      curl_close($curl);
      return $content;

}
页: 1 [2]
查看完整版本: file_get_contents下来的东西是乱码~~~急需求助!!!