iove6600 发表于 2011-07-25 17:18

file_get_contents下来的东西是乱码~~~急需求助!!!

我最在做一个采集器,采集www.qiyi.com这个网站的首页视频,在本地file_get_contents了一下这个网址,然后输出,前两天还能正常显示,这两天就直接给我输出了一大堆乱码,那个站的编码是utf-8的,我本地的也是utf-8的,这时问题又出来了,正常的乱码问题应该是里面的中文出乱码,而源码里的div结构是可以显示的,但现在是整个取过来的就是一堆乱码,连div这些元素都乱码了。。我开始以为是他那边服务器做了什么机制来控制采集,但我让我朋友在他电脑上试着输出一下,却正常!这样就能确定下来是我本地出了问题,而且极有可能是Apache的配置出了问题,可但是但可是,我用同样的方法去输出腾讯视频的utf-8格式的首页,结果却是正常的,无乱码情况!。。。。。。。。这到底是怎么一回事呢!!!希望能有给力的coder帮我分析一下~~~谢谢了,坐等!!!!!!

iove6600 发表于 2011-07-25 17:35

来人啊来人啊。。。。

xinglu1983 发表于 2011-07-25 18:29

十有八九是被办了,把乱码贴出来看下。

iove6600 发表于 2011-07-26 10:37

回复 3# xinglu1983


    ���isW�.���h�k˞ Ta�Dv����pw��x��sT�� ."@���#(ɔH�����k�EQ�E�Z"ޟ2�*��/�O���T��pQ�}����%O�G�կ>]{yz���}�J��̉ڳ��";TR��5;���n��wT�D� 2�r~�8Jܪ��S�o�f�����Yϧ���^�99 ��̋��������՚Q�s�����}j�o���0��>�_�o�{��3�"���H�������(��[*�J�]����J~�)b�wEǬBoW�`���=��KTQ2�(�&�RDe�d�-�"�e�"_����T+W�J1߳�8Y�ɏ E�D��F��t����Mk���K���e?^/yg����W٥��e!��X����)����&Aring;�@ϞrW�BŖ��m��+���࿍�"����|w�0Z2&���ӴX��O�7��p?��S�_ؾ�-1?>Z4Q�*��űgD�ZFK�3�t�0�����d 7T1��g����>1Lk�&icirc;��8ک�Zo�؛���1��l�ڝ1'#yP��^ V���Hwwg�������)���+V���6��"e�3�]9#�����������I�m���;�h�5�+�u�۩�ND�#% �/-�J�������l*3:�k�(��E���ȮQ�4��;�^��*`ߩ'F'��$.�ok���g��gv�GJ#c;i��f,� ��� ������U�1FGK���Q|��x6�N%3����*�X�E��:��[|c���|���5�b9�t-Z[�љ;Q;��/X���ꪹ;7��߃Zp�� �$H���S΅&#524144;�J�>�W�@���q��D�����I�e �c#Ee�~��a�����%+J�t�Ǽ�����h�L�hz����f�d���_���Ba��1 ��0��\;b9l?zU��Ϥ��<��1�,Z8��=�+�?����JV�dEo���Gթ\�Ȫ�,Y� ��$"}^ hL��Ѐoّ�G�:��QY



下面还有好多~~~~查看源文件的话只能看到第二个字符!

maochanglu 发表于 2011-07-26 11:26

file_get_contents 先搞一搞上面的css文件看看。

iove6600 发表于 2011-07-26 13:58

回复 5# maochanglu


    依然很乱啊~~~

a.a 发表于 2011-07-26 14:03

本地浏览器的编码?

iove6600 发表于 2011-07-26 14:31

回复 7# a.a


    utf8的

guophp 发表于 2011-07-26 14:34

就编码的问题 把获取的内容的编码转换一下就ok了

iove6600 发表于 2011-07-26 15:08

回复 9# guophp


    别逗了,老兄~~~~要是这么容易我就不在这里问了!!!
那你说说吧,把什么转成什么!!!把utf8转成utf8 ? 呵呵~~
页: [1] 2
查看完整版本: file_get_contents下来的东西是乱码~~~急需求助!!!