免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: buypro9
打印 上一主题 下一主题

关于utf-8 代码转换问题 求解 [复制链接]

论坛徽章:
0
31 [报告]
发表于 2011-01-20 09:16 |只看该作者


论坛徽章:
0
32 [报告]
发表于 2011-01-20 14:44 |只看该作者
还是无解吗? 伤心

论坛徽章:
0
33 [报告]
发表于 2011-01-20 16:50 |只看该作者
什么无解,你这种求知态度我不苟同。

29楼已经给出命令行下显示中文的方法,你究竟有看没?后面给出网页上的显示,图都截取出来的。

需要这个shell支持中文
这什么什么和什么?麻烦你多看点资料再说。

论坛徽章:
1
摩羯座
日期:2014-12-29 15:59:36
34 [报告]
发表于 2011-01-20 17:02 |只看该作者
同表示无语

论坛徽章:
0
35 [报告]
发表于 2011-01-20 22:08 |只看该作者
本帖最后由 buypro9 于 2011-01-21 10:20 编辑

回33楼toniz (肚腩照明月)的问题

本来来这论坛提问求教的一种是很懂的行的。一种是是比较外行的。我属于后者。我有什么术语用得不对的地方,请见谅


什么无解,你这种求知态度我不苟同。

29楼已经给出命令行下显示中文的方法,你究竟有看没?后面给出网页上的显示,图都截取出来的。


如果我没看错你的意思的话  你想告诉我29楼已经给出了解答。。。。反复看了。你引用了别人的问题
你贴出的代码也是是回答别人的问题.(命令行下显示中文的方法)
我昨天就测试过你的代码 显示出来的是汉字“中文”. 很遗憾这不是我需要的结果。




我需要的显示结果为  "& #x4E2D; 这样的格式。  就是"& #x hexnum;"这样的格式。
将汉字 “中文”转化为  "& #x4E2D;& #x6587";   转化的结果和http://tool.chinaz.com/Tools/UTF-8.aspx 的一样

论坛徽章:
46
15-16赛季CBA联赛之四川
日期:2018-03-27 11:59:132015年亚洲杯之沙特阿拉伯
日期:2015-04-11 17:31:45天蝎座
日期:2015-03-25 16:56:49双鱼座
日期:2015-03-25 16:56:30摩羯座
日期:2015-03-25 16:56:09巳蛇
日期:2015-03-25 16:55:30卯兔
日期:2015-03-25 16:54:29子鼠
日期:2015-03-25 16:53:59申猴
日期:2015-03-25 16:53:29寅虎
日期:2015-03-25 16:52:29羊年新春福章
日期:2015-03-25 16:51:212015亚冠之布里斯班狮吼
日期:2015-07-13 10:44:56
36 [报告]
发表于 2011-01-21 00:14 |只看该作者
回33楼toniz (肚腩照明月)的问题

本来来这论坛提问求教的一种是很懂的行的。一种是是比较外行的。我属于 ...
buypro9 发表于 2011-01-20 22:08



    那个网站无非就做个转码的工作, GBK->unicode
  1. c:\> perl -MEncode -e "printf '&#x%X;', ord decode('GBK', '中')
复制代码
29楼的确已经说完了,的确是因为你不理解字符编码问题。 ord 只能处理一个字符,应该在 win 下命令行执行 '中' 的编码才是GBK

论坛徽章:
1
摩羯座
日期:2014-12-29 15:59:36
37 [报告]
发表于 2011-01-21 09:23 |只看该作者
怎么编码14楼不是回答过了吗。
我上传我的脚本。你看看
a.rar (290 Bytes, 下载次数: 16)

论坛徽章:
0
38 [报告]
发表于 2011-01-21 09:49 |只看该作者
其实,就是楼主不知道我们在和他说什么。

论坛徽章:
0
39 [报告]
发表于 2011-01-21 10:20 |只看该作者
谢谢楼上的两位。

现在总算搞明白了。回头再看贴理解了不少

但是是因为测试14楼的脚本的时候出错了。没理解ziyunfei (紫云飞) 老大的提示。

论坛徽章:
0
40 [报告]
发表于 2011-01-21 11:07 |只看该作者
算了  好人做到底。
下面的CGI可以帮你学习,你从你的HTML那边传递参数过来CGI这边,这个参数的中文编码是和你浏览器选择的编码有关。
  1. #!/usr/bin/perl -w
  2. use CGI;
  3. use HTML::Entities;
  4. use utf8;
  5. use Encode;
  6. $query = new CGI;

  7. $secretword = $query->param('word');
  8. $remotehost = $query->remote_host();

  9. my $a = $secretword;
  10. $a = decode_entities($a);

  11. print $query->header(  -charset=>'utf-8' );  

  12. print $a."-------------";
  13. print unpack("H*",$a)."<br>";
  14. print decode("gb2312",$a)."-------------";
  15. print unpack("H*",decode("gb2312",$a))."<br>";
  16. print encode("utf-8",decode("gb2312",$a))."-------------";
  17. print unpack("U*",encode("utf-8",decode("gb2312",$a)))."<br>";
  18. map {print "&#x",sprintf("%x",$_)}unpack ("U*",decode ("gb2312",$a));
复制代码
输入一个‘山’,如果CGI显示:
?-------------c9bd
山-------------e5b1b1
山-------------229
&#x5c71

表示你的浏览器目前使用的编码是GB2312

如果是:
山-------------e5b1b1
灞-------------e7819e
灞-------------231
&#x705e

这个则你HTML传过来的是UTF-8

那么可以用这个代码:
  1. #!/usr/bin/perl -w
  2. use CGI;
  3. use HTML::Entities;
  4. use utf8;
  5. use Encode;
  6. $query = new CGI;

  7. $secretword = $query->param('word');
  8. $remotehost = $query->remote_host();

  9. my $a = $secretword;
  10. $a = decode_entities($a);

  11. print $query->header(  -charset=>'utf-8' );  


  12. print $a."-------------";
  13. print unpack("H*",$a)."<br>";
  14. print decode("utf-8",$a)."-------------";
  15. print unpack("H*",decode("utf-8",$a))."<br>";
  16. print encode("gb2312",decode("utf-8",$a))."-------------";
  17. print unpack("H*",encode("gb2312",decode("utf-8",$a)))."<br>";
  18. map {print "&#x",sprintf("%x",$_)}unpack ("U*",decode ("utf-8",$a));


复制代码
将显示:
山-------------e5b1b1
山-------------e5b1b1
?-------------c9bd
&#x5c71
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP