免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3339 | 回复: 3
打印 上一主题 下一主题

转字符从UTF格式到Unicode [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2005-09-25 13:24 |只看该作者 |倒序浏览
$info_v_str = Unicode::String::utf8($info_v_str)->;hex.' ';
$info_v_str=~s/U\+/\[Unicode\]/sgi; $info_v_str=~s/ /\[\/Unicode\]/sgi;

s/\[Unicode\]/\&\#x/sgi; s/\[\/Unicode\]/\;/sgi;

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
2 [报告]
发表于 2005-09-27 13:14 |只看该作者

转字符从UTF格式到Unicode

UTF跟Unicode是同一種吧..只是種類長短不同..
建議可以用perl 5.8以後提供的Encode module去轉..
或直接去抓Encode package下來

论坛徽章:
0
3 [报告]
发表于 2005-09-27 13:20 |只看该作者

转字符从UTF格式到Unicode

原帖由 "apile" 发表:
UTF跟Unicode是同一種吧..只是種類長短不同..
建議可以用perl 5.8以後提供的Encode module去轉..
或直接去抓Encode package下來


Apile,好久不见

论坛徽章:
0
4 [报告]
发表于 2005-09-27 21:38 |只看该作者

转字符从UTF格式到Unicode

最后的 regex 多了个“x“(&#1234 but not &#x1234)。

================
Unicode 是一种为在计算机中储存的文本提供编码方式的国际标准。

而 UTF-8 (8-bit Unicode Transformation Format)
是一种 无损(lossless),可变长度(variable-length)的字符编码形式。
取决于不同的 Unicode 符号,用一到四字节表示一个字符。

简单地说,Unicode 规定了字符如何被编码,UTF-8 规定了如何传输、保存这个编码。

例如,“汉”字的 Unicode 编码是6C 49,我可以用4个ascii数字来传输、保存这个编码;也可以用utf-8编码:3个连续的字节E6 B1 89来表示它。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP