免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2234 | 回复: 7
打印 上一主题 下一主题

help?。。unicode到底是什么? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-03-30 16:36 |只看该作者 |倒序浏览
本人没什么电脑基础。。所以许多基本知识不理解

unicode是什么 百度查了好久。。都jb废话==懂了的不用看,不懂的看不懂。

教材上说unicode是计算机可以支持这个星球上多种语言的秘密武器,他举了个asii的例子
asii码就是把 输入的字符窜转换为二进制数字 然后输出的时候系统在把这个数字转回字符窜

那么unicode应该是类似于这样一个东西的?

然后他说unicode用 一个或者多个字节来 标示一个字符,那么我的理解就是 可以容纳的字符比较多的一种码

然后他又说utf-8  utf-16 utf-32 big5 gb32什么

到底是什么东东啊

unicode 到底是什么啊 他和utf-8 什么有什么关系啊?
然后他有说Unicode 支持多种编码格式

我倒 前面都说了 unicode是中编码 后面的支持多种编码格式怎么理解

难道说 unicode是个篮子 其他编码是货物,所谓支持就是往篮子里装货吗?

然后又说 先要转成 unicode码,然后用utf-8 给他编码
最后读的时候 也要先 utf-8给他解码 然后再读
这个是什么意思啊


所谓 unicode是不是就是先转为 2进制的数字 对应1~4个字节长度的

那么 2太机器上 直接unicode 编和解不就可以了 为什么还要用到utf-8 16什么的呢???


不解

论坛徽章:
0
2 [报告]
发表于 2009-03-30 16:41 |只看该作者
Unicode字符集

1.名称的由来

Unicode 字符集编码是Universal Multiple-Octet Coded Character Set 通用多八位编码字符集的简称,是由一个名为 Unicode 学术学会(Unicode Consortium)的机构制订的字符编码系统,支持现今世界各种不同语言的书面文本的交换、处理及显示。该编码于1990年开始研发,1994年正式公布,最新版本是2005年3月31日的Unicode 4.1.0。

2.特征  

Unicode是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。

3.编码方法

Unicode 标准始终使用十六进制数字,而且在书写时在前面加上前缀“U+”,例如字母“A”的编码为 004116 和字符“?”的编码为 20AC16。所以“A”的编码书写为“U+0041”。

4.UTF-8 编码
UTF-8是Unicode的其中一个使用方式。 UTF是 Unicode Translation Format,即把Unicode转做某种格式的意思。

UTF-8便于不同的计算机之间使用网络传输不同语言和编码的文字,使得双字节的Unicode能够在现存的处理单字节的系统上正确传输。

UTF-8使用可变长度字节来储存 Unicode字符,例如ASCII字母继续使用1字节储存,重音文字、希腊字母或西里尔字母等使用2字节来储存,而常用的汉字就要使用3字节。辅助平面字符则使用4字节。

5.UTF-16 和 UTF-32 编码
UTF -32、UTF-16 和 UTF-8 是 Unicode 标准的编码字符集的字符编码方案,UTF-16 使用一个或两个未分配的 16 位代码单元的序列对 Unicode 代码点进行编码;UTF-32 即将每一个 Unicode 代码点表示为相同值的 32 位整数。

论坛徽章:
0
3 [报告]
发表于 2009-03-30 16:41 |只看该作者

论坛徽章:
0
4 [报告]
发表于 2009-03-30 16:42 |只看该作者
Unicode是字符集,UTF-8是编码的一种。

论坛徽章:
0
5 [报告]
发表于 2009-03-30 16:43 |只看该作者
字符是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。字符集是多个字符的集合,字符集 种类较多,每个字符集包含的字符个数不同。
计算机要准确的处理各种字符集文字,需要进行字符编码,以便计算机能够识别和存储各种文字。

论坛徽章:
0
6 [报告]
发表于 2009-03-30 16:44 |只看该作者
先感谢 楼上几位 然后在看具体回复。

论坛徽章:
0
7 [报告]
发表于 2009-04-08 12:38 |只看该作者
这类问题 不太指望从百度搜到答案的
我一般是用wiki google这两个

http://zh.wikipedia.org/w/index.php?title=UTF-8&variant=zh-cn
这个是wiki上UTF-8的词条
http://zh.wikipedia.org/w/index. ... e&variant=zh-cn
这个是wiki上UNICODE的词条

我不认为 认真看完这两个 还会有什么疑问。
一句话,UNICODE是字符的标准编号,UTF-8是这种编号的一种存储表达形式。

论坛徽章:
0
8 [报告]
发表于 2009-04-08 19:13 |只看该作者
楼上的一句话总结得很准确:一句话,UNICODE是字符的标准编号,UTF-8是这种编号的一种存储表达形式。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP