免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3125 | 回复: 4
打印 上一主题 下一主题

[驱动] 字符编码详解 v1.0.pdf [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-11-05 14:09 |只看该作者 |倒序浏览

字符编码详解

版本: 1.0

作者: crifan

邮箱: green-waste at163.com



PDF版本:
字符编码详解 v1.0.pdf (937.93 KB, 下载次数: 212)

内容简介


介绍了编码相关背景知识;
介绍了ASCII,EASCII,ISO/IEC 8859,Unicode,ISO 10646的解释;
添加了UTF-8和Unicode的区别和联系

关键字

字符编码,ASCIIISO 8859ISO 10646UCSUnicodeUTF-8


版本


版本日期内容更新
1.02011-11-02添加了编码相关背景知识介绍添加了ASCIIEASCII编码介绍添加了ISO/IEC 8859相关的编码和各种单字节编码的关系添加了UnicodeISO 10646的解释添加了UTF-8Unicode的区别和联系


目录
1 正文之前 5
1.1 目的 5
1.2 本文内容 5
1.3 声明 5
2 字符编码相关的背景知识 6
2.1 拉丁字母 6
2.2 什么是字符编码 6
3 字符编码标准 8
3.1 只支持基本的拉丁字符的字符编码:ASCII 8
3.1.1 ASCII的由来 8
3.1.2 ASCII编码规则 8
3.1.3 ISO 646 9
3.1.4 ASCII码表/编码字符表 9
3.2 支持多种衍生拉丁字母的字符编码:EASCII和ISO 8859 10
3.2.1 EASCII 11
3.2.2 ISO 8859 11
3.2.2.1 ISO/IEC 8859出现的背景 11
3.2.2.2 ISO/IEC 8859的编码规则 11
3.2.2.3 ISO/IEC 8859的特点 13
3.2.2.4 ISO/IEC 6429 14
3.2.2.5 ISO 8859和ISO-8859的区别和联系 14
3.2.2.5.1 原先的ISO 8859-1和我们常说的ISO 8859-1 15
3.3 各种单字节编码标准的关系 17
3.4 支持世界上几乎所有字符的字符编码:Unicode 17
3.4.1 Unicode和ISO 10646的关系 18
3.4.1.1 ISO 10646=UCS 18
3.4.1.2 Unicode 和ISO 10646的联系 18
3.4.1.3 Unicode和ISO 10646的区别 19
3.4.2 Unicode编码规则 20
3.4.3 Unicode字符编码所对应的存储和交换标准:UTF-8, UTF-16, UTF-32 21
3.4.3.1 UTF-8 21
3.4.3.2 Unicode与UTF-8之间的转换 22
3.4.3.2.1 关于UTF-8的BOM:“EF BB BF” 23
3.5 字符存储(交换)标准 24
3.6 字形和你所看到的字符的关系 25
4 引用 26

图表
图表 1 ASCII编码表 10
图表 2 ISO/IEC 8859编码标准中的15种字符集 12
图表 3 ISO/IEC 8859的15个字符集的部分比较 13
图表 4 ISO/IEC 8859-1字符集表 16
图表 5 各种单字节编码标准之间的关系 17
图表 6 ISO/IEC 10646与Unicode的版本对应关系 19
图表 7 Unicode中的各种平面划分 20
图表 8 Unicode与UTF-8之间的编码映射关系 22
图表 9 Notepad中的各种编码 22
图表 10 字符(存储)交换标准 24
图表 11 汉字“宋”的不同字体 25

缩写

缩写

全称

含义

ASCII

American Standard Code for Information Interchange

美国信息交换标准代码

BMP

Basic Multilingual Plane

基本多文种平面

EBCDIC

Extended Binary Coded Decimal Interchange Code

扩展二进制编码十进制交换码

IANA

Internet Assigned Numbers Authority

互联网号码分配局

ISO/IEC

International Organization for Standardization /

International Electrotechnical Commission

国际标准化组织和国际电工委员会

UCS

Universal Character Set

通用字符集

UTF

Unicode Transformation Format

Unicode转换格式

论坛徽章:
0
2 [报告]
发表于 2011-11-05 17:37 |只看该作者

论坛徽章:
0
3 [报告]
发表于 2011-11-06 10:20 |只看该作者
有心了,字符集问题工作中还是经常会遇到的

论坛徽章:
0
4 [报告]
发表于 2011-11-07 19:41 |只看该作者
多谢楼主,下来看看!

论坛徽章:
1
巳蛇
日期:2013-10-28 15:55:33
5 [报告]
发表于 2011-11-07 22:09 |只看该作者
先下了, 改天看
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP