免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3118 | 回复: 3
打印 上一主题 下一主题

字节流与字符流的区别收藏 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-01-21 13:55 |只看该作者 |倒序浏览
转:jelly_x

字节流与字符流的区别收藏



字节流与字符流主要的区别是他们的的处理方式
字节流是最基本的,所有的InputStream和OutputStream的子类都是,主要用在处理二进制数据,它是按字节来处理的
但实际中很多的数据是文本,又提出了字符流的概念,它是按虚拟机的encode来处理,也就是要进行字符集的转化
这两个之间通过 InputStreamReader,OutputStreamWriter来关联,实际上是通过byte[]和String来关联
在实际开发中出现的汉字问题实际上都是在字符流和字节流之间转化不统一而造成的

在从字节流转化为字符流时,实际上就是byte[]转化为String时,
public String(byte bytes[], String charsetName)
有一个关键的参数字符集编码,通常我们都省略了,那系统就用操作系统的lang
而在字符流转化为字节流时,实际上是String转化为byte[]时,
byte[]    String.getBytes(String charsetName)
也是一样的道理

至于java.io中还出现了许多其他的流,按主要是为了提高性能和使用方便,
如BufferedInputStream,PipedInputStream等


java中的字节流和字符流的存储区别,用几个常用类型的数据来比较字节流和字符流的区别
int a=5;
boolean b=true;
char c='G';
String d="你好";

使用字符流打印以上类型的数据到文件中:
PrintWriter dos =new PrintWriter(new BufferedWriter(new FileWriter("c:\\buffertest.txt")));
dos.print(a);
dos.print(b);
dos.print(c);
dos.print(d);

结果如下:
a是5
b是true
c是G
d是你好
字符流完全保证了和我们输入的字符保持一致

再看看字节流
DataOutputStream dos =new DataOutputStream(new FileOutputStream("c:\\streamtest.txt"));
dos.writeInt(a);
dos.writeBoolean(b);
dos.writeChar(c);
dos.writeUTF(d);
dos.writeChars(d);
dos.writeBytes(d);

结果是二进制文件,我们用十六进制编辑器打开它
a是00 00 00 05,int是四个字节
b是01,布尔型变量是一个字节
c是00 47,char是两个字节
d分别用3个不同的函数打印在文件中
第一个是00 06 E4 BD A0 E5 A5 BD,前面的00 06是writeUTF加上去的,是字节的数目,后面六个字节是"你好"的UTF编码,每个汉字3个字节
第二个是4F 60 59 7D,这是"你好"的big endian的Unicode编码,每个汉字2个字节
第三个是60 7D,这是从4F 60 59 7D中分别取得两个汉字的低字节

进一步说明
用记事本保存不同的编码文件,文件的头部会有一些标记来识别文件的编码类型,用记事本的另存为就可以保存不同编码类型的文件,然后用记事本打开时就可以正确识别编码,如果用十六进制编辑器打开它们就会看到用来识别编码类型的标记被写在文件头部,这些类型说明如下:
EF BB BF UTF-8
FF FE UTF-16/UCS-2, little endian
FE FF UTF-16/UCS-2, big endian
FF FE 00 00 UTF-32/UCS-4, little endian.
00 00 FE FF UTF-32/UCS-4, big-endian.

UTF-8保存一个字符时,长度为1-3个字节,也就是8bit-24bit。
其中code<= 007F的,保存为1个字节
(code >= 0080) && (code <= 0x07FF)的,保存为2个字节
code>0800的,保存为3个字节

"你好"的gb2312编码是C4 E3 BA C3,汉字大于0800,所以每个汉字保存为3个字节

little endian:低地址存放字节低位,x86是这种顺序
big endian:低地址存放字节高位,网络字节序是这种顺序

论坛徽章:
0
2 [报告]
发表于 2011-01-22 10:28 |只看该作者
没看明白{:3_188:}

论坛徽章:
59
2015七夕节徽章
日期:2015-08-24 11:17:25ChinaUnix专家徽章
日期:2015-07-20 09:19:30每周论坛发贴之星
日期:2015-07-20 09:19:42ChinaUnix元老
日期:2015-07-20 11:04:38荣誉版主
日期:2015-07-20 11:05:19巳蛇
日期:2015-07-20 11:05:26CU十二周年纪念徽章
日期:2015-07-20 11:05:27IT运维版块每日发帖之星
日期:2015-07-20 11:05:34操作系统版块每日发帖之星
日期:2015-07-20 11:05:36程序设计版块每日发帖之星
日期:2015-07-20 11:05:40数据库技术版块每日发帖之星
日期:2015-07-20 11:05:432015年辞旧岁徽章
日期:2015-07-20 11:05:44
3 [报告]
发表于 2011-01-29 17:35 |只看该作者
学习啊。

论坛徽章:
0
4 [报告]
发表于 2011-01-30 19:37 |只看该作者
学习了,好东西
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP