免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2531 | 回复: 1
打印 上一主题 下一主题

[求助]汉字编码转换后长度变长问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-01-23 22:55 |只看该作者 |倒序浏览
因为两个不同的服务器编码不同,文件传输时有部分数据要做个转换,主要是String类型要转换
但转换时碰到一个问题,其中转换代码如下:

String SRC_CODE = "CP937";
String TGT_CODE = "UTF-8";
char[] tmp = (new String(in_bytes, offset, length, SRC_CODE)).toCharArray();
value = new String(tmp);
byte[] out_bytes = value.getBytes(TGT_CODE);



从文件读入in_bytes,转换编码后输出out_bytes
转换普通的英文数字不会有问题,但中文汉字转换时会变长,在汉字后会多出几个空格(汉字越多,空格越多)
因为输入和输出都是长度固定的,汉字变长后会导致后面的数据被截断

不知各位大侠有什么好主意?

论坛徽章:
0
2 [报告]
发表于 2008-01-24 22:28 |只看该作者
搞错了,UTF-8是一个汉字3bytes,字母数据则1byte
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP