转自 Donews Blog [ http://www.donews.net ] ------------------------------- unicode: unicode.org制定的编码机制, 要将全世界常用文字都函括进去. 在1.0中是16位编码, 由U+0000到U+FFFF. 每个2byte码对应一个字符; 在2.0开始抛弃了16位限制, 原来的16位作为基本位平面, 另外增加了16个位平面, 相当于20位编码, 编码范围0到0x10FFFF. UCS: ISO制定的ISO10646标准所定义的 Universal Character Set, 采用4byte编码. unicode与UC...
[code]char *utf82ascii( unsigned char *utf8, unsigned short length, char *buf ) { int i = 0; unsigned short a; unsigned char b; char *p = buf; unsigned char t[ 2 ]; do { if( 0xe0 == ( *utf8 & 0xf0 ) && 0x80 == ( *( utf8 + 1 ) & 0xc0 ) && 0x80 == ( *( utf8 + 2 ) & 0xc0 ) ) { //3个字节 b = *utf8; ...
现在系统中在对EBCDIC转gbk的时候,只对gbk2和gbk3区通过算法进行转化了,但是gbk4并没有进行处理,所以现在出现了乱码现象。 查好好多资料都没有查到处理方法,请大牛们指导。 后来考虑2肿方案: 方案1:对于gbk4编码区的写算法进行转化。 方案2:放弃原来的解码方式,换一种新的解码方式, 网上基本上都是说 EBCDIC和gbk转化码表--gbk_CVT.txt,但是自己不会生成,网上也没下载的,知道的发我邮箱...
谁能提供下“gbk4汉字ASCII码转EBCDIC码”C程序? 镕: PC码为E946 EBCDIC码为 C1A8 属于gbk-4 詠: PC码为D481 EBCDIC码为 B759 属于gbk-4 int a2e_gbk4(void) { unsigned char chl=0x46; unsigned char chh=0xe9; unsigned int sum1; //gbk3(8140-A0FE)、gbk4(AA40-FEA0) if((chh >= 0xaa) && (chl < 0xa1)) { sum1 = (chh-0xaa) * 0x60 + (chl - 0x40); chh = sum1 / 0xbd + 0xa1; chl = sum1 % 0xbd; ...
我想用perl把一个gbk编码的中文TXT文件转换成UTF8编码的TXT文件。 perl程序gbk2utf8.pl如下 [code] #!/usr/bin/perl use Encode; use Encode::CN; open(utf8file,">utf8.txt"); while (<>) { print utf8file encode("utf-8",decode("GB2312",$_)); } close(utf8file); [/code] TXT文件名为01.txt, 我用IE打开01.txt文件,在IE中“查看”=》“编码”中选择GB2312,可以正常查看,但是选择“UTF8”显示为乱码,应该说明01.txt是G...