免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1093 | 回复: 0
打印 上一主题 下一主题

Jave C C++ 乱码 解决方案 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-12-30 16:18 |只看该作者 |倒序浏览

                                在现在的软件工程当中,一个项目的完工并不可能只用到一种语言,往往会用到好几种语言相互配合才能完成整个工程。这就会遇到不同语言之间相互通信的问题,以及不同语言采用不同编码的转化问题,处理不好汉字将会产生乱码。
当今最流行的编程语言当属JAVA和C类语言,就以此为例加以说明。
JAVA一般采用UTF8的编码方式,而C类语言一般采用Unicode编码方式,则,UTF8编码转Unicode编码函数如下:
               
               
                string textUTF8;
string textUnicode;
textUnicode=UTF8toUnicode((char *)textUTF8.c_str());
........
string UTF8toUnicode(char *s)
{
      int len = 0;
      WCHAR* r = new WCHAR[strlen(s) * 2];
      while(s[0])
      {
           int bytes = 1;
           if(s[0] & 0x80)
            while(s[0] & (0x80 >> bytes)) bytes++;
           if(bytes == 1)
                r[len] = s[0];
           else
           {
                r[len] = 0;
                for(char*p = s + (bytes - 1); p > s; p--)
                 r[len] |= ((*p) & 0x3F)  ((bytes - (p - s) - 1) * 6);
                r[len] |= (s[0] & ((1  (7 - bytes)) - 1))  ((bytes - 1) * 6);
           }
           len++;
           s += bytes;
      }
      r[len] = 0;
      char*buffer = new char[len * 2 + 1];
      ZeroMemory(buffer, len * 2 + 1);
      ::WideCharToMultiByte(CP_ACP, NULL, r, len, buffer, 1+ 2 * len, NULL, NULL);
      string str = buffer;
      delete[] r;
      delete[] buffer;
      return str;
}
               
               
               
               

本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u3/90876/showart_2135630.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP