免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1932 | 回复: 5
打印 上一主题 下一主题

[C++] 知道unicode编码怎么转utf编码 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-12-18 19:27 |只看该作者 |倒序浏览
知道汉字的unicode的值是  4E2D,怎么把它转换成utf-8的编码。
wctomb 这个函数 要的的是 wchar_t

论坛徽章:
3
寅虎
日期:2013-11-27 07:53:29申猴
日期:2014-09-12 09:24:152015年迎新春徽章
日期:2015-03-04 09:48:31
2 [报告]
发表于 2012-12-18 21:59 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
3
摩羯座
日期:2013-11-12 20:06:19午马
日期:2013-11-27 16:35:55双鱼座
日期:2014-04-04 19:02:30
3 [报告]
发表于 2012-12-18 23:12 |只看该作者
我本来是建议 使用icu这个库的 开源库

论坛徽章:
0
4 [报告]
发表于 2012-12-19 08:41 |只看该作者
发一个写的Windows下的函数:
std::string CLS_WebSvrClient::stringToUtf8(const std::string & _strSrc )
{
        //需要先转换为Unicode
        //预转换,得到所需空间的大小
        int wcsLen = ::MultiByteToWideChar(CP_ACP, NULL, _strSrc.c_str(), _strSrc.length(), NULL, 0);
        //分配空间要给'\0'留个空间,MultiByteToWideChar不会给'\0'空间
        wchar_t* wszString = new wchar_t[wcsLen + 1];
        //转换
        ::MultiByteToWideChar(CP_ACP, NULL, _strSrc.c_str(), _strSrc.length(), wszString, wcsLen);
        //最后加上'\0'
        wszString[wcsLen] = '\0';

        //在转为UTF-8
        //预转换,得到所需空间的大小,这次用的函数和上面名字相反
        int u8Len = ::WideCharToMultiByte(CP_UTF8, NULL, wszString, wcslen(wszString), NULL, 0, NULL, NULL);
        //同上,分配空间要给'\0'留个空间
        //UTF8虽然是Unicode的压缩形式,但也是多字节字符串,所以可以以char的形式保存
        char* szU8 = new char[u8Len + 1];
        //转换
        //unicode版对应的strlen是wcslen
        ::WideCharToMultiByte(CP_UTF8, NULL, wszString, wcslen(wszString), szU8, u8Len, NULL, NULL);
        //最后加上'\0'
        szU8[u8Len] = '\0';
        return (std::string)szU8;
}

论坛徽章:
0
5 [报告]
发表于 2012-12-19 09:30 |只看该作者
多谢,受教了 回复 4# xsniper001


   

论坛徽章:
0
6 [报告]
发表于 2012-12-19 10:25 |只看该作者
回复 5# r3215407

客气,Linux没有写过现成的,
但是有下面的函数可以实现
(1) iconv_t iconv_open(const char *tocode, const char *fromcode);
此函数说明将要进行哪两种编码的转换,tocode是目标编码,fromcode是原编码,该函数返回一个转换句柄,供以下两个函数使用。
(2) size_t iconv(iconv_t cd,char **inbuf,size_t *inbytesleft,char **outbuf,size_t *outbytesleft);
此函数从inbuf中读取字符,转换后输出到outbuf中,inbytesleft用以记录还未转换的字符数,outbytesleft用以记录输出缓冲的剩余空间。
(3) int iconv_close(iconv_t cd);
此函数用于关闭转换句柄,释放资源。

   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP