免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 5682 | 回复: 10
打印 上一主题 下一主题

fstream在繁体操作系统下打开简体目录名文件出错 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-05-11 16:12 |只看该作者 |倒序浏览
本帖最后由 li574000 于 2010-05-11 17:24 编辑

我的程序本来是在简体中文操作系统下开发的,最近把程序拷贝到繁体操作系统下试验了一下,发现有错误,后来查看了一下,问题出在如下的代码部分
std::string FilePathName;
//下面用的是MFC的打开对话框
CFileDialog dlg(TRUE,NULL, _T("*.sce"), OFN_EXPLORER|OFN_NOCHANGEDIR );
if(dlg.DoModal() == IDOK)
{
      //这个函数负责把unicode字符转换成多字节字符
    WCharToChar( CP_ACP, dlg.GetPathName().GetBuffer(), FilePathName);
     //下面这个函数在繁体版操作系统中有时候失败,调试发现FilePathName经过转换后有些简体字显示乱码。
    ifstream f(FilePathName);
}
个人原因分析:
在windows操作系统中,所有的文件名都是unicode编码的,所以上面我们通过打开对话框得到的字符串是unicode的。而我们的ifstream只能接受char*的字符串,
所以要把unicode转成char*,最终调用的转换函数是WideCharToMultiByte(),这个函数在简体中文操作系统中工作良好,但是当道了繁体中文操作系统中的时候,
就会出现问题,问题的原因是会发现某些字符转换后是乱码,比如“预案.txt",这里用上面的函数转换后,会发现“预案.txt"中的"预"字是乱码了,这个可能是因为在台湾操作
系统中,代码页是big5,而big5中不包含字符“预”。但是,对于这种问题,我该如何做才能够在繁体操作系统中正确的读取带有简体字的文件名哪,网上搜了好久的资料,
都没有头绪,很急,希望知道的帮帮忙

论坛徽章:
0
2 [报告]
发表于 2010-05-11 16:30 |只看该作者
沉的这么快,自己顶下

论坛徽章:
0
3 [报告]
发表于 2010-05-11 17:59 |只看该作者
ifstream 的构造函数和open函数支持const wchar_t *_Filename
你用wchar_t *的文件名传入就行了,在Windows下也就是Unicode 16大头。

论坛徽章:
0
4 [报告]
发表于 2010-05-12 08:56 |只看该作者
问题是我用了一个第三方的库来读取文件的,这个库本身只接收char*类型的字符,我又没有办法改他源码,这如何是好

论坛徽章:
0
5 [报告]
发表于 2010-05-12 09:36 |只看该作者
看来,你使用的是Windows操作系统,同时,使用STL是么?
我记得以前的STL中,fstream不支持wchar_t的,但是,2008之后是添加了wchar_t版本的,是否可以换个新的编译环境?
同时,你可以利用WideCharToMultiByte 这个函数,来判断转换是否成功,如果不成功,向用户发出警告。
再或者,不要用C++的STL,尝试用用CRT的fopen,或许有wchar_t版本。

论坛徽章:
0
6 [报告]
发表于 2010-05-12 10:33 |只看该作者
我用的是tinyxml这个库解析XML文件,现在的麻烦事这个库只支持用char*作为文件名,不支持宽字符,而我现在遇到的问题是在台湾操作系统下,我需要把简体unicode字符转换成多字节的char*,所以,个人理解是需要用简体中文的代码页才能正确转换成简体,但是我真的不知道如何在繁体操作系统下用简体的代码页转换unicode,我尝试用的转换代码是这一句WideCharToMultiByte(CP_ACP,NULL,strWChar.c_str(),-1,pszDest,nSize,NULL,FALSE);
我估计用CP_ACP这个可能是不行的,但是实在不知道用哪个,同时,即使我转换成了GB2312这种简体字符,当我在台湾操作系统下用这个字符打开文件的时候,我还得想办法通知ifstream我使用的代码页是简体中文,而不是繁体中文,否则打开还是有问题,不知道这一系列的问题该如何解决?由于代码写了好久,现在想大面积的改成用宽字符有点力不从心了,只能想办法从转换上下功夫

论坛徽章:
0
7 [报告]
发表于 2010-05-12 11:42 |只看该作者
那你只能 hack一下 basic_ifstream的构造函数和open函数,把CreateFileA换成CreateFileW,并且把参数传入的长度判断等等合法性判断也修改成支持wchar_t *的。这样传入的表面是const char *,实质是const wchar_t * 。找你们公司里懂逆向工程的帮你改吧。

论坛徽章:
0
8 [报告]
发表于 2010-05-12 13:51 |只看该作者
不行了,如果最开始就没有考虑多国语言后来再改实在太麻烦了,改动太大,尤其是使用了第三方工具,我还是
决定搞两套资源,包括文件夹和文件里面的内容,繁体操作系统下的那份都改成繁体的资源,弄成两个版本,哎,折腾死我了快,楼上说的hack一下倒是解决方法,可惜藕不懂,还是不弄了

论坛徽章:
1
2015年迎新春徽章
日期:2015-03-04 09:56:11
9 [报告]
发表于 2010-05-15 15:31 |只看该作者
utf8

论坛徽章:
0
10 [报告]
发表于 2010-05-15 16:12 |只看该作者
wfstream
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP