免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3525 | 回复: 15
打印 上一主题 下一主题

如何删除文件中的中文 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-07-16 11:57 |只看该作者 |倒序浏览
假如有这么一个文件 add-remove.txt 里面有这么数据
msgid ""
"View fail!\n"
"The infofile of '%s' was broken."
msgstr ""
"查看失败!\n"
"“%s”的描述文件被损坏。"

msgid "View the detailed information about the selected ap/patch"
msgstr "查看选中的程序或补丁的详细信息"

msgid ""
"What this %s is dependent on was/were lacked,you need to add dependencies "
"first.\n"
"Dependencies:%s\n"
"Continue to add?"
msgstr ""
"未检测到这个%s所依赖的程序或补丁,你需要先安装它们。\n"
"依赖:\n"
"是否继续安装?"

===================

我要把其中的中文去掉  该怎么做呢,shell  或 C 也行

论坛徽章:
0
2 [报告]
发表于 2010-07-16 12:37 |只看该作者
你这什么编码格式的?

论坛徽章:
0
3 [报告]
发表于 2010-07-16 13:16 |只看该作者
我好像做过类似的东西。。

先转成utf8

再用isacsii()判断

论坛徽章:
0
4 [报告]
发表于 2010-07-16 14:03 |只看该作者
回复 2# donglongchao


    其实 是一个po文件来的  我要把 中文去掉

论坛徽章:
0
5 [报告]
发表于 2010-07-16 14:06 |只看该作者
这个问题困惑了很多人.答案是没有百分之百的方法.

论坛徽章:
0
6 [报告]
发表于 2010-07-16 14:10 |只看该作者
回复 5# samlumengjun


    方法肯定不止一个,但我还没找到可行的方法之一
你能为我解答么

论坛徽章:
0
7 [报告]
发表于 2010-07-16 14:15 |只看该作者
回复 6# heyj6969


    根据编码方法的不同,找出在各种方法范围内的中文字符,然后去除,如果你能确定那个文档用哪种编码,那么就容易地多.

论坛徽章:
0
8 [报告]
发表于 2010-07-16 14:49 |只看该作者
正则匹配中文

论坛徽章:
0
9 [报告]
发表于 2010-07-16 14:51 |只看该作者
回复 7# samlumengjun


    我的文件
# enca add-remove.po
Universal transformation format 8 bits; UTF-8
那中文的编码范围是多少呢

论坛徽章:
0
10 [报告]
发表于 2010-07-16 14:57 |只看该作者
回复 9# heyj6969


    不怕误杀的话把0x80以上的全去掉得了。如果剩下的全是ASCII编码没什么大问题。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP