免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 7361 | 回复: 2
打印 上一主题 下一主题

请问我grep不能搜索中文怎么办? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2005-04-13 22:45 |只看该作者 |倒序浏览
grep不能搜索中文,比如文中有幻灯二字,搜索却没有结果,
locale is utf-8, and the file is in utf8 encoding too.


谢谢先

论坛徽章:
0
2 [报告]
发表于 2005-04-14 08:56 |只看该作者

请问我grep不能搜索中文怎么办?

搜索中文是可以的!不过你要加上引号!如:
grep "你好"  file

3:欢迎!你好

论坛徽章:
0
3 [报告]
发表于 2005-04-14 10:18 |只看该作者

请问我grep不能搜索中文怎么办?

原帖由 "lych" 发表:
搜索中文是可以的!不过你要加上引号!如:
grep "你好"  file

3:欢迎!你好



谢谢大哥,看到您的回复,自己实验一下,很吃惊,因为google也没有看到我的问题,建立一个file,同您的测试,也正确,后来发现是我的文件编码问题,我locale是utf8
我的测试如下:

$ file zzzzz xxxxx
zzzzz: UTF-8 Unicode text
xxxxx: ISO-8859 text
$ more xxxxx
    \section{Introduction (õƆ}
$ more zzzzz
    \section{Introduction (幻灯片简介)}
$ cat zzzzz xxxxx
    \section{Introduction (幻灯片简介)}
    \section{Introduction (õƆ}
$ ls -l
-rw-r--r--   1 40 2005-04-14 18:05 xxxxx
-rw-r--r--   1 45 2005-04-14 18:06 zzzzz

因为UTF8要比ascii多半个字符,所以才出现文件大小差别5吧?
可是我vi中打开这个iso8859的文件看中文没有问题的

之所以提出这个问题,是因为我要查找一批文件,原来查不到,今天发现文件原来是gb2312编码。
所以就:
$ for i in *; do iconv  -f gb18030 -t utf8 $i -o u-$i;done

Then OK!
thank you very much.
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP