免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3684 | 回复: 4
打印 上一主题 下一主题

查找出目录下包含中文字符的文件 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-06-01 17:08 |只看该作者 |倒序浏览
请教如何查找出整个目录下包含中文字符的文件

在网上搜了下 发现有用grep [^\u4E00-\u9FA5] 和grep "[\x80-\xff]"
来确定 中文字符 的  但是 在这里不适用 因为 很多文件名 包含了 _ . 这种字符 如
pub_print_template.xml
. 和 _ 也在 上述的 编码 之内
所以求教如何找出 整个 目录下 包含中文字符的 文件 包括子目录

论坛徽章:
1
摩羯座
日期:2014-12-29 15:59:36
2 [报告]
发表于 2011-06-01 17:25 |只看该作者
反了,基本的正则表达式要搞清楚啊.

论坛徽章:
0
3 [报告]
发表于 2011-06-01 17:55 |只看该作者
回复 2# ziyunfei


    有 ^ 和 没有 我都试过  出来的 都是 一样的结果  因为在 字符集内 包含了 . 和 _ 这样的 特殊字符 所以很难筛选出来

论坛徽章:
1
摩羯座
日期:2014-12-29 15:59:36
4 [报告]
发表于 2011-06-01 18:05 |只看该作者
. _ 是在ascii码里就有的,怎么可能跑到\u4E00-\u9FA5范围里
\x2e  \x5f


echo pub_print_template.xml|grep -oP "[一-龙]"

能匹配到吗

论坛徽章:
0
5 [报告]
发表于 2011-06-01 21:57 |只看该作者
回复 4# ziyunfei


    我的 grep 没有 -P 这个参数
  1. [root@nctest140 nc_qcp0527zg]# grep --version
  2. grep (GNU grep) 2.5.1

  3. Copyright 1988, 1992-1999, 2000, 2001 Free Software Foundation, Inc.
  4. This is free software; see the source for copying conditions. There is NO
  5. warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP