免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2148 | 回复: 2
打印 上一主题 下一主题

[文本处理] 求教:在linux中批量找出windows生成的"附件,副本"等中文名文件 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-03-19 11:39 |只看该作者 |倒序浏览
本帖最后由 cjxulicong 于 2014-03-19 11:45 编辑

[root@centos dir]# ls
123 - ????.html  123.html  1.txt  1_-_副本.txt

我想问下  我有一个目录,之前程序员是在windows上开发的,所以操作习惯问题在备份文件的时候直接复制粘贴.目录下就会生成很多带有中文字符的文件名的文件。
现在把网址文件迁移到linux上,在提交svn的时候 中文乱码文件不能提交。我想把这写含有中文乱码文件批量找出来。或者用inum重命名掉 或者直接删掉。
但是目录下这种文件太多。人工一个个找太麻烦。需要找一个快捷的办法完成这个。
在线等。

论坛徽章:
15
2015年辞旧岁徽章
日期:2015-03-03 16:54:15双鱼座
日期:2015-01-15 17:29:44午马
日期:2015-01-06 17:06:51子鼠
日期:2014-11-24 10:11:13寅虎
日期:2014-08-18 07:10:55酉鸡
日期:2014-04-02 12:24:51双子座
日期:2014-04-02 12:19:44天秤座
日期:2014-03-17 11:43:36亥猪
日期:2014-03-13 08:13:51未羊
日期:2014-03-11 12:42:03白羊座
日期:2013-11-20 10:15:18CU大牛徽章
日期:2013-04-17 11:48:45
2 [报告]
发表于 2014-03-19 12:23 |只看该作者
不是非常的精确,但是99% 能够正确的找到中文名的文件。
  1. find . -type f |while read line
  2. do
  3.   if echo $line |od -c|grep ' [1-9][0-9][0-9] ' >/dev/null 2>&1; then
  4.       echo "this filename $line contains Chinese characters"
  5.   fi
  6. done
复制代码

论坛徽章:
0
3 [报告]
发表于 2014-03-19 12:39 |只看该作者
回复 2# rdcwayx


this filename ./1_-_副本.txt contains Chinese characters
this filename ./123 - ?±±?.html contains Chinese characters
确实可以  谢谢版主!! 嘿嘿  我研究下od 命令
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP