Chinaunix

标题: shell脚本问题:find找到的文件名中如果有空格如何处理 [打印本页]

作者: slother    时间: 2010-08-05 12:01
标题: shell脚本问题:find找到的文件名中如果有空格如何处理
想做一个脚本,将一个目录下的所有文件的编码格式从gb2312转为utf8格式的,结果碰到一个问题。
代码如下:
  1. for i in `find ./ -name "*.txt"`
  2. do
  3.       iconv -f gb2312 -t utf8 $i -o $i
  4. done
复制代码
当文件或目录的名称中没有特殊字符的时候,这个脚本运行没什么问题。
但是如果文件或目录名称中有空格时,那么for循环就无法读入一个完整的文件名了,请问有什么好的解决方法么?
作者: renxiao2003    时间: 2010-08-05 12:33
这个问题是比较棘手的。期待高人。
作者: HH106    时间: 2010-08-05 14:11
提供二个办法.
1 修改IFS啊,如果你非要这样做的话
2 find ./ -name "*.txt" -print0 |xargs -0 iconv
作者: vermouth    时间: 2010-08-05 14:37
find 后加个引号?
作者: slother    时间: 2010-08-05 15:46
提供二个办法.
1 修改IFS啊,如果你非要这样做的话
2 find ./ -name "*.txt" -print0 |xargs -0 iconv
HH106 发表于 2010-08-05 14:11



    多谢你的答复。不过这里有几个疑问,请指教。
1.IFS具体指的是什么呢。我是linux的新手,对这方面不是很了解。
2.
  1. find ./ -name "*.txt" -print0 |xargs -0 iconv
复制代码
。 将它补完一下
  1. find ./ -name "*.txt" -print0 |xargs -0-
复制代码
这里也有一个问题,iconv的默认输出是std out,如果想将输出定义为覆盖原文件,xargs似乎就无法办到了。
不过经过你的提醒,使用-print0参数,也让我想到另一个解决办法:
  1. find ./ -name "*.txt" -print0 -exec  iconv -f gb2312 -t utf8 {} -o {} \;
复制代码
这样就可以将一个目录下的所有文件的文件编码格式转成utf8。

3.不过2中的方法还是无法解决这个问题:如果find找到的文件名中有空格,还能让for循环正确取出文件名吗?谁有好办法
作者: HH106    时间: 2010-08-05 17:15
回复 5# slother


    IFS是内部域分隔符,默认是空格,tab,和新行.
如果文件名含有空格,在for中将会被拆开成二部分.因此要改变默认的IFS.
如果你一定要用for循环的话,try
OLDIFS=$IFS
IFS=:
for i in `find ./ -name "*.txt"`
do
      iconv -f gb2312 -t utf8 $i -o $i
done
IFS=$OLDIFS
作者: yanu    时间: 2010-08-05 22:17

  1. 22:14:10 >iconv -f gbk -t utf8 带空格\ \ 的文件.txt
  2. 中文测试文件
复制代码

  1. 22:14:51 >find ./ -type f | while read f;do iconv -f gbk -t utf8 $f ;done
  2. iconv: cannot open input file `./带空格': No such file or directory
  3. iconv: cannot open input file `的文件.txt': No such file or directory

复制代码

  1. 22:15:08 >find ./ -type f | while read f;do iconv -f gbk -t utf8 "$f" ;done
  2. 中文测试文件
  3. 22:15:13 >

复制代码

作者: ipaddr    时间: 2010-08-05 22:53
用引号呀。
作者: slother    时间: 2010-08-07 14:11
回复 6# HH106


    多谢指点,我明白了,等下去试一下。
作者: yanu    时间: 2010-08-07 14:15
{:3_183:} 杀鸡焉用牛刀....
作者: xiaochuanjiejie    时间: 2014-07-30 15:25
slother 发表于 2010-08-05 12:01
想做一个脚本,将一个目录下的所有文件的编码格式从gb2312转为utf8格式的,结果碰到一个问题。
代码如下: ...



find ./ -name '*.bak' -print0 | xargs -0 rm -rf




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2