- 论坛徽章:
- 0
|
作者:wangxinus, 来源:
http://wangxinus.cublog.cn
说明:原创文章欢迎转载,交流请Email给作者
有时候需要把GBK编码的文件转换到UTF-8编码,这样的软件在网上也好找。但是以前遇到的一些编码,比如泰文的,越南文的,日文,韩文等等,想转换成Unicode的编码,就不好找到这样的软件了。
遇到问题总是要解决的。接触Linux以前,很多GNU的工具我都几乎没有概念,这也是我自从接触Linux以后,最大的收获之一。
以前我采用的方法,就是把这样的文本文件用IE打开,IE支持的编码很多很多,比如泰文的,我们打开的时候是乱码,然后再IE上面点右键,选择编码为泰文的,OK,显示就正常了。如何保存成UTF-8编码的呢?点击IE的另存为,呵呵。可以自己选择编码,选UTF-8的就OK了。
IE在这方面的确很强大。。。
好了,说说iconv。iconv一般在linux的发行版本中就有吧!没有也可以下,百度一下吧。
用法,比如我有一个文件 jpn.txt 的日文SHIFT-JIS编码的文件。
#iconv -f SHIFT-JIS -t UTF-8 jpn.txt > newJpn.txt
这样,我们就能把jpn.txt转换成UTF-8编码,并另存为 newJpn.txt 文件中了。
-f : from 表示来自什么编码
-t : to 表示转换的目标编码
> : linux的重定位符号,不然直接在终端输出结果了。
SHIFT-JIS , UTF-8 : 这些都是iconv支持的字符集,更多可以参考iconv的说明
#man 3 iconv_open
我用过 man iconv 里面竟然没有说明。。。。
iconv_open是libiconv提供的函数,可以自己编程用的。
本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u3/103355/showart_2065003.html |
|