- 论坛徽章:
- 0
|
本帖最后由 百分百好牛 于 2011-05-10 17:14 编辑
我有个很古老的程序(没有source code了),会生成一个log文件,设这个文件名叫log.txt,这个文件encoding很奇怪,用ultraedit32 打开 如下:- 0000000: 5400 4400 4400 3e00 2000 4c00 6f00 6100 T.D.D.>. .L.o.a.
复制代码 如果我用notepad打开,再save as呢,就成了下面这个,其实是 utf-16的- 0000000: fffe 5400 4400 4400 3e00 2000 4c00 6f00 ..T.D.D.>. .L.o.
复制代码 但是,这个log.txt不能直接处理,比如说按我下面的这个方法去查找,会失败,因为实际上,每次读出来的行是 T.D.D.不是我想要的 TDD。
- open STDIN, "< log.txt";
- while(<>)
- {
- if (/TDD/)
- {
- # Add my logic.
- }
- }
复制代码 现在我想把他转化成一个标准的utf16或者utf8,却总是提示失败,如下:
perl.exe open.pl utf-16le utf8 log.txt
- use strict;
- use warnings;
- use Encode;
- # read arguments
- my $enc_in = shift || die 'pass file encoding as first parameter';
- my $enc_out = shift || die 'pass STDOUT encoding as second parameter';
- print STDERR "going to read files as encoded in: $enc_in\n";
- print STDERR "going to write to standard output in: $enc_out\n";
- die "no files :-(\n" unless @ARGV;
- binmode STDOUT, ":encoding($enc_out)"; # latin1, cp1252, utf8, UTF-8
- print STDERR map "* $_\n", Encode->encodings; # list loaded encodings
- for ( @ARGV ) { # process files
- open my $fh, "<:encoding($enc_in)", $_ or die "open $_: $!";
- print while <$fh>;
- close $fh;
- }
- print STDERR map "* $_\n", Encode->encodings; # more encodings now
复制代码 错误的提示总类似于
UTF-16LE : Partial character at open.pl line 18, <$fh> line 2011.
希望有经验的兄弟过来帮忙看看。
perl 5.1
windows 2008 |
|