Chinaunix

标题: 从Excel导出中文数据乱码的奇怪问题 [打印本页]

作者: iamlimeng    时间: 2011-08-23 15:34
标题: 从Excel导出中文数据乱码的奇怪问题
我要将Excel文件中的数据导出为CSV(TAB分隔)文本文件,以下是代码,直接运行能正确输出结果,奇怪的是用PDK打包后,输出的中文全是乱码,请高手帮忙解决。

PERL的中文乱码问题实在是太普遍了,我就碰到很多次,每次都需要用不同的,很奇怪的办法才能解决,PERL就不能搞容易些吗?
  1. #!/usr/bin/perl

  2. use strict;
  3. use warnings;
  4. use Spreadsheet::ParseExcel;
  5. use Spreadsheet::ParseExcel::FmtUnicode;

  6. my $file = "test.xls";
  7. open FH, ">out.txt";
  8. foreach (read_excel($file)) {
  9.         print FH "$_\n" ;
  10. }
  11. close FH;

  12. sub read_excel {
  13.         my $file = shift;
  14.         my $oExcel = new Spreadsheet::ParseExcel;
  15.         my $code = "GB2312";
  16.         my $oFmtJ = Spreadsheet::ParseExcel::FmtUnicode->new(Unicode_Map =>$code);
  17.         my $oBook = $oExcel->Parse( $file, $oFmtJ );
  18.         my $sheet = $oBook->{Worksheet}[0];
  19.         my ( $minRow, $maxRow ) = $sheet->row_range();
  20.         my ( $minCol, $maxCol ) = $sheet->col_range();
  21.         my @datas;
  22.         for my $row (0..$maxRow) {
  23.                  my @row_data;
  24.                  foreach my $col (0 .. $maxCol){
  25.                           my $cell = $sheet->get_cell($row,$col);
  26.                           next unless $cell;
  27.                           push(@row_data,$cell->value);
  28.                  }
  29.                  push(@datas,join("\t",@row_data));
  30.         }
  31.          return @datas;
  32. }
复制代码

作者: x9x9    时间: 2011-08-23 15:34
http://bbs.chinaunix.net/viewthr ... amp;from=favorites#
看下flw的excel终极方案是不是可以终极,反正上次我的问题是终极了~
作者: yiten    时间: 2011-08-23 18:34
Unicode_Map => 'CP936',分数拿来
作者: iamlimeng    时间: 2011-08-23 22:49
回复 2# yiten


    你打包后输出的中文正常吗?我试了一下,还是不行,请指教!
作者: Kitaisky    时间: 2011-08-24 02:01
# open FH, ">out.txt";

open FH, ">:encoding(UTF-",  "out.txt";
作者: iamlimeng    时间: 2011-08-24 09:39
回复 4# Kitaisky


    谢谢,但打包后运行依然是乱码!
作者: iamlimeng    时间: 2011-08-24 10:50
回复 6# x9x9


    非常感谢,我的问题也被终极了!同时也感谢楼上两位。
作者: seufy88    时间: 2011-08-24 11:01
本帖最后由 seufy88 于 2011-08-24 11:03 编辑

说到excel中文处理,好像我知道编码问题,但之前认为是Spreadsheet::模块帮我搞定的,不知道是不是这样阿
我从一个excel里读日文进来,处理后再直接写到新的excel里,打开完全没有乱码
我的电脑是英文windows,不知道和这个有没有关系。可能读进来前本身excel保存的就是utf8格式,而非中文OS上的gb2312格式。输出当然也是utf8的excel吧




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2