Chinaunix

标题: Mail::IMAPClient读邮件body有乱码(base64编码问题 15楼补充目录更新同步问题) [打印本页]

作者: yaoliwei    时间: 2010-12-16 13:25
标题: Mail::IMAPClient读邮件body有乱码(base64编码问题 15楼补充目录更新同步问题)
本帖最后由 yaoliwei 于 2010-12-21 10:36 编辑

大部分是正常的,有些不行 请教了
  1. use strict;
  2. use warnings;
  3. use Data::Dumper;

  4. use Mail::IMAPClient;
  5.   
  6. my $imap = Mail::IMAPClient->new(
  7. Server   => 'xxxx',
  8. User     => 'xxx',
  9. Password => 'xxx',
  10. #Uid      => 1,
  11. );

  12. my $folders = $imap->folders
  13.         or die "List folders error: ", $imap->LastError, "\n";
  14. print "Folders: @$folders\n";

  15. $imap->select('test')
  16.         or die "Select fodler 'test' error: ", $imap->LastError, "\n";


  17. my $msgs = $imap->search("ALL");

  18. foreach (@$msgs) {
  19.         #get each mail item's subject and msg body in the folder,
  20.         my $msgno = $_;
  21.         my $subject = $imap->get_header($msgno,'Subject');
  22.         my $sender = $imap->get_header($msgno,'From');
  23.         my $msgbody = $imap->body_string($msgno);
  24.        
  25.         print '-' x 100,"\n";
  26.         print "sender: $sender\n";
  27.         print "subject: $subject\n";
  28.         print '-' x 100,"\n";
  29.         print "msgbody:\n$msgbody\n";
  30.         print "\n\n";
  31. }

  32. $imap->logout
  33.         or die "Logout error: ", $imap->LastError, "\n";
复制代码

作者: yaoliwei    时间: 2010-12-16 13:26
本帖最后由 yaoliwei 于 2010-12-17 16:45 编辑

body中部分乱码是这样的,
msgbody:
xxxxxxxx

xxxxxxxxxxxxxxxxxxxxxxxxxxx
(很多数字和字母组合)
作者: ulmer    时间: 2010-12-16 18:37
回复 2# yaoliwei
你应先判别mail header里的content type, 再来分解 message body。
这里貌似base64的编码。
作者: wfnh    时间: 2010-12-16 21:01
本来就不负责解码
作者: wfnh    时间: 2010-12-16 21:05
本来就不负责解码
作者: yaoliwei    时间: 2010-12-17 15:38
回复  yaoliwei
你应先判别mail header里的content type, 再来分解 message body。
这里貌似base64的编 ...
ulmer 发表于 2010-12-16 18:37

谢谢。
我测试目录里边 2封邮件 一封正文可以解析 另外一封就是我贴的乱码。

我用outlook的message options看了一下 发现他们的区别可能是在Content-Transfer-Encoding  脚本正常解析的是binary  另外一封的是7bit


邮件以前没怎么弄过 看了一下帮助  不少东西 前面的路还很长 一个小问题就把我给难倒了 呵呵。
作者: yaoliwei    时间: 2010-12-17 15:40
本来就不负责解码
wfnh 发表于 2010-12-16 21:01

internet因为传输的关系 解码 编码是很重要的一环 基本功还是太浅了啊  perl写的程序太少了。

我这种情况应该怎么解码呢 原来是什么编码类型? MIME:arser base64啦 有点头晕了
有没有好的教程推荐一下 谢谢。
作者: yaoliwei    时间: 2010-12-17 16:23
本帖最后由 yaoliwei 于 2010-12-17 16:30 编辑

我看了一下Content-Transfer-Encoding是7bit的话 其实只是标识宽度而已 但是没有真正的encoding  
但是我贴出来的内容又是编码过的

用base64也decode过 decode出来什么都没有。

这是怎么回事呢?
作者: zhlong8    时间: 2010-12-17 16:35
MIME::Base64 decode 我都看到你信内容了……
作者: yaoliwei    时间: 2010-12-17 16:41
MIME::Base64 decode 我都看到你信内容了……
zhlong8 发表于 2010-12-17 16:35

是把 我赶紧去试试。谢谢谢谢。。。。。。。。。。
作者: yaoliwei    时间: 2010-12-17 16:50
本帖最后由 yaoliwei 于 2010-12-17 17:25 编辑
MIME::Base64 decode 我都看到你信内容了……
zhlong8 发表于 2010-12-17 16:35

试过了 确实可以的 我不知道为啥 之前我试过base64的 当时不行 可能某个地方 用错了。

有个问题 我出问题的邮件encoding是7bit 这个和base64是两种编码 前者照理说不需要解码的
请问一下 这是啥原因呢 我用的是outlook。
(微软的东西真是妖怪 我用perl去读  能读到是base64 但outlook里边就显示bit7)

再次感谢。
作者: zhlong8    时间: 2010-12-17 17:33
回复 11# yaoliwei


    encoding 和 base64 两码事大哥,邮件一般都是 base64 编码传输应该,没详细研究过
作者: ulmer    时间: 2010-12-18 00:28
回复 6# yaoliwei

瞎猫抓了个死老鼠。

至少应该先了解一下构造一个电子邮件的文件格式,即相关的RFC协议。
微软的Exchange/Outlook产生的 电子邮件格式除了通用的之外,常用的是微软定义的 TNEF 格式。
TNEF 是 Transport Neutral Encapsulation Format 的·字头缩写。 .

在TNEF的邮件, 其邮头中的 Content-Type 是
Content-Type: application/ms-tnef; name="winmail.dat"

Content-Transfer-Encoding 是
Content-Transfer-Encoding: base64
(你的情况正如此,相应的mailbody可用base64来解读)
或是
Content-Transfer-Encoding: binary
其对应的mailbody是用binary编码的,要用特殊的TNEF解码方法来读取message和attachment。



------
发现cu里很多人的综合基本知识太差了。我们这里的人, 拉出一个就是一个合成军.
作者: yaoliwei    时间: 2010-12-21 10:11
回复  yaoliwei


    encoding 和 base64 两码事大哥,邮件一般都是 base64 编码传输应该,没详细研究 ...
zhlong8 发表于 2010-12-17 17:33

base64应该就是邮件编码的一种啊
谢谢你的提醒 不然我现在估计还在挣扎呢。
作者: yaoliwei    时间: 2010-12-21 10:32
本帖最后由 yaoliwei 于 2010-12-21 10:33 编辑
回复  yaoliwei

瞎猫抓了个死老鼠。

至少应该先了解一下构造一个电子邮件的文件格式,即相关的RFC协 ...
ulmer 发表于 2010-12-18 00:28

绝对接受批评 就是临时要分析邮件 然后临时找个perl模块来做 对邮件的协议 文档结构都还不大清楚 附件等如果再加入我就更高不清楚了。
看来还是浮躁啊。。。。

回归问题,
我用的模块是Mail::IMAPClient 用它来读邮件header 能找到tnef相关的字段X-MS-TNEF-Correlator,不过找不到Content-Type: application/ms-tnef; name="winmail.dat"(outlook里边可以看到这个)

我现在大概测试了一下我这边的邮件(用Mail::IMAPClient来读header) Content-Transfer-Encoding有2种类型 一种是base64 另外一种是quoted-printable,前者用MIME::Base64来解码 后者我不解码也可以直接读取(查资料 ascii字符这种编码是human-readable的)。

另外我这边现在还有另外一个问题 又要见笑了 我这边邮箱下面自己建的目录 增删里便的邮件 结果perl程序里便都没有受到影响 以前是没这问题的 晕啊。




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2