免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: yaoliwei
打印 上一主题 下一主题

Mail::IMAPClient读邮件body有乱码(base64编码问题 15楼补充目录更新同步问题) [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-12-16 13:25 |显示全部楼层 |倒序浏览
本帖最后由 yaoliwei 于 2010-12-21 10:36 编辑

大部分是正常的,有些不行 请教了
  1. use strict;
  2. use warnings;
  3. use Data::Dumper;

  4. use Mail::IMAPClient;
  5.   
  6. my $imap = Mail::IMAPClient->new(
  7. Server   => 'xxxx',
  8. User     => 'xxx',
  9. Password => 'xxx',
  10. #Uid      => 1,
  11. );

  12. my $folders = $imap->folders
  13.         or die "List folders error: ", $imap->LastError, "\n";
  14. print "Folders: @$folders\n";

  15. $imap->select('test')
  16.         or die "Select fodler 'test' error: ", $imap->LastError, "\n";


  17. my $msgs = $imap->search("ALL");

  18. foreach (@$msgs) {
  19.         #get each mail item's subject and msg body in the folder,
  20.         my $msgno = $_;
  21.         my $subject = $imap->get_header($msgno,'Subject');
  22.         my $sender = $imap->get_header($msgno,'From');
  23.         my $msgbody = $imap->body_string($msgno);
  24.        
  25.         print '-' x 100,"\n";
  26.         print "sender: $sender\n";
  27.         print "subject: $subject\n";
  28.         print '-' x 100,"\n";
  29.         print "msgbody:\n$msgbody\n";
  30.         print "\n\n";
  31. }

  32. $imap->logout
  33.         or die "Logout error: ", $imap->LastError, "\n";
复制代码

论坛徽章:
0
2 [报告]
发表于 2010-12-16 13:26 |显示全部楼层
本帖最后由 yaoliwei 于 2010-12-17 16:45 编辑

body中部分乱码是这样的,
msgbody:
xxxxxxxx

xxxxxxxxxxxxxxxxxxxxxxxxxxx
(很多数字和字母组合)

论坛徽章:
0
3 [报告]
发表于 2010-12-17 15:38 |显示全部楼层
回复  yaoliwei
你应先判别mail header里的content type, 再来分解 message body。
这里貌似base64的编 ...
ulmer 发表于 2010-12-16 18:37

谢谢。
我测试目录里边 2封邮件 一封正文可以解析 另外一封就是我贴的乱码。

我用outlook的message options看了一下 发现他们的区别可能是在Content-Transfer-Encoding  脚本正常解析的是binary  另外一封的是7bit


邮件以前没怎么弄过 看了一下帮助  不少东西 前面的路还很长 一个小问题就把我给难倒了 呵呵。

论坛徽章:
0
4 [报告]
发表于 2010-12-17 15:40 |显示全部楼层
本来就不负责解码
wfnh 发表于 2010-12-16 21:01

internet因为传输的关系 解码 编码是很重要的一环 基本功还是太浅了啊  perl写的程序太少了。

我这种情况应该怎么解码呢 原来是什么编码类型? MIME:arser base64啦 有点头晕了
有没有好的教程推荐一下 谢谢。

论坛徽章:
0
5 [报告]
发表于 2010-12-17 16:23 |显示全部楼层
本帖最后由 yaoliwei 于 2010-12-17 16:30 编辑

我看了一下Content-Transfer-Encoding是7bit的话 其实只是标识宽度而已 但是没有真正的encoding  
但是我贴出来的内容又是编码过的

用base64也decode过 decode出来什么都没有。

这是怎么回事呢?

论坛徽章:
0
6 [报告]
发表于 2010-12-17 16:41 |显示全部楼层
MIME::Base64 decode 我都看到你信内容了……
zhlong8 发表于 2010-12-17 16:35

是把 我赶紧去试试。谢谢谢谢。。。。。。。。。。

论坛徽章:
0
7 [报告]
发表于 2010-12-17 16:50 |显示全部楼层
本帖最后由 yaoliwei 于 2010-12-17 17:25 编辑
MIME::Base64 decode 我都看到你信内容了……
zhlong8 发表于 2010-12-17 16:35

试过了 确实可以的 我不知道为啥 之前我试过base64的 当时不行 可能某个地方 用错了。

有个问题 我出问题的邮件encoding是7bit 这个和base64是两种编码 前者照理说不需要解码的
请问一下 这是啥原因呢 我用的是outlook。
(微软的东西真是妖怪 我用perl去读  能读到是base64 但outlook里边就显示bit7)

再次感谢。

论坛徽章:
0
8 [报告]
发表于 2010-12-21 10:11 |显示全部楼层
回复  yaoliwei


    encoding 和 base64 两码事大哥,邮件一般都是 base64 编码传输应该,没详细研究 ...
zhlong8 发表于 2010-12-17 17:33

base64应该就是邮件编码的一种啊
谢谢你的提醒 不然我现在估计还在挣扎呢。

论坛徽章:
0
9 [报告]
发表于 2010-12-21 10:32 |显示全部楼层
本帖最后由 yaoliwei 于 2010-12-21 10:33 编辑
回复  yaoliwei

瞎猫抓了个死老鼠。

至少应该先了解一下构造一个电子邮件的文件格式,即相关的RFC协 ...
ulmer 发表于 2010-12-18 00:28

绝对接受批评 就是临时要分析邮件 然后临时找个perl模块来做 对邮件的协议 文档结构都还不大清楚 附件等如果再加入我就更高不清楚了。
看来还是浮躁啊。。。。

回归问题,
我用的模块是Mail::IMAPClient 用它来读邮件header 能找到tnef相关的字段X-MS-TNEF-Correlator,不过找不到Content-Type: application/ms-tnef; name="winmail.dat"(outlook里边可以看到这个)

我现在大概测试了一下我这边的邮件(用Mail::IMAPClient来读header) Content-Transfer-Encoding有2种类型 一种是base64 另外一种是quoted-printable,前者用MIME::Base64来解码 后者我不解码也可以直接读取(查资料 ascii字符这种编码是human-readable的)。

另外我这边现在还有另外一个问题 又要见笑了 我这边邮箱下面自己建的目录 增删里便的邮件 结果perl程序里便都没有受到影响 以前是没这问题的 晕啊。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP