免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: beerpapo

[Mail] 请问大家是如何反图片垃圾邮件的? [复制链接]

论坛徽章:
0
发表于 2007-03-12 17:07 |显示全部楼层
我知道. 冒充的几率非常小.

但你这种还是不好.一律拒绝,然后一个一个放.

人的管理工作多, 如果一个大些的贸易公司, 因为联系几乎无穷多, 白名单也太大.

(我丝毫不否认对你的情况很有效).

论坛徽章:
0
发表于 2007-03-12 17:22 |显示全部楼层
是的
这个白名单真的会让人搞怕
特别是对方第一次发邮件给你的时候
按上面的程式都会跑到spam@yourdomain.com这个账号里去
这个也是我的程式的最大的缺点

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
发表于 2007-03-12 17:26 |显示全部楼层
原帖由 vyouzhi 于 2007-3-12 17:03 发表


这个没错
但你有没有统计
会有多少的垃圾邮件来冒充的
除非别人对你有针对性的
否则这个原因太小了

這的確不大,我自己也是統計 user 發過的名單自動形成白名單

另回答前面的問題, image spam 不是只有 cid 而以
若以 cid 而論,它可以是 QP
所以可能形成 =43=49=44
也可以是斷行形式
=44=
=49=
=44=
HEX....

也可以空 N 行
=43
=
=
=49
=
=
=
=
=
=
=
=44

它也可以再做一次 multipart,轉成 base64...
明天再說,今天要下班了,
還有不同的變化,或附件形式,今天 cid 最多,但日後肯定再變 !

论坛徽章:
0
发表于 2007-03-13 09:04 |显示全部楼层
TO abel,

昨天没有详细看你的帖子。刚才比较细的浏览了。

LZ问的是如何才能反图片垃圾邮件的问题。我回答的是用专业的收费产品和服务,完全正确。
我再说一次,专业的收费产品和服务是有(不止一个)可以做到95%以上阻挡各种垃圾,包括图片。
如果仅仅是图片,有些产品的比例会更高。因为图片对于有些算法讲阻挡比其他某种类型的垃圾更容易。

根据你的帖子看可以知道你认为:
要想100%阻挡图片垃圾,
1)必须先OCR 100%将图片的文字识别出来
2)根据识别出来的文字用关键词(如SA那样)匹配来确定是否是垃圾
3)如果OCR只能识别出50%的文字,那么阻挡图片垃圾最多只能达到50%的有效比例。

你这种想法很可笑。是刚刚接触反垃圾的人才会有的想法。

至于163的实验问题,163有不是我所在公司,我和它没有关系。他在WEB PAGE上说阻挡垃圾96%以上我相信。虽然我没有用过他们的信箱,但那么一个大的公司公开的声明---因此我信。

至于你你直接发图片进去实验,就得出结论人家是0%,很可笑。
我要说明:
1)直接发图片进去实验仅仅对根据邮件文本内容或OCR出来的文本内容识别垃圾的系统才有效果。
而这样的反垃圾方法是原始的和效果不好的。我不相信163是用这样的方法。
2)直接发图片进去实验没有意义。垃圾发送者的发送行为(IP,PTR,FROM,等)也就是模式和你区别太大了。
3)那么如何实验呢?答:建立一个邮箱。正常使用,看垃圾邮件多少。

我会写另外一个帖子--关于用各种技术综合包括SMTP行为识别阻挡垃圾邮件的帖子。

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
发表于 2007-03-13 09:21 |显示全部楼层
原帖由 abel 于 2007-3-12 17:26 发表

這的確不大,我自己也是統計 user 發過的名單自動形成白名單

另回答前面的問題, image spam 不是只有 cid 而以
若以 cid 而論,它可以是 QP
所以可能形成 =43=49=44
也可以是斷行形式
=44=
=49=
=44=
H ...


以上,我們知道這是 QP 作法,那也可以有 base64 做法,也就是所有的
Content-Transfer-Encoding: quoted-printable

都換成
Content-Transfer-Encoding: base64

那 cid 就至少會有四種變化出現,這個在實作上都太容易去避開 cid:

不然就是多重 multi-part , A-part 包 B ,C part, 接 D part  (看不懂就是對這些沒有概念),如此也不會出現 cid: 的關鍵字

當然現在問題還沒有到這個程度(是沒有這麼多,但不是完全沒有),但不代表以後不會有,最後的解法肯定會
變成還原這些 multi-part,再來找關鍵字 (仍然不是找圖中的 keyword),但是很可惜的, html 的 URI
也可以有 N 種寫法來表示同一件描述.或以不同的 charset 來變化,再不然就是用 javascript/rss/css 等來
控制 (這個就更牛了), 也可以 embeded 一個外部的 uri ....你們慢慢想吧,不然來個 flash 也不錯!

不然也可以全不要文字,就是一張圖,這個東西很原始,只要來自 好的 (弄一個好的 Server 有什麼難的,spamer 有的都還有 DomainKeys 或是 SPF ,搞得比你還要好, rdns,helo,mail/rcpt 那些檢查對專門的根本就是癈材)的 Server 大概就能 break 你的 rule 了

好了,夠複雜了,但還有更進化形的! 不過 mail 的 multi-part + html 變化 排列組合巳經夠看了
cid 在我來看根本是沒有用的,也只能應付一時而以,但再一陣子就會再變了,那些對 cid: 後的 hex 值做
Scoring 的也沒有用, Spamer 發現他的信被 Block 太多很簡單就可以變形的

论坛徽章:
0
发表于 2007-03-13 09:30 |显示全部楼层
现在垃圾邮件还真是烦人。

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
发表于 2007-03-13 09:32 |显示全部楼层
原帖由 思一克 于 2007-3-13 09:04 发表
TO abel,

昨天没有详细看你的帖子。刚才比较细的浏览了。

LZ问的是如何才能反图片垃圾邮件的问题。我回答的是用专业的收费产品和服务,完全正确。
我再说一次,专业的收费产品和服务是有(不止一个)可以做 ...

思兄,你真的看懂我的話了 ? 不要讓我笑好不好,我的話重點只在於對圖片 spam 的無奈 !
從頭開始的回帖就是這樣!

再看上一樓我回的,你以為 spamer 不會搞 smtp 呀,那麼簡單的事你用那些一般的檢查對
全部就一體適用 ? spamer 幹嗎搞圖片 ? 我前面都可以 pass 你的 smtp check,甚至我自己(spamer)
都做的比你好, 就是因為你可以對 keyword 檔,我才搞圖片讓你抓不到或不好抓
搞圖片浪費 spamer 的 resource, spamer 也不想,就是因為內容而以,要 pass 你那些 smtp check,
就像 163 那白吃一樣,搞個好的 Server,弄個成萬上百萬僵屍電腦你防得了
太多 antispam 產品總是說自己多好,說明白了也不過是一些 smtp check 和內容檢查(有些白吃 的
antispam還會做 smtp callback check),自己搞一堆像專有名詞的四不像

论坛徽章:
0
发表于 2007-03-13 09:45 |显示全部楼层
To Abel,

我不会给别的公司做广告。仅仅说明问题而已。

你说的“白痴”的ANTISPAM会有的。我从来没有否认。
但不是全部。我说过,有些产品是不白吃的。比如美国的XXXXXXX
人家一个专业做反垃圾的公司近10年的许多专业人的工作,怎么全都变为白吃了。

不要轻易低估了别人的智商。

我的一个朋友实验过XXXXXXXX,说还可以。图片垃圾肯定阻挡大于95%。我相信。

还有,国内的XXX的企业油箱,自己研制的产品,图片垃圾阻挡率也95%大于。

搞反垃圾,95%是一个目标,也是一个已经实现了的事实。



"
再看上一樓我回的,你以為 spamer 不會搞 smtp 呀,那麼簡單的事你用那些一般的檢查對
全部就一體適用 ? spamer 幹嗎搞圖片 ? 我前面都可以 pass 你的 smtp check,甚至我自己(spamer)
都做的比你好, 就是因為你可以對 keyword 檔,我才搞圖片讓你抓不到或不好抓
搞圖片浪費 spamer 的 resource, spamer 也不想,就是因為內容而以,要 pass 你那些 smtp check,
就像 163 那白吃一樣,搞個好的 Server,弄個成萬上百萬僵屍電腦你防得了
太多 antispam 產品總是說自己多好,說明白了也不過是一些 smtp check 和內容檢查(有些白吃 的
antispam還會做 smtp callback check),自己搞一堆像專有名詞的四不像 "

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
发表于 2007-03-13 09:57 |显示全部楼层
誰在和你說什麼 95%,total 的 95% 有什麼難的,在我這我用自己的99% 都可以,那些 pass 進來的
1% 中 100% 都是圖片,被檔下來的才不管你是 好的 Server 發的 ,就像你舉的例 163, 只因
為我是好的 server 它就像白吃一樣的 all pass, 這種 antispam 我看極其陽春, 我做的 antispam 架構不給別人服務,但是可以做到一台收信,多台 Round Robin 過濾,當然我們這種小公司只要全弄在一台上就好了

不需要吹噓什麼 9x%, 那些東西對於像我這種人根本是沒有用的,我用好的 Server 加上 pack/unpack 的一
些技術隨便都可以繞過你的過濾,對於技術更高的專業 spam 根本沒有什麼作用, 9x% 只是那些笨蛋的結果
而以

论坛徽章:
0
发表于 2007-03-13 10:16 |显示全部楼层
TO ABEL,

我说的TOTAL 95%,而图片本身比95%还高。

你老用笨蛋,白吃,X, 这些词干什么? 无论说谁也没有意义呀
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

SACC2019中国系统架构师大会

【数字转型 架构演进】SACC2019中国系统架构师大会,7折限时优惠重磅来袭!
2019年10月31日~11月2日第11届中国系统架构师大会(SACC2019)将在北京隆重召开。四大主线并行的演讲模式,1个主会场、20个技术专场、超千人参与的会议规模,100+来自互联网、金融、制造业、电商等领域的嘉宾阵容,将为广大参会者提供一场最具价值的技术交流盛会。

限时七折期:2019年8月31日前


----------------------------------------

大会官网>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP