Chinaunix

标题: CU马甲验证算法研究 [打印本页]

作者: nilgod    时间: 2012-07-01 16:56
标题: CU马甲验证算法研究
本帖最后由 nilgod 于 2012-07-01 17:25 编辑

问题描述RT。CU高手@塑料袋,CU强人@群雄逐鹿中原,的算法如下。不知各位高人神仙,有兴趣讨论或者提出新的更强算法没有?当然,纯粹娱乐而吐槽两句也可以。
另外,特别邀请如下CU各路活跃散仙前来观看@flw@Ager@starwing83@龙骨五钱@MMMIX@狗气球@chinesedragon@folklore@三月廿七@hongshaohu@fender0107401@bruceteen@幻の上帝@aychxm@KBTiller@zylthinking@mirnshi@oooooxxxxx@hbmhalley@koolcoy@hellioncu@tempname2@L_kernel@yulihua49@wyw5257@鸡丝拌面@_Rayx@ifreecoding@AD8018@OwnWaterloo@wwwsq@gtkmm@cokeboL@千年老狼@pandaiam@sonicling@bbjmmj

1.PNG (101.98 KB, 下载次数: 22)

1.PNG

2.PNG (65.83 KB, 下载次数: 24)

2.PNG

作者: nilgod    时间: 2012-07-01 17:16
还是我先来吧。

我觉得塑料袋那个算法不错,简单易行。
作者: nilgod    时间: 2012-07-01 17:24
欢迎大家踊跃发言,有新算法我会更新到第一楼去lollollol
作者: fender0107401    时间: 2012-07-01 17:25
主要是提高马甲的成本吗,一般而言马甲和大号都是一个机器上出来的。

所以技术上就能搞定,不需要什么人工只能只来的高深算法。
作者: nilgod    时间: 2012-07-01 17:27
回复 4# fender0107401


这个一般可信度大概多少?有数据么?另外,如果这个假设不成立,我们该如何设计一个算法来觉得这个问题?

f版可有想法?
作者: _Rayx    时间: 2012-07-01 17:29
最主要的原因是:根据相关法侓法规,马甲是不犯法的。
作者: nilgod    时间: 2012-07-01 17:30
回复 6# _Rayx


你这不是在侧面说塑料袋和群雄逐鸡中原有病么?你是这个意思么?。。。好吧。。。
作者: fender0107401    时间: 2012-07-01 17:32
本帖最后由 fender0107401 于 2012-07-01 17:32 编辑

回复 5# nilgod

识别难度很大,计算机毕竟不是人脑,没有那么牛逼的模式识别能力,就算有这种算法,也需要很大量的数据喂给它吃来训练它。

最关键的是在这里得瑟的多数都是程序员,而且还都他妈的多数都是C程序员,所以大家都知道计算机是怎么思考的,就算你设计了一个算法出来,这些人也知道怎么样让你的算法找不着北。  
作者: fender0107401    时间: 2012-07-01 17:33
本帖最后由 fender0107401 于 2012-07-01 17:37 编辑

C程序员是一个可怕的物种。

这帮人总能大致猜测出编译器在干什么,能清楚的看清楚指针和内存之间的关系,多数都懂数据结构和算法,这些人能很容易的让程序变得牛逼或者傻逼。
作者: nilgod    时间: 2012-07-01 17:37
回复 8# fender0107401


这个我不同意f版的说法。

人留下信息是不自觉的,是无意识的。所以只要我们能设计一个算法,然后让这些无意识的数据能被收集利用起来,应该可以获得不错的马甲辨识效果。

比如“马甲四号”,这个id我基本就断定是某人马甲了,你可以直接看他的言论来定。
作者: nilgod    时间: 2012-07-01 17:38
回复 9# fender0107401


    唉,我们别偏移话题了。继续看塑料袋和群雄逐鸡的算法吧。

看看CU还有人出来挑战它们没有。
作者: fender0107401    时间: 2012-07-01 17:39
回复 10# nilgod

大哥你懂不懂什么叫监管成本啊?

那个马甲会傻逼到那个程度叫马甲4号啊。

一个认真的敬业的马甲都会起一个牛逼闪闪的名字,其锋芒也许改过大号。
作者: fender0107401    时间: 2012-07-01 17:40
回复 11# nilgod

不是跑题,这是在讨论其可行性。
作者: nilgod    时间: 2012-07-01 17:42
回复 12# fender0107401


    你没懂我意思。

我说马甲四号这个id是马甲并不单纯是名字含有“马甲”这个关键字,而是他的帖子和言论,f版有兴趣可以自己看看,其帖子的主题和上下文,以及当时环境下的讨论帖子之间的关系是可以做聚类的,而且我估计很容易把这个就是别人的帖子聚类在一起了。
作者: fender0107401    时间: 2012-07-01 17:45
回复 14# nilgod

这个我都懂,我之前搞软计算方法的。

你首先要有一个清楚的认识,一组输入和输出,这组输入和输出必须是正确的,然后喂给一个算法(假设这个算法能识别并学习其中的规律)。

这组输入和输出必须是正确的,你要先识别出来,这个成本很大的,你考虑过没有。
作者: nilgod    时间: 2012-07-01 17:50
回复 15# fender0107401


不,我不需要正确的输出,而是一个相对正确的输出,因为我要保证的是判断成马甲无错,而判断不是马甲的未必不是马甲。

这个程度上来说,整个算法目前应该是可以设计出来的。不过这个和塑料袋和群雄猪鸡的算法就不同了,我们先讨论它们的算法或者它们自己来讨论。
作者: nilgod    时间: 2012-07-01 17:55
@群雄逐鹿中原

@塑料袋

快来啊,详细描述一下你们的算法
作者: nilgod    时间: 2012-07-01 18:15
遥遥互换@塑料袋@群雄逐鹿中原来研究算法啊。。。

人呢?算法提出就跑了?
作者: _Rayx    时间: 2012-07-01 18:19
回复 7# nilgod


    虽然马甲不好,但很难禁止。
作者: nilgod    时间: 2012-07-01 18:27
回复 19# _Rayx


难不难无所谓,我们这里是在讨论一个可行的算法。
作者: nilgod    时间: 2012-07-01 18:30
期待@塑料袋利用高深的数学终极原理,并结合茅厕洞,马克死等等先进思想,然后提出一个终极算法来解决这个马甲问题,这个问题好难,反正我是没法搞了,期待@塑料袋神仙能解决。


作者: cokeboL    时间: 2012-07-01 18:46
如果是针对那种无耻之徒,我觉得唯有人肉搜索算法+大棒才是合理有效的不二法门!
作者: cdtits    时间: 2012-07-01 18:49
请问:如果是公共的上网机器,很多人分时使用,能搞定么?
作者: nilgod    时间: 2012-07-01 18:56
回复 22# cokeboL



这个不太好,把事情搞复杂了。

我们现在需要的是一个简单可行的算法来搞这个。
作者: nilgod    时间: 2012-07-01 18:57
回复 23# cdtits


    你这个特别要问@塑料袋
作者: seelook    时间: 2012-07-01 19:10
本帖最后由 seelook 于 2012-07-01 19:10 编辑

@这么多, 想人围观


作者: hbmhalley    时间: 2012-07-01 21:47
同鹿. cookie里存着用户名。另外两用户在线时长相似 活跃板块相似 但在线时间无交集的可疑度很高。
作者: nilgod    时间: 2012-07-01 23:26
回复 27# hbmhalley


    有道理,不过我觉得依然不是太好,以为你这个怎么做成算法?给个详细描述。
作者: nilgod    时间: 2012-07-01 23:35
@塑料袋
@群雄逐鹿中原

呼唤两位,快来研究算法啊。。。
作者: nilgod    时间: 2012-07-01 23:36
本帖最后由 nilgod 于 2012-07-01 23:38 编辑

@塑料袋

我现在可是身中剧毒哦,脑子不清晰,一下就打死了,别错过机会哦,错过了就没有了哦。

另外,带上你的特供脑残片牌精神兴奋剂,和小红书,还有你光荣的,一起来吧。我就等你了。
作者: oooooxxxxx    时间: 2012-07-02 01:50
词频分析就能识别大部分马甲,上马甲的时候加代理换浏览器很容易,但是能时刻注意自己语言习惯的人很少。
作者: nilgod    时间: 2012-07-02 01:57
回复 31# oooooxxxxx


我觉得这个比@塑料袋大婶的要稍微靠谱一点,不过也不怎么出色。

能改进完善,提出完整的算法么?
作者: fender0107401    时间: 2012-07-02 08:07
回复 31# oooooxxxxx

样本空间可能不够。
   
作者: hbmhalley    时间: 2012-07-02 08:26
回复 28# nilgod


    分别处理每个ip,记录此ip所有用户的上下线事件,以此统计每对用户的重叠在线时长,再用个类似 重叠时长/(A时长*B时长) 之类的排个序,然后这大概就是个参考信息 怎么用另说.
作者: hellioncu    时间: 2012-07-02 09:04
以后统统实名制,马甲死光光
作者: oooooxxxxx    时间: 2012-07-02 10:11
fender0107401 发表于 2012-07-02 08:07
回复 31# oooooxxxxx

样本空间可能不够。

这个可能,帖子都太短,累加效果不好。
作者: ggmove    时间: 2012-07-02 10:20
本帖最后由 ggmove 于 2012-07-02 10:20 编辑

回复 35# hellioncu
实名制不错,可行,也不需要算法了


   
作者: Reallsc    时间: 2012-07-02 10:24
hbmhalley 发表于 2012-07-02 08:26
回复 28# nilgod

或者简单的签名下方显示IP即可,高校BBS都这么做。
作者: fender0107401    时间: 2012-07-02 10:59
回复 36# oooooxxxxx

而且,既然是马甲,就很可能打一枪换一个ID,没有大量的累计很难做词频统计。
作者: 群雄逐鹿中原    时间: 2012-07-02 11:02
每次注册,支付100元。
作者: koolcoy    时间: 2012-07-02 11:15
群雄逐鹿中原 发表于 2012-07-02 11:02
每次注册,支付100元。

这是到目前为止,最好的一个解决办法
作者: 方兆国    时间: 2012-07-02 11:17
回复 4# fender0107401


    可是一台电脑可以有好几个ip的,ifconfig  add
作者: 方兆国    时间: 2012-07-02 11:21
回复 38# Reallsc


    一个电脑可以有多个ip啊,就像ftp服务器那种,ftp是基于ip的,web是基于域名的
作者: 方兆国    时间: 2012-07-02 11:24
回复 27# hbmhalley


    用两个浏览器的人呢

作者: koolcoy    时间: 2012-07-02 11:27
通过技术手段能不能防止一个人用3个马甲,但是防止一个人用300个马甲还是很容易的
作者: fender0107401    时间: 2012-07-02 11:32
回复 42# 方兆国

所以说吗,我们要对付的是程序员,还有系统管理员,不是大叔大妈,没有那么容易搞定的。

   
作者: 方兆国    时间: 2012-07-02 11:33
回复 10# nilgod


    可是无限制的收集造成的成本还不如放任马甲
作者: 方兆国    时间: 2012-07-02 11:34
回复 46# fender0107401


    嗯,对了,我很好奇,用虚拟机的话,服务器接收到的mac和ip是那个电脑的
作者: hbmhalley    时间: 2012-07-02 11:39
回复 44# 方兆国


    要是连自己了都骗了那还有啥办法 两个浏览器 两个代理 两国语言 没辙啊
作者: 方兆国    时间: 2012-07-02 11:39
回复 14# nilgod


    可是,还有一些关系较好的CUer,经常在一起聊相同的话题,那……你懂得
作者: mirnshi    时间: 2012-07-02 11:41
闲得蛋疼。别以为穿上马甲,系统管理员就不认识你了。系统管理员想抓你,门牌号都搞得清清楚楚。打电话,上网,购物,都会泄漏行踪。
作者: 方兆国    时间: 2012-07-02 11:42
回复 49# hbmhalley


    對呀,我就安裝了三個瀏覽器,IE/IEx64,firefox,opera,不同的瀏覽器的cookie是分開的。再者說,哪有一個人會挂馬甲時使用同一個瀏覽器來挂,不停的登來登出的,累死人
作者: 方兆国    时间: 2012-07-02 11:43
回复 51# mirnshi


    怪不得CU經常有拍賣、贈送什麽的,原來是在收集信息啊
作者: 方兆国    时间: 2012-07-02 11:45
fender0107401 发表于 2012-07-02 11:32
回复 42# 方兆国

所以说吗,我们要对付的是程序员,还有系统管理员,不是大叔大妈,没有那么容易搞定的 ...


沒有人家做不到的,只有我們想不到的,方法多著呢,什麽代理服務器什麽的
作者: nilgod    时间: 2012-07-02 13:34
回复 34# hbmhalley


我觉得你这个ip记录就是一个很麻烦的事情了,因为ip是随机变化的,你咋记录?
作者: nilgod    时间: 2012-07-02 13:36
回复 35# hellioncu


    不要。我们不要搞得跟新浪微博那么严肃,又不是为了裆国统治,我们要的是言论自由。但是马甲这个东西有时候的确需要验证,主要是为了防止恶意攻击,比如开100个马甲去骂别人,或者误导民意,这个就不好了。这个问题还可以衍生到水军的处理问题等等。所以我觉得比较有意义。

简化来说,问题就是:

给你一堆言论,这些言论可能来自于多个帐号,怎么把这些帐号进行归一化,看哪些帐号的确是一个人在主导。
作者: nilgod    时间: 2012-07-02 13:37
回复 36# oooooxxxxx


    这个问题我们占时不用考虑,你假设原始数据都足够多就行。先简化问题。
作者: nilgod    时间: 2012-07-02 13:38
回复 38# Reallsc


    行之简单,问题是太容易绕过了。
作者: nilgod    时间: 2012-07-02 13:39
回复 40# 群雄逐鹿中原


    你这个脑残么?你会注册么?
作者: nilgod    时间: 2012-07-02 13:40
回复 46# fender0107401


    搞个聚类系统。
作者: nilgod    时间: 2012-07-02 13:41
回复 47# 方兆国


    放屁,你知道你在说什么么?此处根本没涉及到成本那个成面的问题,事情本来就复杂,你问题没解决又引入新问题,别耍这一套。
作者: nilgod    时间: 2012-07-02 13:42
回复 48# 方兆国


    mac可以随意造,ip要看虚拟机具体设置。
作者: nilgod    时间: 2012-07-02 13:42
回复 50# 方兆国


   
作者: nilgod    时间: 2012-07-02 13:43
回复 51# mirnshi


所以你这种就没得救了。

别发散,专注于讨论的问题。
作者: nilgod    时间: 2012-07-02 13:44
回复 52# 方兆国


小甜饼这些根本就不是正规的解决问题的该有的思路方向,所以你一开始就走错了路。
作者: nilgod    时间: 2012-07-02 13:50
再次互换@塑料袋,快来研究啊,@群雄逐鹿中原都来了,就差你了
作者: 财版    时间: 2012-07-02 14:22
撸哥撸哥可奈何
作者: 方兆国    时间: 2012-07-02 15:57
我还没有看到他给我的回复呢……就被禁言了
作者: wyw5257    时间: 2012-07-02 16:09
。。。悲剧的LZ
作者: 塑料袋    时间: 2012-07-02 16:15
孙行者走了,者行孙来了;
者行孙又走了,行者孙估计快来了。

楼主真是太NB咧,诠释了啥叫嚣张,啥叫疯狂。
昨天@了我半天,非要我回他贴,我是大气都不敢出一口啊,我算是彻底不想和这个人有任何瓜葛了,他忒NB咧
作者: Ager    时间: 2012-07-02 16:42
还没来得及跟帖,楼主就被封了……

但跟帖还是要跟的:

对于楼主的这个问题,在二进制的世界里,恐怕是没有普适而有效的解法的,必须借助于二进制世界以外的社会工程学。


作者: sonicling    时间: 2012-07-02 16:57
对 lz 表示哀悼。
作者: 千年老狼    时间: 2012-07-02 17:38
楼主1号很快会回来的
作者: Ager    时间: 2012-07-02 18:06
nilgod的马甲 发表于 2012-07-02 17:42
楼主没死,明天服务器就下来,3天左右,其他部件基本也会搭建好,然后我那边开好坛子大家就过来吧。既然cu没 ...


小沙发,支持!

对了……万一有人在贵论坛,抢注了网友在这里的ID,怎么办?

你看……社会工程学是无处不在的……

呵呵……



作者: hbmhalley    时间: 2012-07-02 18:19
回复 75# nilgod的马甲


    哟 .. 独立战争 ..

    希望别弄成台湾议会 ..
作者: Ager    时间: 2012-07-02 18:24
hbmhalley 发表于 2012-07-02 18:19
回复 75# nilgod的马甲

    哟 .. 独立战争 ..

    希望别弄成台湾议会 ..


倒不觉得是独立战争。

是五月花号的新大陆,呵呵……

作者: 鸡丝拌面    时间: 2012-07-04 14:14
nilgod的马甲 发表于 2012-07-02 17:42
楼主没死,明天服务器就下来,3天左右,其他部件基本也会搭建好,然后我那边开好坛子大家就过来吧。既然cu没 ...


好啊,支持




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2