免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: huang6894
打印 上一主题 下一主题

【问题】对N个相似文本进行计算分析?5000积分求解决~ [复制链接]

论坛徽章:
8
技术图书徽章
日期:2013-08-22 11:21:28未羊
日期:2015-01-19 22:22:25巳蛇
日期:2014-08-11 16:53:08子鼠
日期:2014-05-29 09:04:44摩羯座
日期:2014-04-11 14:15:07丑牛
日期:2014-01-24 12:41:28金牛座
日期:2013-11-21 17:38:28射手座
日期:2015-01-21 08:50:32
31 [报告]
发表于 2014-08-12 11:35 |只看该作者
回复 27# afukada


    是的,-_-#,楼主不但语文不好而且还粗心

论坛徽章:
0
32 [报告]
发表于 2014-08-12 12:04 |只看该作者
看起來可以使用dynamic programming

以這個例子為例

flag3 flag1 flag3 flag1 flag1  flag3  flag1  flag1  flag1   flag1  flag1

共有11個點

     1 2 3 4 5 6 7 起始位置
5   1
6   0 1
7   0 1 1
8   1 1 1 1
9   1 1 1 1 1
10 1 1 1 1 1 1
11 1 1 1 1 1 1 1





最上面那一列是起始位置(從1-7, 因為題目條件至少要5個點, 所以最末端就是7-11)
最左邊那一排是終止位置(從5-11, 因為題目條件至少要5個點, 所以最前端就是1-5)

表裡面的數字代表是哪個flag(flag1-flag3, 0表示沒有flag)
所以可以得到這張表只有一個flag的可能性
就是flag1
取其最長長度
就是1-11
所以可以得到
1-11 flag1

驗證一下

flag3 flag3 flag3 flag2 flag2  flag2  flag2  flag3  flag3   flag3  flag3

     1 2 3 4 5 6 7 起始位置
5   3
6   0 2
7   0 2 2
8   3 0 2 2
9   3 0 0 2 2
10 3 0 0 0 0 3
11 3 3 0 0 0 3 3





可以得到這張表有兩個flag的可能性
就是flag2和flag3
其中flag2的priority較高
所以取其最長長度2-7, 3-8, 4-9
這邊就...

所以是不是還需要考慮其他原因
比方說還要比例最高(因為照你題目敘述, 4-8是所有組合裡面flag2的比例最高)

论坛徽章:
8
技术图书徽章
日期:2013-08-22 11:21:28未羊
日期:2015-01-19 22:22:25巳蛇
日期:2014-08-11 16:53:08子鼠
日期:2014-05-29 09:04:44摩羯座
日期:2014-04-11 14:15:07丑牛
日期:2014-01-24 12:41:28金牛座
日期:2013-11-21 17:38:28射手座
日期:2015-01-21 08:50:32
33 [报告]
发表于 2014-08-12 12:25 |只看该作者
回复 30# afukada


    (⊙0⊙)。。。流弊!!!

论坛徽章:
0
34 [报告]
发表于 2014-08-12 13:30 |只看该作者
  O(∩_∩)O~回复 3# pitonas


   

论坛徽章:
8
技术图书徽章
日期:2013-09-30 08:51:28技术图书徽章
日期:2013-12-11 09:26:39白羊座
日期:2013-12-27 15:27:13金牛座
日期:2014-01-06 09:13:05天蝎座
日期:2014-01-21 14:23:28酉鸡
日期:2014-05-09 16:51:12卯兔
日期:2014-08-11 16:49:1515-16赛季CBA联赛之八一
日期:2017-08-14 23:24:57
35 [报告]
发表于 2014-08-12 14:26 |只看该作者
昨天看的解释,和今天看的解释,完全是2种不同的情况。

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
36 [报告]
发表于 2014-08-12 15:13 |只看该作者
回复 1# huang6894


    如果是你给的数据应该输出啥?

论坛徽章:
8
技术图书徽章
日期:2013-08-22 11:21:28未羊
日期:2015-01-19 22:22:25巳蛇
日期:2014-08-11 16:53:08子鼠
日期:2014-05-29 09:04:44摩羯座
日期:2014-04-11 14:15:07丑牛
日期:2014-01-24 12:41:28金牛座
日期:2013-11-21 17:38:28射手座
日期:2015-01-21 08:50:32
37 [报告]
发表于 2014-08-12 15:33 |只看该作者
回复 33# xiumu2280


    {:2_166:} 。。。我错了,对不起

论坛徽章:
8
技术图书徽章
日期:2013-08-22 11:21:28未羊
日期:2015-01-19 22:22:25巳蛇
日期:2014-08-11 16:53:08子鼠
日期:2014-05-29 09:04:44摩羯座
日期:2014-04-11 14:15:07丑牛
日期:2014-01-24 12:41:28金牛座
日期:2013-11-21 17:38:28射手座
日期:2015-01-21 08:50:32
38 [报告]
发表于 2014-08-12 15:34 |只看该作者
回复 34# yinyuemi


    {:2_175:} 我想还是放弃吧。。。太麻烦了。。。

论坛徽章:
5
丑牛
日期:2014-01-21 08:26:26卯兔
日期:2014-03-11 06:37:43天秤座
日期:2014-03-25 08:52:52寅虎
日期:2014-04-19 11:39:48午马
日期:2014-08-06 03:56:58
39 [报告]
发表于 2014-08-12 17:56 |只看该作者
给一些复杂的例子, 并解释 ~ {:2_171:}
你的规则 ?

my $question; ~ {:2_168:}

3 3 3 2 2 1 1 1 2 3

1 > 3

1:
2 2 1 1 1 => F1: 4-8
3 3 3 => F3: 1-3


or
2:

1 1 1 2 3 => F1: 6-10
3 3 3 2 2 => F3: 1-5

or ....




example 2.txt

flag3 flag3 flag3 flag2 flag2  flag2  flag2  flag3  flag3   flag3  flag3

f2 > f3

1:
flag3 flag3 flag2 flag2  flag2 => F2: 2-6
flag2  flag3  flag3   flag3  flag3 => F3: 7-11

2:
flag2 flag2  flag2  flag2  flag3 => F2: 4-8
flag3 flag3 flag3 => F3: 1-3
flag3   flag3  flag3 => 9-11

3:
flag3 flag2 flag2  flag2  flag2 => F2: 3-7
flag3  flag3   flag3  flag3 => F3: 8-11

or....

论坛徽章:
8
技术图书徽章
日期:2013-08-22 11:21:28未羊
日期:2015-01-19 22:22:25巳蛇
日期:2014-08-11 16:53:08子鼠
日期:2014-05-29 09:04:44摩羯座
日期:2014-04-11 14:15:07丑牛
日期:2014-01-24 12:41:28金牛座
日期:2013-11-21 17:38:28射手座
日期:2015-01-21 08:50:32
40 [报告]
发表于 2014-08-12 21:05 |只看该作者
回复 37# pitonas


    实际上。。。很少会遇到这么复杂的情况的。。。不过正如大神的例子:
3 3 3 2 2 1 1 1 2 3,根据1>2>3,理论应该是:
1 1 1 2 3 => F1: 6-10
3 3 3 2 2 => F3: 1-5

flag3 flag3 flag3 flag2 flag2  flag2  flag2  flag3  flag3   flag3  flag3
应该是:

flag2 flag2  flag2  flag2  flag3 => F2: 4-8
flag3 flag3 flag3 => F3: 1-3
flag3   flag3  flag3 => 9-11

----------------------
好吧,我自己都晕了。。。还是果断放弃的好~
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP