免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123
最近访问板块 发新帖
楼主: newfinder
打印 上一主题 下一主题

[文本处理] 数据差异的筛选问题 [复制链接]

论坛徽章:
0
21 [报告]
发表于 2014-09-15 15:42 |只看该作者
回复 18# Kasiotao
我错了,我尊的错了……

   

论坛徽章:
0
22 [报告]
发表于 2014-09-15 15:46 |只看该作者
回复 15# newfinder
大侠,我知错了,我不应该把range写成ragne,结果一直运行不对,我错了…………
{:2_169:}

   

论坛徽章:
780
金牛座
日期:2014-02-26 17:49:58水瓶座
日期:2014-02-26 18:10:15白羊座
日期:2014-04-15 19:29:52寅虎
日期:2014-04-17 19:43:21酉鸡
日期:2014-04-19 21:24:10子鼠
日期:2014-04-22 13:55:24卯兔
日期:2014-04-22 14:20:58亥猪
日期:2014-04-22 16:13:09狮子座
日期:2014-05-05 22:31:17摩羯座
日期:2014-05-06 10:32:53处女座
日期:2014-05-12 09:23:11子鼠
日期:2014-05-21 18:21:27
23 [报告]
发表于 2014-09-15 15:55 |只看该作者
回复 22# newfinder

...是的,你1楼的原始数据有笔误,我们测试的时候都改过了...
   

论坛徽章:
0
24 [报告]
发表于 2014-10-11 15:42 |只看该作者
本帖最后由 newfinder 于 2014-10-11 15:55 编辑

回复 12# Kasiotao
大侠,最近我用你提供的代码在分析做我的数据,可是发现结果有点不太像我想要的,我自已试着改,但基础太弱,改了半天,连原来的都出不来了。所以现在还想请大侠帮帮忙,看怎么调整一下,可以输出我想要的。还是以原来的数据为例,不过标红的地方是与之前有所不同的。

data1的内容如下:
name1 range1:1-4 4
name1 range1:7-11 5
name2 range1:13-16 4
name2 range1:20-25 6
name2 range2:3-4 2
name1 range2:10-15 6
name1 range2:18-23 6
name1 range2:25-29 5
name2 range3:5-9 5
name2 range3:11-15 5
name1 range3:18-22 5
…………

data2的内容如下:
name1 range1:1-3 3
name1 range1:4-6 3
name2 range1:17-19 3
name1 range1:21-24 4
name2 range1:26-28 3
name1 range2:4-6 3
name2 range2:8-9 2
name1 range2:12-16 5
name2 range2:26-28 3
name2 range3:3-6 4
name2 range3:10-12 3
…………

想根据第二列的数据输出这两个数据集的共同区域及差异区域。
共同区域定义的标准为:只要有一个数字重叠就为一个共同区域,如1-2、2-3就为一个共同区域
差异区域定义的标准为:没有一个数字重叠

按照这个标准来做的话,上面的这两个数据集的结果应该为:
data1_diff:
name1 range1:7-11 5
name2 range1:13-16 4
name1 range2:18-23 6
naem1 range3:18-22 5

data2_diff:
name2 range1:17-19 3
name2 range1:26-28 3

name2 range2:8-9 2

两个数据集共同的区域为:
data_comm:
name1 range1:1-4,1-3,4-6 4,3,3
name2,name1 range1:20-25,21-24 6,4
name2,name1 range2:3-4,4-6 2,3
name1,name2 range2:25-29 26-28 5,3
name1 range2:10-15,12-16 6,5
name2 range3:5-9,3-6 5,4
name2 range3:11-15,10-12 5,3

(标红的是想要得到的格式,而我现在的结果都是
name2 range1:17-19,26-28 3,3 和
name2,name1,name1,name2 range2:3-4,4-6,25-29 26-28 2,3,5,3
name2 range3:5-9,3-6 11-15,10-12 5,4,5,3)
就是想要分开来,还请大侠帮帮忙,谢谢了


谢谢了

   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP