免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: expert1
打印 上一主题 下一主题

文件区间整理问题---悬赏100分 [复制链接]

论坛徽章:
16
IT运维版块每日发帖之星
日期:2015-08-24 06:20:00综合交流区版块每日发帖之星
日期:2015-10-14 06:20:00IT运维版块每日发帖之星
日期:2015-10-25 06:20:00IT运维版块每日发帖之星
日期:2015-11-06 06:20:00IT运维版块每日发帖之星
日期:2015-12-10 06:20:00平安夜徽章
日期:2015-12-26 00:06:302016猴年福章徽章
日期:2016-02-18 15:30:34IT运维版块每日发帖之星
日期:2016-04-15 06:20:00IT运维版块每日发帖之星
日期:2016-05-21 06:20:00综合交流区版块每日发帖之星
日期:2016-08-16 06:20:002015七夕节徽章
日期:2015-08-21 11:06:17IT运维版块每日发帖之星
日期:2015-08-14 06:20:00
21 [报告]
发表于 2010-09-02 11:26 |只看该作者
╮(╯▽╰)╭,看来这问题无解了。

论坛徽章:
0
22 [报告]
发表于 2010-09-02 11:27 |只看该作者
我靠 30分~~~~~~~ 有钱淫

论坛徽章:
0
23 [报告]
发表于 2010-09-02 11:28 |只看该作者
回复 25# nuclearxin


    你看错了,是200分。。

论坛徽章:
0
24 [报告]
发表于 2010-09-02 11:42 |只看该作者
回复 21# blackold


    那就死了,我...
我靠脸混饭的哇...

论坛徽章:
1
射手座
日期:2014-03-10 14:24:52
25 [报告]
发表于 2010-09-02 11:46 |只看该作者
确实很难,技术不行,还是坐等学习吧。

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
26 [报告]
发表于 2010-09-02 11:51 |只看该作者
区间可以合并么?
如果在一个section内存在:
250-260
270-280
是否可以合并成:
250-280

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
27 [报告]
发表于 2010-09-02 11:53 |只看该作者
&ptid回复 29# ly5066113


    应该合并的,按照LZ的描述,原始数据不会有这种情况。

评分

参与人数 1可用积分 +5 收起 理由
expert1 + 5 辛苦了。

查看全部评分

论坛徽章:
16
IT运维版块每日发帖之星
日期:2015-08-24 06:20:00综合交流区版块每日发帖之星
日期:2015-10-14 06:20:00IT运维版块每日发帖之星
日期:2015-10-25 06:20:00IT运维版块每日发帖之星
日期:2015-11-06 06:20:00IT运维版块每日发帖之星
日期:2015-12-10 06:20:00平安夜徽章
日期:2015-12-26 00:06:302016猴年福章徽章
日期:2016-02-18 15:30:34IT运维版块每日发帖之星
日期:2016-04-15 06:20:00IT运维版块每日发帖之星
日期:2016-05-21 06:20:00综合交流区版块每日发帖之星
日期:2016-08-16 06:20:002015七夕节徽章
日期:2015-08-21 11:06:17IT运维版块每日发帖之星
日期:2015-08-14 06:20:00
28 [报告]
发表于 2010-09-02 12:02 |只看该作者
本帖最后由 expert1 于 2010-09-02 12:10 编辑

回复 29# ly5066113


    汗,看错了,250-260
260-280

二者不相交啊,没办法合并。

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
29 [报告]
发表于 2010-09-02 12:09 |只看该作者
回复 31# expert1

可以合并,那么问题就简单了。
我们不需要判断a与b的区间关系,只需要记录每个数字属于哪个section就好了。
举例说明:
  1. $ cat a.txt
  2. section1
  3. 20-30

  4. section2
  5. 10-20
  6. $ cat b.txt
  7. section2
  8. 25-26
  9. $ awk -F - '/section/{s=$1}NF==2{for(i=$1;i<=$2;i++)a[i]=s}END{for(i in a) print i,a[i]}' a.txt b.txt | sort -k2,2 -k1n
  10. 21 section1
  11. 22 section1
  12. 23 section1
  13. 24 section1
  14. 27 section1
  15. 28 section1
  16. 29 section1
  17. 30 section1
  18. 10 section2
  19. 11 section2
  20. 12 section2
  21. 13 section2
  22. 14 section2
  23. 15 section2
  24. 16 section2
  25. 17 section2
  26. 18 section2
  27. 19 section2
  28. 20 section2
  29. 25 section2
  30. 26 section2
复制代码
先记录a中每个数字所属的section,然后用b去修定,结果排序。
这样问题就转变成判断连续数字的问题了,只需要将
21 section1
22 section1
23 section1
24 section1
27 section1
28 section1
29 section1
30 section1

改写成
section1
21-34
27-30

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
30 [报告]
发表于 2010-09-02 12:16 |只看该作者
本帖最后由 ly5066113 于 2010-09-02 12:18 编辑

回复 33# expert1


数据我没仔细看,但我感觉思路是可以转变的。
由判断a,b的关系,改为记录数字属于哪个section。
因为你的section与section之间是没有交集的,section内部有没有都没关系。
这样问题就简单了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP