免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 4426 | 回复: 22

配对-格式调整 [复制链接]

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
发表于 2012-04-08 11:12 |显示全部楼层
本帖最后由 yinyuemi 于 2012-04-08 14:38 编辑

最近坛里有些冷,任何方法都欢迎,sed,awk,perl ……

输入:

2       aaa
3       aaa
4       aaa
5       aaa
6       aaa
7       aaa
8       aaa
9       bbb
10      bbb
11      bbb
12      bbb
13      bbb
14      bbb
15      bbb

17      aaa
18      aaa
19      aaa
20      bbb
21      bbb
22      bbb

24      aaa
25      bbb

27      aaa
28      aaa
29      bbb
30      bbb


输出:

2 aaa 9 bbb
3 aaa 10 bbb
4 aaa 11 bbb
5 aaa 12 bbb
6 aaa 13 bbb
7 aaa 14 bbb
8 aaa 15 bbb

17 aaa 20 bbb
18 aaa 21 bbb
19 aaa 22 bbb

24 aaa 25 bbb
27 aaa 29 bbb
28 aaa 30 bbb


最后我会对大家的code进行测试,把执行效率的测试结果贴出了~(见14楼

论坛徽章:
0
发表于 2012-04-08 12:01 |显示全部楼层
本帖最后由 jiejie455 于 2012-04-08 12:01 编辑
  1. awk '{if(a[$2]){a[$2]=a[$2]" "$1}else{a[$2]=$1}}END{split(a["aaa"],c," ");split(a["bbb"],d," ");for(i=1;i<=length(c);i++){print c[i]" aaa "d[i]" bbb"}}' data
复制代码

论坛徽章:
0
发表于 2012-04-08 12:38 |显示全部楼层
#!/bin/bash -
#-----------------------------------------------------------------------------
#          FILE: compose.sh
#         USAGE: ./compose.sh  txt
#
#        AUTHOR: moo (God helps those who help themselves)
#  ORGANIZATION:
#       CREATED: 2012-04-08 12:33:31 CST
#      REVISION: 1.0
#-----------------------------------------------------------------------------
cat <<-txthere > txt
2       aaa
3       aaa
4       aaa
5       aaa
6       aaa
7       aaa
8       aaa
9       bbb
10      bbb
11      bbb
12      bbb
13      bbb
14      bbb
15      bbb
17      aaa
18      aaa
19      aaa
20      bbb
21      bbb
22      bbb
24      aaa
25      bbb
27      aaa
28      aaa
29      bbb
30      bbb
txthere

list=(
    2 15
    17 22
    24 25
    27 30
)

fn_main ()
{


    for (( CNTR=0; CNTR<${#list[@]}; CNTR+=2 )); do
        head=${list[$CNTR]}
        tail=${list[(($CNTR+1))]}

        # echo $head $tail

        sec=` cat txt | sed -n -e  "/^${head}\>/,/^${tail}\>/ p"`
        line=`echo "$sec" | wc -l`
        # echo $line

        echo "$sec" | awk -v line=$line '{
            if (NR <= line/2) {
                txt[NR]=$0
            } else {
                print txt[NR-line/2], $0
            }
        }'
    done
}

fn_main txt


# 感觉不完美,抛砖

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
发表于 2012-04-08 12:44 |显示全部楼层
回复 3# arthurscfd


    如果输入的文本有很多行的话,list 数组缺少通用性

论坛徽章:
0
发表于 2012-04-08 12:52 |显示全部楼层
回复 2# jiejie455


    很精辟,学习ing

论坛徽章:
130
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
发表于 2012-04-08 12:53 |显示全部楼层
回复 1# yinyuemi

$ perl -lane '{push(@a,"@F") if($F[-1] eq "aaa");print shift @a," @F" if($F[-1] eq "bbb")}' FILE
   

论坛徽章:
0
发表于 2012-04-08 12:55 |显示全部楼层
回复 4# yinyuemi


    是的,最近写东西有点不动大脑,看到问题就只想快点弄出来

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
发表于 2012-04-08 13:01 |显示全部楼层
回复 6# jason680


    8错!这个效率应该很高~

论坛徽章:
0
发表于 2012-04-08 13:02 |显示全部楼层
  1. sed -rn ':a;N;/aaa$/ba;/bbb$/{s/^([^\n]+)(.*)\n([^\n]+)$/\1 \3\2/;P;D}'
复制代码

论坛徽章:
1
辰龙
日期:2014-05-22 11:38:58
发表于 2012-04-08 13:05 |显示全部楼层
  1. awk '/aaa/{a[++na]=$0;next}/bbb/{b[++nb]=$0}END{for(i=1;i<=na||i<=nb;i++)print a[i]?a[i]:"",b[i]?b[i]:""}'
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

DTCC2020中国数据库技术大会 限时8.5折

【架构革新 高效可控】2020年8月17日~19日第十一届中国数据库技术大会将在北京隆重召开。

大会设置2大主会场,20+技术专场,将邀请超百位行业专家,重点围绕数据架构、AI与大数据、传统企业数据库实践和国产开源数据库等内容展开分享和探讨,为广大数据领域从业人士提供一场年度盛会和交流平台。

http://dtcc.it168.com


大会官网>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP