免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 2886 | 回复: 10
打印 上一主题 下一主题

这种数据重排,shell如何实现? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-06-06 08:48 |只看该作者 |倒序浏览
原文件中内容格式如下:
2001001
2001004
2003113
2003889
2008001
2008002
2008004
2008553
2008554
2008555
2008556
2008557

需要转换成下面格式
2001001
2001004
2003113
2003889
2008001-2008002
2008004
2008553-2008557

(就是有连续的数据,就只记录一下启止位置的数据)这

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
2 [报告]
发表于 2008-06-06 09:28 |只看该作者

回复 #1 cqs1015 的帖子

try:

  1. $ awk '{array[NR] = $0} END { for (i=1; i <= NR; i++) if ( array[i] == array[i+1] - 1 && ! seq) { seq = 1;printf("%d-", array[i]) } else if ( array[i] != array[i+1] - 1) { seq =0 ;print array[i]} else if (! seq) print array[i]}' urfile
复制代码


改正:
  1. awk -f scr.awk urfile
复制代码


scr.awk:

  1. {
  2. if ( $1 == prevF1 +1 && ! seq ) { seq = 1 ; printf("%s-", prevF1)}
  3. else if ( $1 != prevF1 + 1 && NR != 1 && seq ) { seq = 0; print prevF1 }
  4. else if ( ! seq && NR != 1)  print prevF1
  5. prevF1 =$1
  6. }

  7. END { print prevF1}
复制代码

[ 本帖最后由 blackold 于 2008-6-6 12:22 编辑 ]

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
3 [报告]
发表于 2008-06-06 09:43 |只看该作者
awk '{if($0==a+1)i=1;else if(i){print "-"a;printf $0;i=0}else{if(NR==1)printf $0;else printf "\n"$0}a=$0}END{if(i)print "-"a;else print ""}' urfile

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
4 [报告]
发表于 2008-06-06 09:52 |只看该作者

回复 #3 ly5066113 的帖子

Good!

论坛徽章:
0
5 [报告]
发表于 2008-06-06 10:01 |只看该作者
感谢两位。两种方法都可以实现,但是不太明白意思,现在有个新的需求。
原文件变成这个样子。
A01,2001001
A03,2001004
A08,2003113
B01,2003889
B01,2008001
B01,2008002
B01,2008004
B01,2008553
B01,2008554
B01,2008555
B01,2008556
B01,2008557

需要转换成下面格式
A01,2001001
A03,2001004
A08,2003113
B01,2003889
B01,2008001-2008002
B01,2008004
B01,2008553-2008557

第一列的数据,只要原样输出就行!

论坛徽章:
0
6 [报告]
发表于 2008-06-06 10:29 |只看该作者
我也是新手,试着改改上面老大的帖子内容
url.awk的内容如下

  1. {
  2.         if($2==a+1 && b==$1)
  3.                 i=1;
  4.         else if(i && b==$1){
  5.                 print "-"a;
  6.                 printf $1","$2;
  7.                 i=0;
  8.         }else{
  9.                 if(NR==1){
  10.                         printf $1","$2
  11.                 }else
  12.                         printf "\n"$1","$2
  13.         }
  14.         a=$2;
  15.         b=$1;
  16. }
  17. END{if(i)print "-"a;else print ""}
复制代码


运行:
awk -F[,] -f url.awk data.txt

论坛徽章:
0
7 [报告]
发表于 2008-06-06 10:55 |只看该作者
多谢,这个很好用,新手就这么历害了。学习了

论坛徽章:
0
8 [报告]
发表于 2008-06-06 11:04 |只看该作者
他妈的看不懂
最近郁闷

论坛徽章:
0
9 [报告]
发表于 2008-06-06 11:08 |只看该作者

回复 #8 nuclearxin 的帖子

太好了~~~~
又发现一个水平和我差不多的~!~

论坛徽章:
0
10 [报告]
发表于 2008-06-06 11:14 |只看该作者
原帖由 kingsu 于 2008-6-6 11:08 发表
太好了~~~~
又发现一个水平和我差不多的~!~

郁闷的看不懂的一起来跟吧
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP