免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 4090 | 回复: 11
打印 上一主题 下一主题

[文本处理] 将一行变成多行 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-05-30 14:28 |只看该作者 |倒序浏览
原文是:
[root@wqk1 mnt]# cat datafile
northwest
western
southwest
southern
southeast
eastern
northeast
north
central

NW
WE
SW
SO
SE
EA
NE
NO
CT

Charles Main
Sharon Gray
Lewis Dalsass
Suan Chin
Patricia Hemenway
TB Savage
AM Main Jr.
Margot Weber
Ann Stephens

3.0
5.3
2.7
5.1
4.0
4.4
5.1
4.5
5.7

.98
.97
.8
.95
.7
.84
.94
.89
.94

3
5
2
4
4
5
3
5
5

34
23
18
15
17
20
13
9
13
====================
想要得到的结果是:


怎么用shell实现????

论坛徽章:
93
2015年辞旧岁徽章
日期:2019-10-10 10:51:15CU大牛徽章
日期:2014-02-21 14:21:56CU十二周年纪念徽章
日期:2020-10-15 16:55:55CU大牛徽章
日期:2014-02-21 14:22:07羊年新春福章
日期:2019-10-10 10:51:39CU大牛徽章
日期:2019-10-10 10:55:38季节之章:春
日期:2020-10-15 16:57:40ChinaUnix元老
日期:2019-10-10 10:54:42季节之章:冬
日期:2019-10-10 10:57:17CU大牛徽章
日期:2014-02-21 14:22:52CU大牛徽章
日期:2014-03-13 10:40:30CU大牛徽章
日期:2014-02-21 14:23:15
2 [报告]
发表于 2013-05-30 14:51 |只看该作者
  1. [seesea@UC ll]$ cat file | sed '/^$/d' | split -l9; paste -d'|' x* | column -t -s'|'
  2. northwest  NW  Charles Main       3.0  .98  3  34
  3. western    WE  Sharon Gray        5.3  .97  5  23
  4. southwest  SW  Lewis Dalsass      2.7  .8   2  18
  5. southern   SO  Suan Chin          5.1  .95  4  15
  6. southeast  SE  Patricia Hemenway  4.0  .7   4  17
  7. eastern    EA  TB Savage          4.4  .84  5  20
  8. northeast  NE  AM Main Jr.        5.1  .94  3  13
  9. north      NO  Margot Weber       4.5  .89  5  9
  10. central    CT  Ann Stephens       5.7  .94  5  13
复制代码

论坛徽章:
93
2015年辞旧岁徽章
日期:2019-10-10 10:51:15CU大牛徽章
日期:2014-02-21 14:21:56CU十二周年纪念徽章
日期:2020-10-15 16:55:55CU大牛徽章
日期:2014-02-21 14:22:07羊年新春福章
日期:2019-10-10 10:51:39CU大牛徽章
日期:2019-10-10 10:55:38季节之章:春
日期:2020-10-15 16:57:40ChinaUnix元老
日期:2019-10-10 10:54:42季节之章:冬
日期:2019-10-10 10:57:17CU大牛徽章
日期:2014-02-21 14:22:52CU大牛徽章
日期:2014-03-13 10:40:30CU大牛徽章
日期:2014-02-21 14:23:15
3 [报告]
发表于 2013-05-30 14:52 |只看该作者
加上删除中间文件的 rm x*:
  1. cat file | sed '/^$/d' | split -l9; paste -d'|' x* | column -t -s'|'; rm x*
复制代码

论坛徽章:
0
4 [报告]
发表于 2013-05-30 14:54 |只看该作者
  1. awk '/^$/{n=0;next}{++n;a[n]=a[n]!=""?a[n]" "$0:$0}END{for(i=1;i<=n;i++)print a[i]}' file
复制代码

论坛徽章:
5
未羊
日期:2014-08-04 16:15:21天秤座
日期:2014-08-13 13:52:372015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:56:112015亚冠之浦和红钻
日期:2015-06-29 15:30:48
5 [报告]
发表于 2013-05-30 15:49 |只看该作者
  1. for i in $(echo {0..10});do awk -v line=$i 'a++%10==line{printf $1" "}' a && echo "";done|column -t
复制代码

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
6 [报告]
发表于 2013-05-30 15:50 |只看该作者
@seesea2517
学习了,格式很整齐~
@kk5234
用awk就格式不好搞啊~

论坛徽章:
0
7 [报告]
发表于 2013-05-30 16:01 |只看该作者
@yestreenstars
是啊,不好对齐。有好办法没?

论坛徽章:
93
2015年辞旧岁徽章
日期:2019-10-10 10:51:15CU大牛徽章
日期:2014-02-21 14:21:56CU十二周年纪念徽章
日期:2020-10-15 16:55:55CU大牛徽章
日期:2014-02-21 14:22:07羊年新春福章
日期:2019-10-10 10:51:39CU大牛徽章
日期:2019-10-10 10:55:38季节之章:春
日期:2020-10-15 16:57:40ChinaUnix元老
日期:2019-10-10 10:54:42季节之章:冬
日期:2019-10-10 10:57:17CU大牛徽章
日期:2014-02-21 14:22:52CU大牛徽章
日期:2014-03-13 10:40:30CU大牛徽章
日期:2014-02-21 14:23:15
8 [报告]
发表于 2013-05-30 16:14 |只看该作者
回复 7# kk5234


    格式如果要在awk里用的话,可能用printf好控制一点。不过管道输出给column专业处理(专业通下水道,专业刻章,专业办证啥的都很专业)也可以:
  1. [seesea@UC ~]$ awk '/^$/{n=0;next}{++n;a[n]=a[n]!=""?a[n]"|"$0:$0}END{for(i=1;i<=n;i++)print a[i]}' file | column -t -s'|'
  2. northwest  NW  Charles Main       3.0  .98  3  34
  3. western    WE  Sharon Gray        5.3  .97  5  23
  4. southwest  SW  Lewis Dalsass      2.7  .8   2  18
  5. southern   SO  Suan Chin          5.1  .95  4  15
  6. southeast  SE  Patricia Hemenway  4.0  .7   4  17
  7. eastern    EA  TB Savage          4.4  .84  5  20
  8. northeast  NE  AM Main Jr.        5.1  .94  3  13
  9. north      NO  Margot Weber       4.5  .89  5  9
  10. central    CT  Ann Stephens       5.7  .94  5  13
复制代码

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
9 [报告]
发表于 2013-05-30 16:18 |只看该作者
回复 6# yestreenstars
  1. $ awk 'BEGIN{f[0]=12;f[2]=20;L=0}!NF{c=0;L++;next}{s=f[L]?f[L]:5;a[c]=a[c]""sprintf("%-"s"s",$0);c++}END{for(n=0;n++<c;)print a[n]}' datafile
  2. western     WE   Sharon Gray         5.3  .97  5    23   
  3. southwest   SW   Lewis Dalsass       2.7  .8   2    18   
  4. southern    SO   Suan Chin           5.1  .95  4    15   
  5. southeast   SE   Patricia Hemenway   4.0  .7   4    17   
  6. eastern     EA   TB Savage           4.4  .84  5    20   
  7. northeast   NE   AM Main Jr.         5.1  .94  3    13   
  8. north       NO   Margot Weber        4.5  .89  5    9   
  9. central     CT   Ann Stephens        5.7  .94  5    13
复制代码

论坛徽章:
0
10 [报告]
发表于 2013-05-30 16:24 |只看该作者
@seesea2517
@jason680
学习了!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP