免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3426 | 回复: 18

[文本处理] 用sed或awk如何实现 [复制链接]

论坛徽章:
1
数据库技术版块每日发帖之星
日期:2016-02-25 06:20:00
发表于 2015-04-14 14:42 |显示全部楼层
  1. ------------------------------------------------
  2. sLanguage|sServiceID|nSPID|nServiceCode|sMemo|sLangTypeAbbr|sUsed|nSMSCodeSchema|sNBLangID
  3. ------------------------------------------------
  4. 142|-1|-1|1|Chinese|cn|1|1|01
  5. 01|-1|-1|1|Memo|CN|1|2|2
  6. 02|-1|-1|1|Memo|CN|1|2|2
  7. 143|-1|-1|1|Language type memo|chi|1|1|06
  8. 144|-1|-1|1|Language type memo|eng|1|1|06
  9. 145|-1|-1|1|Language type memo|spa|1|1|06
复制代码
上面的内容,如何用sed或awk,使输出为:
  1. sLanguage 142
  2. sLanguage 01
  3. sLanguage 02
  4. sLanguage 143
  5. sLanguage 144
  6. sLanguage 145
复制代码

求职 : 机器学习
论坛徽章:
79
2015年亚洲杯纪念徽章
日期:2015-05-06 19:18:572015七夕节徽章
日期:2015-08-21 11:06:172015亚冠之阿尔纳斯尔
日期:2015-09-07 09:30:232015亚冠之萨济拖拉机
日期:2015-10-21 08:26:3915-16赛季CBA联赛之浙江
日期:2015-12-30 09:59:1815-16赛季CBA联赛之浙江
日期:2016-01-10 12:35:21技术图书徽章
日期:2016-01-15 11:07:2015-16赛季CBA联赛之新疆
日期:2016-02-24 13:46:0215-16赛季CBA联赛之吉林
日期:2016-06-26 01:07:172015-2016NBA季后赛纪念章
日期:2016-06-28 17:44:45黑曼巴
日期:2016-06-28 17:44:4515-16赛季CBA联赛之浙江
日期:2017-07-18 13:41:54
发表于 2015-04-14 14:50 |显示全部楼层
本帖最后由 zsszss0000 于 2015-04-14 14:50 编辑
  1. awk -vFS="|" '!/^-/{print $1}' file | awk 'NR==1{a=$0;next}{printf a":"$1"\n"}'
复制代码
  1. sLanguage:142
  2. sLanguage:01
  3. sLanguage:02
  4. sLanguage:143
  5. sLanguage:144
  6. sLanguage:145
复制代码

论坛徽章:
30
申猴
日期:2014-04-10 09:43:532015年亚洲杯纪念徽章
日期:2015-03-20 14:40:232015亚冠之阿尔纳斯尔
日期:2015-06-02 18:59:042015亚冠之阿尔希拉尔
日期:2015-06-30 15:22:572015亚冠之大阪钢巴
日期:2015-07-20 10:44:332015亚冠之阿尔纳斯尔
日期:2015-10-28 14:57:5215-16赛季CBA联赛之新疆
日期:2015-12-25 10:18:45黑曼巴
日期:2016-06-26 21:39:5315-16赛季CBA联赛之山西
日期:2016-07-25 21:54:2715-16赛季CBA联赛之北京
日期:2016-10-27 12:07:2315-16赛季CBA联赛之八一
日期:2017-07-07 16:39:0915-16赛季CBA联赛之吉林
日期:2017-09-04 12:14:43
发表于 2015-04-14 15:07 |显示全部楼层
  1. awk -F\| '/^[^-]/{if(NR==3) {t=$1} else {print t,$1}}' file
复制代码
回复 1# xiaoshichao143


   

求职 : 机器学习
论坛徽章:
79
2015年亚洲杯纪念徽章
日期:2015-05-06 19:18:572015七夕节徽章
日期:2015-08-21 11:06:172015亚冠之阿尔纳斯尔
日期:2015-09-07 09:30:232015亚冠之萨济拖拉机
日期:2015-10-21 08:26:3915-16赛季CBA联赛之浙江
日期:2015-12-30 09:59:1815-16赛季CBA联赛之浙江
日期:2016-01-10 12:35:21技术图书徽章
日期:2016-01-15 11:07:2015-16赛季CBA联赛之新疆
日期:2016-02-24 13:46:0215-16赛季CBA联赛之吉林
日期:2016-06-26 01:07:172015-2016NBA季后赛纪念章
日期:2016-06-28 17:44:45黑曼巴
日期:2016-06-28 17:44:4515-16赛季CBA联赛之浙江
日期:2017-07-18 13:41:54
发表于 2015-04-14 15:13 |显示全部楼层
NR==2回复 3# zxy877298415


   

论坛徽章:
30
申猴
日期:2014-04-10 09:43:532015年亚洲杯纪念徽章
日期:2015-03-20 14:40:232015亚冠之阿尔纳斯尔
日期:2015-06-02 18:59:042015亚冠之阿尔希拉尔
日期:2015-06-30 15:22:572015亚冠之大阪钢巴
日期:2015-07-20 10:44:332015亚冠之阿尔纳斯尔
日期:2015-10-28 14:57:5215-16赛季CBA联赛之新疆
日期:2015-12-25 10:18:45黑曼巴
日期:2016-06-26 21:39:5315-16赛季CBA联赛之山西
日期:2016-07-25 21:54:2715-16赛季CBA联赛之北京
日期:2016-10-27 12:07:2315-16赛季CBA联赛之八一
日期:2017-07-07 16:39:0915-16赛季CBA联赛之吉林
日期:2017-09-04 12:14:43
发表于 2015-04-14 15:22 |显示全部楼层
回复 4# zsszss0000
横线下面有空行!


   

论坛徽章:
0
发表于 2015-04-14 15:48 |显示全部楼层
方法很笨。。。
awk -F "|" '{if(NR==2){head=$1}else if(NR>3){print head" "$1}}' filename

论坛徽章:
9
射手座
日期:2014-07-29 13:05:07双子座
日期:2015-01-11 17:01:522015年亚洲杯之朝鲜
日期:2015-02-01 16:14:282015亚冠之阿尔艾因
日期:2015-06-04 17:54:40数据库技术版块每日发帖之星
日期:2015-08-02 06:20:00数据库技术版块每日发帖之星
日期:2015-10-28 06:20:00数据库技术版块每日发帖之星
日期:2015-11-26 06:20:0015-16赛季CBA联赛之天津
日期:2016-06-20 17:09:2015-16赛季CBA联赛之青岛
日期:2017-02-26 15:54:19
发表于 2015-04-14 15:50 |显示全部楼层
本帖最后由 stupid_lee 于 2015-04-14 18:01 编辑
  1. [root@oracle ~]# awk -F"|" 'NR==2{a=$1;next}NR>3{print a" "$1}' ss.txt
  2. sLanguage 142
  3. sLanguage 01
  4. sLanguage 02
  5. sLanguage 143
  6. sLanguage 144
  7. sLanguage 145
复制代码
想要写个sed真的好难,写完再看看羊神为啥这么短
  1. sed '/^[^-]/{2{s/^([^|]*)\|(.*)/\1/g;h};4,${s/^([^|]*)\|(.*)/\1/g;G;s/(.*)\n(.*)/\2 \1/g;p}}' -nr
复制代码

论坛徽章:
28
2015年迎新春徽章
日期:2015-03-04 10:16:53午马
日期:2015-03-20 17:11:07亥猪
日期:2015-03-20 17:11:23戌狗
日期:2015-03-20 17:11:33酉鸡
日期:2015-03-20 17:11:47申猴
日期:2015-03-20 17:11:58未羊
日期:2015-03-20 17:12:10子鼠
日期:2015-03-20 17:12:23丑牛
日期:2015-03-20 17:12:40卯兔
日期:2015-03-20 17:12:51辰龙
日期:2015-03-20 17:13:00巳蛇
日期:2015-03-20 17:13:12
发表于 2015-04-14 15:51 |显示全部楼层
本帖最后由 我是一隻羊 于 2015-04-14 16:14 编辑

来个sed版...
  1. sed -r '/---/{N;N;s/-+\n|\|.*//g;h;d};G;s/([^|]+).*\n(.*)/\2 \1/' inputfile
复制代码
补一个awk版
  1. awk -F\| -vf=1 'NR==2{split($0,a,"|")}NR>3{print a[f],$f}' inputfile
复制代码
f那里定义你要取的域.

论坛徽章:
1
数据库技术版块每日发帖之星
日期:2016-02-25 06:20:00
发表于 2015-04-14 16:34 |显示全部楼层
回复 2# zsszss0000


    多谢大家的热心解答,就不一一答谢了。多谢!!

论坛徽章:
1
数据库技术版块每日发帖之星
日期:2016-02-25 06:20:00
发表于 2015-04-14 16:39 |显示全部楼层
  1. <1365 szxciscslx23114 [bmp] :/home/bmp/xiaoshichao>set ModuleName="CommTableSOAP"
  2. <1366 szxciscslx23114 [bmp] :/home/bmp/xiaoshichao>set TableName="R_CommTable_Language"
  3. <1367 szxciscslx23114 [bmp] :/home/bmp/xiaoshichao>
  4. <1367 szxciscslx23114 [bmp] :/home/bmp/xiaoshichao>set ModuleInfo=`awk -F'|' -v module="$ModuleName" '$1 == module{print "-neid "$3" -netElementType "$4" -moduleName  "$1" -version "$2}' ${ENIP_HOME}/app/modules/moduleversion.txt`
  5. <1368 szxciscslx23114 [bmp] :/home/bmp/xiaoshichao>awk -v moduleInfo="$ModuleInfo" -v table="$TableName" 'BEGIN{print "etool -c \"moduleadm propertyManagement -queryTable "moduleInfo" -tableName "table"\""}' | sh

  6. ------------------------------------------------
  7. sLanguage|sServiceID|nSPID|nServiceCode|sMemo|sLangTypeAbbr|sUsed|nSMSCodeSchema|sNBLangID
  8. ------------------------------------------------
  9. 142|-1|-1|1|Chinese|cn|1|1|01
  10. 01|-1|-1|1|Memo|CN|1|2|2
  11. 02|-1|-1|1|Memo|CN|1|2|2
  12. 143|-1|-1|1|Language type memo|chi|1|1|06
  13. 144|-1|-1|1|Language type memo|eng|1|1|06
  14. 145|-1|-1|1|Language type memo|spa|1|1|06

  15. <1369 szxciscslx23114 [bmp] :/home/bmp/xiaoshichao>awk -v moduleInfo="$ModuleInfo" -v table="$TableName" 'BEGIN{print "etool -c \"moduleadm propertyManagement -queryTable "moduleInfo" -tableName "table"\""}' | sh | sed -r '/---/{N;N;s/-+\n|\|.*//g;h;d};G;s/([^|]+).*\n(.*)/\2 \1/'


  16. sLanguage 142
  17. sLanguage 01
  18. sLanguage 02
  19. sLanguage 143
  20. sLanguage 144
  21. sLanguage 145

  22. sLanguage
  23. <1370 szxciscslx23114 [bmp] :/home/bmp/xiaoshichao>
复制代码
回复 8# 我是一隻羊

sed的如果有空行的话,会有一点小问题。   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP