免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
1234下一页
最近访问板块 发新帖
查看: 6137 | 回复: 38
打印 上一主题 下一主题

[文本处理] 请教 awk substr 替换每一行每一列的几个字符 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-05-22 23:17 |只看该作者 |倒序浏览
本帖最后由 scum2006 于 2014-05-24 23:17 编辑

例如

  1. 1230000000000003456000000000000
  2. 1230000000000005555000000000000
  3. 1230000000000005555000000000000
  4. 1230000000000001234000000000000
  5. 1230000000000005555000000000000
  6. 1230000000000001111000000000000
  7. 1230000000000005555000000000000
复制代码
每一行第16位要进行处理,
通过awk可以截取第16位是5555的每一行
  1. awk '(substr($0,16,4) == “5555”)  {print;}'  $inputFile > $outputFile
复制代码
但是要把每一行的第16位开始四位数如果是5555换成2222, 要怎么写?Thx


问题已经解决,感谢各位高手{:2_168:}

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
2 [报告]
发表于 2014-05-22 23:32 |只看该作者
how about use sed instead of awk?
  1. $ sed -r 's/^(.{15})5555/\12222/' i
  2. 1230000000000003456000000000000
  3. 1230000000000002222000000000000
  4. 1230000000000002222000000000000
  5. 1230000000000001234000000000000
  6. 1230000000000002222000000000000
  7. 1230000000000001111000000000000
  8. 1230000000000002222000000000000
复制代码

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
3 [报告]
发表于 2014-05-23 00:09 |只看该作者
sed  's/\(.\{15\}\)5555\(.*\)/\12222\2/' rtfile

论坛徽章:
1
2015年迎新春徽章
日期:2015-03-04 09:58:11
4 [报告]
发表于 2014-05-23 09:55 |只看该作者
本帖最后由 这个冬天不冷 于 2014-05-23 10:01 编辑
  1. suyahui@debian7:~$ awk 'substr($0,16,4)=="5555"{gsub(/5555/,"2222",$0)}{print $0}' a
  2. 1230000000000003456000000000000
  3. 1230000000000002222000000000000
  4. 1230000000000002222000000000000
  5. 1230000000000001234000000000000
  6. 1230000000000002222000000000000
  7. 1230000000000001111000000000000
  8. 1230000000000002222000000000000
  9. suyahui@debian7:~$ cat a
  10. 1230000000000003456000000000000
  11. 1230000000000005555000000000000
  12. 1230000000000005555000000000000
  13. 1230000000000001234000000000000
  14. 1230000000000005555000000000000
  15. 1230000000000001111000000000000
  16. 1230000000000005555000000000000
复制代码
这样写有点不严谨啊,
这样呢
  1. suyahui@debian7:~$ awk -F "" 'substr($0,16,4)=="5555"{OFS="";$16=2;$17=2;$18=2;$19=2}{print $0}' a
  2. 1230000000000003456000000000000
  3. 1230000000000002222000000000000
  4. 1230000000000002222000000000000
  5. 1230000000000001234000000000000
  6. 1230000000000002222000000000000
  7. 1230000000000001111000000000000
  8. 1230000000000002222000000000000
  9. suyahui@debian7:~$
复制代码

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
5 [报告]
发表于 2014-05-23 09:58 |只看该作者
本帖最后由 yestreenstars 于 2014-05-23 09:58 编辑

回复 4# 这个冬天不冷
gsub~{:2_172:}

   

论坛徽章:
1
2015年迎新春徽章
日期:2015-03-04 09:58:11
6 [报告]
发表于 2014-05-23 10:02 |只看该作者
回复 5# yestreenstars
改成这样了,嘎嘎嘎
  1. suyahui@debian7:~$ awk -F "" 'substr($0,16,4)=="5555"{OFS="";$16=2;$17=2;$18=2;$19=2}{print $0}' a
  2. 1230000000000003456000000000000
  3. 1230000000000002222000000000000
  4. 1230000000000002222000000000000
  5. 1230000000000001234000000000000
  6. 1230000000000002222000000000000
  7. 1230000000000001111000000000000
  8. 1230000000000002222000000000000
  9. suyahui@debian7:~$
复制代码

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
7 [报告]
发表于 2014-05-23 10:03 |只看该作者
回复 4# 这个冬天不冷


    潜在的bug是,每行可能不止一个5555

论坛徽章:
1
2015年迎新春徽章
日期:2015-03-04 09:58:11
8 [报告]
发表于 2014-05-23 10:04 |只看该作者
回复 7# Shell_HAT


  已经发现,已经fixed bug,还请大神再看一遍 ,还有什么问题

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
9 [报告]
发表于 2014-05-23 10:07 |只看该作者
回复 6# 这个冬天不冷


可以简化成连等
  1. awk -F "" 'substr($0,16,4)=="5555"{OFS="";$16=$17=$18=$19=2}{print $0}' a.txt
复制代码

论坛徽章:
1
2015年迎新春徽章
日期:2015-03-04 09:58:11
10 [报告]
发表于 2014-05-23 10:09 |只看该作者
回复 9# Shell_HAT
一行代码2毛钱啊 ,多一行代码多一行收入


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP