免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 4660 | 回复: 11
打印 上一主题 下一主题

[文本处理] 把每行第N个字符到第N+10字符间出现的abc替换为xyz【已解决】 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-06-15 14:57 |只看该作者 |倒序浏览
本帖最后由 xindi10631 于 2012-08-01 11:27 编辑

把每行第N个字符到第N+10字符间出现的abc替换为xyz  这个怎么实现!谢谢!




#!perl -w
$a=`cat file`;
substr($a,N,10)=~s/abc/xyz/g;
print $a;

论坛徽章:
0
2 [报告]
发表于 2012-06-15 15:04 |只看该作者
  1. 没数据没法写一个比较麻烦的就是用awk配合for循环,判断在N 到N+10之间 如果这个域=a那么判断下一个域是否等于b,如果等于在判断下一个域是否等于c ,然后再进行替换
复制代码

论坛徽章:
0
3 [报告]
发表于 2012-06-15 15:19 |只看该作者
  1. 刚才模拟了下 file内容:
  2. 123abc456aababc789abcqweabcrtyabc
  3. 语句:
  4. awk -F "" '{for(i=9;i<=19;i++) if($i=="a" && $(i+1)=="b" && $(i+2)=="c"){$i="x";$(i+1)="y";$(i+2)="z"}print }'
  5. 结果:
  6. 1 2 3 a b c 4 5 6 a a b x y z 7 8 9 x y z q w e a b c r t y a b c
复制代码

论坛徽章:
0
4 [报告]
发表于 2012-06-15 15:50 |只看该作者
本帖最后由 sandao381 于 2012-06-15 17:42 编辑

回复 1# xindi10631


    我这有个思路,还望对楼主有点用。
   用awk 的fieldwidths 参数 对每行进行按字符数分割,第一个域就是 前 N个字符,第二个就是第 N+1 到N+10
,然后用gsub 对$2 进行替换最后拼接字符串。
     附代码 仅供参考
1 n=9
  1. seq -s '' 20 | awk -v FIELDWIDTHS="9 10" '{ arg=$0;gsub(/11/,"aa",$2);print $1 $2 substr(arg,20)}'
复制代码
2 n=6
  1. echo "123abc456aababc789abcqweabcrtyabc"|awk -v FIELDWIDTHS="6 10" '{ arg=$0;gsub(/abc/,"xyz",$2);print $1 $2 substr(arg,17)}'
复制代码
  1. echo "abcdeabcdeabcde"|  awk -v FIELDWIDTHS="6 10" '{ arg=$0;gsub(/abc/,"xyz",$2);print $1 $2 substr(arg,17)}'
复制代码

论坛徽章:
1
辰龙
日期:2014-05-22 11:38:58
5 [报告]
发表于 2012-06-15 16:28 |只看该作者
  1. sed 'h;s/.\{'"$N"'\}\(.\{10\}\).*/\1/;s/abc/xyz/g;G;s/\(.\{10\}\)\n\(.\{'"$N"'\}\)\(.\{10\}\)/\2\1/'
复制代码

论坛徽章:
0
6 [报告]
发表于 2012-06-15 17:25 |只看该作者
本帖最后由 jils2013 于 2012-06-15 17:26 编辑
  1. echo "abcdeabcdeabcde" | awk '{n=6;start=substr($0,1,n-1);mid=substr($0,n,n+10);end=substr($0,n+11);gsub("abc","xyz",mid);print start""mid""end}'
复制代码
比较无语的需求,替换还得估计误伤,n这里是6

论坛徽章:
0
7 [报告]
发表于 2012-06-15 21:49 |只看该作者
  1. echo "thisisabcstwhatthabcck" |sed -nr 's/(.{3})(.{10})(.*)/\1\n\2\n\3/;s/([^\n]*\n[^\n]*)abc([^\n]*\n.*)/\1XYZ\2/g;s/\n//g;p'
复制代码

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
8 [报告]
发表于 2012-06-16 13:17 |只看该作者
回复 1# xindi10631


    awk -vn=N '{print gensub("abc","_XYZ_",split(substr($0,1,n+10),a,"abc")-1,$0)}'

论坛徽章:
0
9 [报告]
发表于 2012-06-18 09:56 |只看该作者
回复 3# 英语盲学linux


多谢啊!  网上咨询了一种方法  跟你的有点类似

echo 123456aabccabc789|awk 'BEGIN{FS=""}{for(i=7;i<15;i++){if($i$(i+1)$(i+2)=="abc"){sub($i$(i+1)$(i+2),"xyz")}}}1'


   

论坛徽章:
0
10 [报告]
发表于 2012-06-18 10:00 |只看该作者
回复 9# xindi10631
  1. 自己测试吧 这个语句不合格
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP