免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: kangle000
打印 上一主题 下一主题

awk处理文本问题 [复制链接]

论坛徽章:
0
11 [报告]
发表于 2010-04-05 14:15 |只看该作者
sed -r 's/.*\.([^.]+\.[^.]+\ )/\1/' file

.*\.查找所有字段后跟.的 所有地址,  将保留空间(以.开头后接任意字符加.开头)的内容替换所有地址。

论坛徽章:
59
2015七夕节徽章
日期:2015-08-24 11:17:25ChinaUnix专家徽章
日期:2015-07-20 09:19:30每周论坛发贴之星
日期:2015-07-20 09:19:42ChinaUnix元老
日期:2015-07-20 11:04:38荣誉版主
日期:2015-07-20 11:05:19巳蛇
日期:2015-07-20 11:05:26CU十二周年纪念徽章
日期:2015-07-20 11:05:27IT运维版块每日发帖之星
日期:2015-07-20 11:05:34操作系统版块每日发帖之星
日期:2015-07-20 11:05:36程序设计版块每日发帖之星
日期:2015-07-20 11:05:40数据库技术版块每日发帖之星
日期:2015-07-20 11:05:432015年辞旧岁徽章
日期:2015-07-20 11:05:44
12 [报告]
发表于 2010-04-05 15:33 |只看该作者
LINUX的命令功能太强大了。有机会应该好好学习的。

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
13 [报告]
发表于 2010-04-05 15:41 |只看该作者
回复 12# renxiao2003


   
    好好学习!

论坛徽章:
0
14 [报告]
发表于 2010-04-05 16:08 |只看该作者
回复 3# sunbw001


    这种方法对题目中的需求是可以的,如果我对.cn结尾的域名要保留3级,比如说
www.sina.com.cn 1 1
aa.bb.cc.com.cn 1 1
aa.bb.com 1 1
得到的结果要是
sina.com.cn 1 1
cc.com.cn 1 1
bb.com 1 1
用awk该怎么写。我知道可以将域名这一列调整到最后一列,然后用空格和“.”作为分隔符,然后按你的方法,可以得到结果。这用多用一次管道,能不能有更好的办法?

论坛徽章:
0
15 [报告]
发表于 2010-04-05 16:20 |只看该作者
条件判断。  字段 大于3个的 用另外一个表达式 来过滤。。剩下的 用原来的。。

论坛徽章:
0
16 [报告]
发表于 2010-04-05 16:43 |只看该作者
先用awk -F. '{print $(NF-1)"."$NF}' file,使文件成原来想改变的样子,再

把后面的1去掉

论坛徽章:
0
17 [报告]
发表于 2010-04-05 18:04 |只看该作者
回复 14# kangle000
  1. awk -F\. '{print ($0~/\.cn/)?$(NF-2)"."$(NF-1)"."$NF:$(NF-1)"."$NF}' file
复制代码

论坛徽章:
0
18 [报告]
发表于 2010-04-05 22:07 |只看该作者
回复 17# where27


    这代码还是有问题,如果域名是www.htcn.com 1 1 就会得到错误的结果

论坛徽章:
0
19 [报告]
发表于 2010-04-05 22:46 |只看该作者
回复 17# where27


    还有一个问题,如果我想把"."或者空格当作分割符-F 后应该怎么写?
也就是对 www.sina.com 1 1处理之后应该分隔成 www sina com 1 1

论坛徽章:
0
20 [报告]
发表于 2010-04-05 22:47 |只看该作者
回复 11# vitas333_cu


    这个不错
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP