免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1060 | 回复: 3
打印 上一主题 下一主题

[文本处理] 求大神文本处理 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2018-08-28 19:49 |只看该作者 |倒序浏览
    <name>rsfw_server1</name>
    <machine>appsMachine-1</machine>
    <listen-port>8001</listen-port>
    <cluster>rsfw_cluster</cluster>
    <listen-address>10.16.0.81</listen-address>
--
    <name>xsfw_server1</name>
    <machine>appsMachine-1</machine>
    <listen-port>8003</listen-port>
    <cluster>xsfw_cluster</cluster>
    <listen-address>10.16.0.81</listen-address>
--
    <name>rsfw_server1</name>
    <machine>appsMachine-1</machine>
    <listen-port>8001</listen-port>
    <cluster>rsfw_cluster</cluster>
    <listen-address>10.16.0.81</listen-address>
--
    <name>xsfw_server1</name>
    <machine>appsMachine-1</machine>
    <listen-port>8003</listen-port>
    <cluster>xsfw_cluster</cluster>
    <listen-address>10.16.0.81</listen-address>


将端口号,服务名称和IP 提取,做成以下格式
8001 rsfw_server1 10.16.0.81
8003 xsfw_server1 10.16.0.81

论坛徽章:
0
2 [报告]
发表于 2018-08-29 09:16 |只看该作者
本帖最后由 cd_chair 于 2018-08-29 09:27 编辑

[ 本帖最后由 cd_chair 于 2018-08-29 09:27 编辑 ]\n\n
  1. cat file2
复制代码

    <name>rsfw_server1</name>
    <machine>appsMachine-1</machine>
    <listen-port>8001</listen-port>
    <cluster>rsfw_cluster</cluster>
    <listen-address>10.16.0.81</listen-address>
--
    <name>xsfw_server1</name>
    <machine>appsMachine-1</machine>
    <listen-port>8003</listen-port>
    <cluster>xsfw_cluster</cluster>
    <listen-address>10.16.0.81</listen-address>
--
    <name>rsfw_server1</name>
    <machine>appsMachine-1</machine>
    <listen-port>8001</listen-port>
    <cluster>rsfw_cluster</cluster>
    <listen-address>10.16.0.81</listen-address>
--
    <name>xsfw_server1</name>
    <machine>appsMachine-1</machine>
    <listen-port>8003</listen-port>
    <cluster>xsfw_cluster</cluster>
    <listen-address>10.16.0.81</listen-address>

  1. awk  'BEGIN{RS="\n--";FS="[<|>]"}{print $11,$3,$19}' file2|sort|uniq
复制代码
8001 rsfw_server1 10.16.0.81
8003 xsfw_server1 10.16.0.81



论坛徽章:
5
白羊座
日期:2014-10-28 11:23:27水瓶座
日期:2015-01-20 10:19:022015亚冠之柏斯波利斯
日期:2015-07-11 18:17:2015-16赛季CBA联赛之同曦
日期:2015-12-23 12:38:582016猴年福章徽章
日期:2016-02-18 15:30:34
3 [报告]
发表于 2018-08-29 09:28 |只看该作者
本帖最后由 klainogn 于 2018-08-29 09:30 编辑

  1. BEGIN{
  2.     RS="--"
  3.     fields="listen-port name listen-address"
  4.     split(fields, arr, " ")
  5. }
  6. {
  7.     for(i in arr){
  8.         if(match($0, "<"arr[i]">([^<]*)<", a)){
  9.             b[NR][arr[i]]=a[1]
  10.         }  
  11.     }
  12. }
  13. END{
  14.    for(i in b){
  15.         str=""
  16.         for(j in arr){
  17.             str=str sprintf("%s ", b[i][arr[j]])
  18.         }
  19.         if(!c[str]++){
  20.             print str
  21.         }
  22.    }
  23. }
复制代码

论坛徽章:
4
15-16赛季CBA联赛之青岛
日期:2018-07-09 14:17:2815-16赛季CBA联赛之八一
日期:2018-08-06 15:30:0515-16赛季CBA联赛之广东
日期:2018-08-09 09:11:2115-16赛季CBA联赛之佛山
日期:2019-02-14 09:26:31
4 [报告]
发表于 2018-08-29 10:22 |只看该作者
本帖最后由 christmas1102 于 2018-08-29 10:34 编辑
  1. grep -Po '((rt|er|ss)>)\K.*(?=<)' file|xargs -n3
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP