免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: billyzhou033
打印 上一主题 下一主题

[文本处理] 文本查找匹配输出结果。。求解 [复制链接]

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
11 [报告]
发表于 2014-07-10 09:54 |只看该作者
回复 10# q1208c

那你先把grep写出来看一下啊~
   

论坛徽章:
33
荣誉会员
日期:2011-11-23 16:44:17天秤座
日期:2014-08-26 16:18:20天秤座
日期:2014-08-29 10:12:18丑牛
日期:2014-08-29 16:06:45丑牛
日期:2014-09-03 10:28:58射手座
日期:2014-09-03 16:01:17寅虎
日期:2014-09-11 14:24:21天蝎座
日期:2014-09-17 08:33:55IT运维版块每日发帖之星
日期:2016-04-17 06:23:27操作系统版块每日发帖之星
日期:2016-04-18 06:20:00IT运维版块每日发帖之星
日期:2016-04-24 06:20:0015-16赛季CBA联赛之天津
日期:2016-05-06 12:46:59
12 [报告]
发表于 2014-07-10 10:59 |只看该作者
回复 11# yestreenstars

想到一个简单的办法, 能输出的, 就是yes, 否则就是 no.
所以, yes 和 no 没必要同时出现 .

  1. grep -o -F -f ip.txt file.txt | sort -u
复制代码

论坛徽章:
0
13 [报告]
发表于 2014-07-10 14:59 |只看该作者
回复 5# billyzhou033

那么晚了还加班,你们公司好可怕

论坛徽章:
0
14 [报告]
发表于 2014-07-10 18:20 |只看该作者
回复 6# reyleon


大哥,救救我,,在帮我下,根据你给的代码:awk -F ';' 'NR==FNR{for(i=1;i++<NFa[$i];next}{if($1 in a)print $1,"yes";else print $1,"no"}' allip ip.txt

现在allip里的内容如下:足足有几千条,每行一个或者多个ip地址,对应备案号或者域名,我要把匹配的ip输出备案号和域名。
----www.yaoyaolife.com--------124.232.146.19;
----www.ivshequ.com--------124.232.146.19;
湘ICP备14005668号----www.zgzmls.com--------202.103.69.105;124.232.137.230;124.232.137.233;
湘ICP备14005766号----www.cs;deyi.com--------124.232.137.230;202.103.69.105;124.232.137.233;
湘ICP备14005764号----www.csxxmjjd.com--------113.240.226.137;

我要根据ip.txt里的ip对allip中的ip进行匹配,匹配上的取整行字段,ip本身除外。没有匹配上的继续输出no

如ip.txt有几个ip为
124.232.146.19
113.240.226.137
1.1.1.1
1.1.1.2
则输出如下,没有的则输出no

----www.yaoyaolife.com--------
湘ICP备14005764号----www.csxxmjjd.com--------
no
no

论坛徽章:
0
15 [报告]
发表于 2014-07-10 18:23 |只看该作者
回复 13# 用户名注册后不能更改


    唉,,我们公司做系统集成的,项目经理什么项目都接,让我一搞维护的来做ip数据分析,几万个ip。本来是机器做的事情,要人来手工做。。可惜我编程不会,正努力学习。。没办法。。只好求助你们了。。感谢大家的帮助

论坛徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之北京
日期:2016-07-06 15:42:0715-16赛季CBA联赛之同曦
日期:2016-06-12 10:38:0915-16赛季CBA联赛之佛山
日期:2016-05-27 11:54:56黄金圣斗士
日期:2015-12-02 11:44:35白银圣斗士
日期:2015-11-25 14:32:43白银圣斗士
日期:2015-11-23 12:53:352015亚冠之布里斯班狮吼
日期:2015-10-21 16:55:482015亚冠之首尔
日期:2015-09-01 16:46:052015亚冠之德黑兰石油
日期:2015-08-31 11:39:192015亚冠之萨济拖拉机
日期:2015-08-28 21:06:5315-16赛季CBA联赛之广东
日期:2016-07-12 14:58:53
16 [报告]
发表于 2014-07-10 19:14 |只看该作者
回复 14# billyzhou033


    你这个太乱了,而且需求不明确.

就比方说: 124.232.137.233 这个IP,假如在你的ip.txt 文件里, 而在allip.txt 文件里这个IP 又对应两个域名 www.zgzmls.com 和 www.cs;deyi.com ,是否都要输出? 还有 你这个 www.cs;deyi.com 是域名咩?

论坛徽章:
780
金牛座
日期:2014-02-26 17:49:58水瓶座
日期:2014-02-26 18:10:15白羊座
日期:2014-04-15 19:29:52寅虎
日期:2014-04-17 19:43:21酉鸡
日期:2014-04-19 21:24:10子鼠
日期:2014-04-22 13:55:24卯兔
日期:2014-04-22 14:20:58亥猪
日期:2014-04-22 16:13:09狮子座
日期:2014-05-05 22:31:17摩羯座
日期:2014-05-06 10:32:53处女座
日期:2014-05-12 09:23:11子鼠
日期:2014-05-21 18:21:27
17 [报告]
发表于 2014-07-10 19:18 |只看该作者
本帖最后由 Herowinter 于 2014-07-10 19:19 编辑

回复 14# billyzhou033

原样给出原始文本,期望结果,贴在代码框里清楚一点。
文本越规范,处理难度越低,按照道理,log文本不大
可能这么乱吧。

论坛徽章:
0
18 [报告]
发表于 2014-07-10 19:32 |只看该作者
回复 16# reyleon
原本的是这样的。。被我整乱了。。如果ip匹配输出 IP这行之前的内容,包括IPC和域名(有些只有域名), 不匹配输出 no



湘ICP备14001691号        www.cysaxh.com                124.232.164.180;
        www.huaentang.com.cn                61.139.126.121;
湘ICP备12013912号        www.wuxiwine.com                218.77.10.147;
        www.fivecreek.com                203.171.233.167;
湘ICP备11014573号        www.seemap.cn                42.96.154.72;
        www.dzmap.cn                222.240.131.92;
        www.hnsdty.com                222.240.131.83;
沪ICP备13021610号        www.hnb0731.com                175.6.1.227;
湘ICP备13004629号        www.hnscny.net                124.232.164.180;
        www.hnscny.com                124.172.146.2;
湘ICP备13000426号        www.china4it.cn                222.243.128.10;
        www.daohee.cn                222.243.128.10;
        www.madenkina.cn                222.243.128.10;
        www.irussia.cn                222.243.128.10;
        www.buysellcyprus.cn                124.172.156.131;
        www.visitcyprus.com.cn                222.243.128.10;
        www.investcyprus.cn                222.243.128.10;
        www.icyprus.cn                124.172.156.131;
        www.cyprusnews.cn                222.243.128.10;
        www.51cyprus.cn                124.172.156.131;
        www.xilanet.cn                222.243.128.10;
        www.igreece.cn                124.172.156.131;
        www.xrosu.cn                222.243.128.10;
        www.china4it.com.cn                222.243.128.10;
        www.cychiba.cn                222.243.128.10;
        www.xilalink.cn                222.243.128.10;
        www.uyitec.cn                124.172.156.131;
湘ICP备12003780号        www.82033333.com                124.232.137.3;
        www.eft.cc                121.12.119.99;
湘ICP备12003155号        www.4007310731.com                124.232.137.127;
        www.99quanai.net                124.232.137.127;
        www.xx888.com                124.232.137.127;
湘ICP备11017346号        www.hnmht.com                124.232.137.230;202.103.69.105;124.232.137.233;
粤ICP备11077354号        www.lolensteel.com                124.172.156.42;
        www.4006981856.com                220.170.143.197;
湘ICP备11006127号        www.tkl123.com                121.12.119.112;124.232.146.22;
        www.sky5m.com                124.232.146.20;


   

论坛徽章:
0
19 [报告]
发表于 2014-07-10 19:34 |只看该作者
回复 17# Herowinter


    原始的是这样的。谢谢

论坛徽章:
780
金牛座
日期:2014-02-26 17:49:58水瓶座
日期:2014-02-26 18:10:15白羊座
日期:2014-04-15 19:29:52寅虎
日期:2014-04-17 19:43:21酉鸡
日期:2014-04-19 21:24:10子鼠
日期:2014-04-22 13:55:24卯兔
日期:2014-04-22 14:20:58亥猪
日期:2014-04-22 16:13:09狮子座
日期:2014-05-05 22:31:17摩羯座
日期:2014-05-06 10:32:53处女座
日期:2014-05-12 09:23:11子鼠
日期:2014-05-21 18:21:27
20 [报告]
发表于 2014-07-10 19:48 |只看该作者
本帖最后由 Herowinter 于 2014-07-10 19:51 编辑

回复 19# billyzhou033
在家里没环境,试一下吧。
  1. awk 'NR==FNR{a[$0];next} {sub(/;.*/,"",$NF);if($NF in a){NF--;print}else print "no"}' ip.txt allip.txt > jg.txt
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP