免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 937 | 回复: 4

[文本处理] 仅适用一个命令过滤出包含关键字的未注释的行 [复制链接]

论坛徽章:
0
发表于 2017-04-12 21:54 |显示全部楼层

有个HTML文件,名为file.html,文件内容如下,

======file begin======
// // http://qq.com/downloadlj/  jsjdfjsdf
    //http://qq.com/iii //
      
      /// //http://qq.com/iii
/  // qq.com
   
      qq.com
======file end======

问:仅使用一个命令(grep/sed/awk),来过滤出此HTML文件中含有qq.com关键字且未被注释的行。

这个问题困扰了好多天了,大家一起讨论下。


论坛徽章:
0
发表于 2017-04-13 17:29 |显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
20
程序设计版块每日发帖之星
日期:2015-10-11 06:20:0015-16赛季CBA联赛之山东
日期:2016-05-28 18:18:5615-16赛季CBA联赛之新疆
日期:2017-04-12 22:55:4715-16赛季CBA联赛之青岛
日期:2017-06-26 18:30:0315-16赛季CBA联赛之四川
日期:2017-09-04 12:27:0315-16赛季CBA联赛之福建
日期:2018-02-09 14:28:3315-16赛季CBA联赛之同曦
日期:2018-04-17 12:43:3415-16赛季CBA联赛之浙江
日期:2018-07-14 13:27:4015-16赛季CBA联赛之吉林
日期:2018-09-13 15:48:2915-16赛季CBA联赛之新疆
日期:2016-05-07 05:05:3215-16赛季CBA联赛之八一
日期:2016-03-14 12:32:06程序设计版块每日发帖之星
日期:2015-12-12 06:20:00
发表于 2017-04-13 18:52 |显示全部楼层
本帖最后由 baby_神 于 2017-04-13 19:17 编辑

awk '!/[ ]*\/+/&&!/^[ ]+$/'grep -E '^[^/]+qq.com'
grep -P '^[^/\n]+qq.com'

论坛徽章:
0
发表于 2017-04-13 23:12 |显示全部楼层
sed -n "/^\/\//d;/ \/\/.*qq.com/d;/qq.com/p" file.html

论坛徽章:
0
发表于 2017-04-15 17:35 |显示全部楼层
楼上两位高手,学习了
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP