免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: zhaochao1943
打印 上一主题 下一主题

[文本处理] 求大家帮用sed awk或者别的帮忙取一个参数 [复制链接]

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
11 [报告]
发表于 2013-12-06 11:12 |只看该作者
  1. sed -r 's#.*(<!DOCTYPE.*/html>).*#\1#' urfile
复制代码

论坛徽章:
0
12 [报告]
发表于 2013-12-06 11:13 |只看该作者
那么大一大串 只是一个参数 从<!DOCTYPE 一直到</html>^M\n 是一个参数 我现在只想把它取出来 进行传参回复 9# LikeLx


   

论坛徽章:
0
13 [报告]
发表于 2013-12-06 11:17 |只看该作者
亲 这个不能全取下来 我想要从<!DOCTYPE html 到 [</html>^M\n 也包括他们 b]回复 11# Shell_HAT


   

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
14 [报告]
发表于 2013-12-06 11:19 |只看该作者
回复 13# zhaochao1943
  1. sed -r 's#.*(<!DOCTYPE.*/html>....).*#\1#' urfile
复制代码

论坛徽章:
780
金牛座
日期:2014-02-26 17:49:58水瓶座
日期:2014-02-26 18:10:15白羊座
日期:2014-04-15 19:29:52寅虎
日期:2014-04-17 19:43:21酉鸡
日期:2014-04-19 21:24:10子鼠
日期:2014-04-22 13:55:24卯兔
日期:2014-04-22 14:20:58亥猪
日期:2014-04-22 16:13:09狮子座
日期:2014-05-05 22:31:17摩羯座
日期:2014-05-06 10:32:53处女座
日期:2014-05-12 09:23:11子鼠
日期:2014-05-21 18:21:27
15 [报告]
发表于 2013-12-06 11:24 |只看该作者
本帖最后由 Herowinter 于 2013-12-06 11:25 编辑
  1. awk '{sub(/.*<!DOCTYPE/,"<!DOCTYPE");sub(/\/html>\^M\\n.*/,"/html>^M\\n")}1' i
复制代码
感觉楼上ShellHat大大的代码应该没问题啊,而且更好。

论坛徽章:
0
16 [报告]
发表于 2013-12-06 11:25 |只看该作者
是这样的 我这个内容提取出来是想按照html格式发送邮件 按您的方法<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">是被过滤掉了 结尾的/html /body也被过滤掉了 回复 14# Shell_HAT


   

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
17 [报告]
发表于 2013-12-06 13:26 |只看该作者
回复 16# zhaochao1943


    我这边测试没有发现问题。请把你的测试数据和测试结果贴出来看看。

论坛徽章:
0
18 [报告]
发表于 2013-12-06 13:58 |只看该作者
  1. grep -E -o '<.*>'
复制代码
这样可以?

还有就是,使用vim的时候,可以用下面方法改下背景颜色
:set bg=dark

论坛徽章:
0
19 [报告]
发表于 2013-12-08 15:47 |只看该作者
多谢 已经可以了 就是你的这种方法 呵呵 谢谢回复 11# Shell_HAT


   

论坛徽章:
0
20 [报告]
发表于 2013-12-08 16:07 |只看该作者
多谢了回复 18# thinalai


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP