免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 22636 | 回复: 11

[文本处理] Sed 匹配特定字符开头和结尾 [复制链接]

论坛徽章:
0
发表于 2013-07-18 16:10 |显示全部楼层
有一个需求,需要查出已双引号开头和结尾的 行打印出来

先查出已"双引号开头的
sed -n '/^\"/'p test.flat
查出已双引号结尾的
sed -n '/\"\r$/'p test.flat
不知道为什么需要加一个\r才能查出结果
以上命令都可以正确查出结果

可是
如果连起来使用 已双引号开头和结尾
sed -n '/^\"*\"\r$/'p test.flat
这个命令就不好用了

求帮助

论坛徽章:
6
摩羯座
日期:2013-08-24 10:43:10狮子座
日期:2013-08-25 10:27:06天秤座
日期:2013-09-11 20:28:44午马
日期:2014-09-28 16:06:0015-16赛季CBA联赛之八一
日期:2016-12-19 13:55:0515-16赛季CBA联赛之天津
日期:2016-12-20 14:01:23
发表于 2013-07-18 16:26 |显示全部楼层
  1. sed -n '/^\".*\"\r$/'p test.flat
复制代码
加/r的原因可能你文件是windows文本格式的缘故。

论坛徽章:
0
发表于 2013-07-18 17:02 |显示全部楼层
[pforcerx]$ file test.flat
test.flat: ASCII text, with CRLF line terminators

论坛徽章:
6
摩羯座
日期:2013-08-24 10:43:10狮子座
日期:2013-08-25 10:27:06天秤座
日期:2013-09-11 20:28:44午马
日期:2014-09-28 16:06:0015-16赛季CBA联赛之八一
日期:2016-12-19 13:55:0515-16赛季CBA联赛之天津
日期:2016-12-20 14:01:23
发表于 2013-07-18 17:09 |显示全部楼层
ASCII text, with CRLF

用 cat -A test.flat 更直观些。



论坛徽章:
71
15-16赛季CBA联赛之同曦
日期:2018-08-23 15:41:42辰龙
日期:2014-08-15 09:07:43狮子座
日期:2014-06-03 13:55:33亥猪
日期:2014-06-02 11:17:08巨蟹座
日期:2014-05-06 10:02:03午马
日期:2014-05-04 08:18:27亥猪
日期:2014-04-29 11:11:32技术图书徽章
日期:2014-04-24 15:51:26技术图书徽章
日期:2014-04-17 11:01:53辰龙
日期:2014-04-15 12:45:46亥猪
日期:2014-04-11 09:06:23射手座
日期:2014-04-01 15:28:10
发表于 2013-07-18 17:12 |显示全部楼层

  1. sed -n "/^\"/{/\"$/p}"  urfile
复制代码

论坛徽章:
0
发表于 2013-07-18 18:47 |显示全部楼层
回复 5# zhaopingzi


    thanks
我用了一个笨方法
sed -n '/^\"/'p test.flat|sed -n '/\"\r$/'p|wc -l

论坛徽章:
5
未羊
日期:2014-08-04 16:15:21天秤座
日期:2014-08-13 13:52:372015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:56:112015亚冠之浦和红钻
日期:2015-06-29 15:30:48
发表于 2013-07-18 19:16 |显示全部楼层
回复 6# vallygirl


    awk '/^"/&&/"$/{a++}END{print a}'

论坛徽章:
0
发表于 2013-07-18 23:39 |显示全部楼层
6楼的很精简啦,且容易理解,为啥还要用笨方法呢
回复 6# vallygirl


   

论坛徽章:
0
发表于 2013-07-19 11:36 |显示全部楼层
  1. sed -n '/^\".*\"$/'p file
复制代码

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
发表于 2013-07-19 11:40 |显示全部楼层
本帖最后由 blackold 于 2013-07-19 11:42 编辑

回复 1# vallygirl

首先,要注意文件格式。
如果为 unix 格式:
  1. grep -E '^".*$"'  urfile
复制代码
or
  1. sed '/^".*"$/!d' urfile
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

DTCC2020中国数据库技术大会

【架构革新 高效可控】2020年12月21日-23日第十一届中国数据库技术大会将在北京隆重召开。

大会设置2大主会场,20+技术专场,将邀请超百位行业专家,重点围绕数据架构、AI与大数据、传统企业数据库实践和国产开源数据库等内容展开分享和探讨,为广大数据领域从业人士提供一场年度盛会和交流平台。

http://dtcc.it168.com


大会官网>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP