Chinaunix

标题: sed 获取第一个匹配的段落 [打印本页]

作者: wdfwdf2727    时间: 2019-12-17 16:24
标题: sed 获取第一个匹配的段落
本帖最后由 wdfwdf2727 于 2019-12-17 16:37 编辑

aaaaa1=
  (aaaaa=
  
)
aaaaa=

  (cccccc=
  
  (bbbbbb=
  )
)
aaaaa=
  (cccccc=
  
  (bbbbbb=
  
  (dddddd=
  )
)
数据结构如上
1、每一个段落的开头为字母(有大小写之分),比如 aaaaa1=  就是段落的开头
2、段落内的内容都是非字母开头的,比如 ( 或空格开头,并且存在空行。
3、段落的开头有可能重复,对于重复的开头,只需要取第一个匹配的段落。

现在需要把段落之间的取出来,就是把以 匹配字母开头到下一个匹配字幕开头,比如查找 ^aaaaa1  匹配到如下
aaaaa1=
  (aaaaa=
  
)
求大神帮忙




作者: cjaizss    时间: 2019-12-24 22:35
本帖最后由 cjaizss 于 2019-12-25 12:07 编辑
  1. #!/bin/bash
  2. sed -nr '
  3. /\<'$2'\>/!d
  4. x
  5. s/.*/\n/
  6. x
  7. s/.*(\<'$2'\>)/\n\1/

  8. :newline
  9. H
  10. x
  11. :seg
  12. s/(\n)([^()]*)([^\n]*)$/\2\1\3/
  13. /(.*)(\n)(\()([^\n]*)$/ {
  14.         s//1\1\3\2\4/
  15.         tseg
  16. }
  17. /^1(.*)(\n)(\))([^\n]*)$/ {
  18.         s//\1\3\2\4/
  19.         /^\n/ {
  20.                 s/\n+(.*)\n[^\n]*$/\1/p
  21.                 q
  22.         }
  23.         tseg
  24. }
  25. /^\n(.*)\n\)([^\n]*)$/ {
  26.         s//\1/p
  27.         q
  28. }
  29. s/\n$//
  30. x
  31. n
  32. s/^/\n/
  33. tnewline
  34. ' $1
复制代码

./test.sh urfile aaaaa1
测试中发现某种情况下会加一个空行,属于小BUG,因为空格空行不影响实际内容,但是现在想不起例子。测试如下:

  1. user@ubuntu:/tmp$ cat testfile
  2. abc=(  def   = (ghijk  =  (lmn opq))
  3. ) ABC=(   DE =(FG= (HIJK =
  4. (OPQ RST)
  5. )
  6. )) aBc = (dEF = (
  7. ghI jK))
  8. user@ubuntu:/tmp$ ./test.sh testfile abc
  9. abc=(  def   = (ghijk  =  (lmn opq))
  10. )
  11. user@ubuntu:/tmp$ ./test.sh testfile ABC
  12. ABC=(   DE =(FG= (HIJK =
  13. (OPQ RST)
  14. )
  15. ))
  16. user@ubuntu:/tmp$ ./test.sh testfile dEF
  17. dEF = (
  18. ghI jK)
  19. user@ubuntu:/tmp$ ./test.sh testfile aBc
  20. aBc = (dEF = (
  21. ghI jK))

复制代码




作者: moperyblue    时间: 2019-12-25 10:56

  1. sed '/^aaaaa1=/,/^[a-zA-Z]/{0,//b;//!b;//Q};d' a.txt
复制代码

作者: Looiml    时间: 2020-02-27 17:49
  1. sed -n '/^aaaaa1=/{:a;p;n;/^[a-zA-Z]/Q;ba}' a.txt
复制代码





欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2