论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2007-05-22 08:56 |只看该作者 |倒序浏览

有一个文本有若干段
我想删除符合以下特征的段:

1 第一种
title
fsdaf
fsdaf
空行(不删除本行)

2 第二种
title
fdsaf
fdsaf
#ded(不删除本行)

3 第三种
title
dsa
fdsf
文件结束

注： title前面可能有空格或制表符，只要符合以上特征之一的删除第一次匹配（匹配多次时）
   第一次匹配方式可能是第一种也可能是第二种，不一定，不要错误地理解为用第一种方式匹配的第一次删除
   再用第二种匹配的方式将匹配的第一次删除，而是将三种方式混合，是并集，只要匹配包含于该并集，就将第
   一次匹配删除，其余不作处理
   文件中还有其它种类的段或行，并不是只有title开头的段格式
想想都捏一把汗，不知能否用sed解

例如：
name  fdafds

# this is a file

title  mike
fdsaf
fdsaf
#ddasd

title jack
fdsf
fdsafa

处理后：
name  fdafds

# this is a file

#ddasd

title jack
fdsf
fdsafa

[ 本帖最后由 chzht001 于 2007-5-22 14:16 编辑 ]

文库|博客

waker

富甲一方

论坛徽章:: 8

2楼 [报告]

发表于 2007-05-22 09:02 |只看该作者

请注意发帖标题并读新手导航，谢谢

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

Edengundam

家境小康

论坛徽章:: 0

3楼 [报告]

发表于 2007-05-22 09:37 |只看该作者

随便写了个, 貌似有些空行没有处理好...^^

sed -n -r '
:start
/^title/{
x;s:^\n::;s:\n?title$::;p;x;h;
}
n;
/^$|^#/{
x;s:.*::;x;P;
b start;
}
H;
b start;'

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

woodie

小富即安

论坛徽章:: 1

4楼 [报告]

发表于 2007-05-22 11:27 |只看该作者

写起来应该很简单，不过楼主的需求描述太混乱。^_^

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

wdavid

家境小康

论坛徽章:: 0

5楼 [报告]

发表于 2007-05-22 11:31 |只看该作者

原帖由 woodie 于 2007-5-22 11:27 发表
写起来应该很简单，不过楼主的需求描述太混乱。^_^

同感。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

wdavid

家境小康

论坛徽章:: 0

6楼 [报告]

发表于 2007-05-22 12:33 |只看该作者

原帖由 woodie 于 2007-5-22 11:27 发表
写起来应该很简单，不过楼主的需求描述太混乱。^_^

同感。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

chzht001

小富即安

论坛徽章:: 0

7楼 [报告]

发表于 2007-05-22 14:17 |只看该作者

不知现在说的清不清楚，复杂的我都说不清了

可能这样描述会更清晰一点：
我们平常匹配段时会有如下的样子
匹配以title开头，以endtitle结尾的段
这种方式容易：
/^title/.../^endtitle/

但我现在的匹配方式是
匹配以title开头，以三种方式中的一种结尾的段
三种方式为：
空行
以#开头的行
文件尾

用sed如何描述呢？

不可以写三个表达式来做，那样会删除匹配三次，
而我只想删除，以这三种方式之一匹配的一次

以哪种方式匹配未知，但肯定是这三种中的一种，
可能有一种匹配，可能有两种匹配，也可能有三种匹配
无论第一次匹配是哪种，都将该次匹配删除，其余任何匹配无需再作处理

[ 本帖最后由 chzht001 于 2007-5-22 14:36 编辑 ]