免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 12139 | 回复: 25
打印 上一主题 下一主题

求 :文本行合并 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2005-12-04 12:22 |只看该作者 |倒序浏览
111###bbb###eeeee###rrrrr
yeitqryrt
twhy

ejyh


222###dre###rrrrr#ffff
333###err###eeett###

444###eerr###ffff


eryt
555###rrr###rrr#rrrr
666
777###rrr###444
888###rrr###5455


要求得到结果如下
  1. 222###dre###rrrrr#ffff
  2. 777###rrr###444
  3. 888###rrr###5455
复制代码

规则如下
所有下一行中不含有###的都视为不完整记录,那么该行及以下不含###的所有行删除,直到碰到下一个###,

论坛徽章:
0
2 [报告]
发表于 2005-12-04 12:50 |只看该作者
  1. sed -n '/#/!=' file|xargs -i echo -e "{}\n{}-1" |bc|sort -n|uniq|sed 's/1/NR!=&/;:t;N;s/\n/\&\&NR!=/;bt' |xargs -i awk '{}' file
复制代码

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
3 [报告]
发表于 2005-12-04 12:55 |只看该作者
  1. cat filename|awk '{printf(/###/)?$0" ":$0"\n"}'|awk '$1~/###/&&$2~/###/'|tr ' ' '\n'|tr -s '\n'
复制代码

论坛徽章:
0
4 [报告]
发表于 2005-12-04 13:05 |只看该作者
原帖由 寂寞烈火 于 2005-12-4 12:55 发表
  1. cat filename|awk '{printf(/###/)?$0" ":$0"\n"}'|awk '$1~/###/&&$2~/###/'|tr ' ' '\n'|tr -s '\n'
复制代码


UUOC^_^

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
5 [报告]
发表于 2005-12-04 13:07 |只看该作者
原帖由 dbcat 于 2005-12-4 13:05 发表


UUOC^_^

别拿UUOC吓我! :em12:

论坛徽章:
0
6 [报告]
发表于 2005-12-04 13:28 |只看该作者
怎么我这样也可以?

[root@localhost shell_200512]# sed -n -e '/^2/p;/^7/p;/^8/p' err.txt >err.out
[root@localhost shell_200512]# more err.out
222###dre###rrrrr#ffff
777###rrr###444
888###rrr###5455


还得仔细看看高手们的。。。。

论坛徽章:
0
7 [报告]
发表于 2005-12-04 13:29 |只看该作者
呵呵,不好意思,没看到楼主的规则。

规则如下
所有下一行中不含有###的都视为不完整记录,那么该行及以下不含###的所有行删除,直到碰到下一个###,

论坛徽章:
0
8 [报告]
发表于 2005-12-04 14:48 |只看该作者
原帖由 dbcat 于 2005-12-4 12:50 发表
  1. sed -n '/#/!=' file|xargs -i echo -e "{}\n{}-1" |bc|sort -n|uniq|sed 's/1/NR!=&/;:t;N;s/\n/\&\&NR!=/;bt' |xargs -i awk '{}' file
复制代码
:mrgreen:



:t;N;s/\n/\&\&NR!=/;bt'

这里干脆看不懂!!!???

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
9 [报告]
发表于 2005-12-04 15:12 |只看该作者
/home/lee#cat a
111###bbb###eeeee###rrrrr
yeitqryrt
twhy

ejyh


222###dre###rrrrr#ffff
333###err###eeett###

444###eerr###ffff


eryt
555###rrr###rrr#rrrr
666
777###rrr###444
888###rrr###5455
/home/lee#echo $(<a)|sed 's/[0-9]\+###/\n&/g'|awk 'NF==1'
222###dre###rrrrr#ffff
333###err###eeett###
777###rrr###444
888###rrr###5455

论坛徽章:
0
10 [报告]
发表于 2005-12-04 15:35 |只看该作者
烈火兄:
LZ说要得到
222###dre###rrrrr#ffff
777###rrr###444
888###rrr###5455

不要3和其他的。


dbcat的xargs不知道怎么用的?
[root@localhost shell_200512]# sed -n  -e '/#/!=' err.txt|xargs -i awk '{}'
[root@localhost shell_200512]# sed -n  -e '/#/!=' |xargs -i awk '{}'
我的上面2个命令怎么无法运行都???

下面这个倒是可以,但是循环输出原文11次。
[root@localhost shell_200512]# sed -n  -e '/#/!=' err.txt|xargs -i awk '{}' err.txt

[root@localhost shell_200512]# sed -n  -e '/#/!=' err.txt
2
3
4
5
6
7
10
12
13
14
16
[root@localhost shell_200512]# sed -n  -e '/#/!=' err.txt|wc -l
     11



偶的分析:
dbcat先过滤掉了8,17,18行,用bc加入了1行和15行等,再把1,2,3,4,5,6,7,9,10,11,12,13,14,15,16行变成了一行,将下一行添加进模式空间,后面就不知道了,下一行应该是不匹配的,,,,,,,,,,,搞不懂xargs是什么作用了???

说的不对的,高手们莫笑,希望指正!

[ 本帖最后由 yuyuyou 于 2005-12-4 15:37 编辑 ]
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP