免费注册	查看新帖 \|


平台论坛博客文库

› 论坛 › 程序设计 › Shell › 【awk数据归类】求expert1解释~

12 / 2 页

最近访问板块

发新帖

楼主: SlowLaris

上一主题

下一主题

【awk数据归类】求expert1解释~ [复制链接]

论坛徽章:: 3

2015年迎新春徽章
日期:2015-03-04 09:56:11

数据库技术版块每日发帖之星
日期:2016-08-03 06:20:00

数据库技术版块每日发帖之星
日期:2016-08-04 06:20:00

11楼 [报告]

发表于 2011-11-18 16:25 |只看该作者

本帖最后由 cjaizss 于 2011-11-18 16:56 编辑

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

zooyo zooyo 当前离线禁止发言好友博客消息论坛徽章: 3	12楼 [报告] 发表于 2011-11-18 16:51 \|只看该作者提示: 作者被禁止或删除内容自动屏蔽
zooyo zooyo 当前离线禁止发言好友博客消息论坛徽章: 3	实战分享：从技术角度谈机器学习入门\| 【大话IT】RadonDB低门槛向MySQL集群下战书 \| ChinaUnix打赏功能已上线！ \| 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

13楼 [报告]

发表于 2011-11-18 17:40 |只看该作者

回复 10# expert1

恩，谢谢，这么看确实是清晰了，但是把p1=$1和p2=$2挪到前面了，我执行了一下，结果变了，就拿你的例子来说，输出结果变成：

,20,21,30,40

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 16

IT运维版块每日发帖之星
日期:2015-08-24 06:20:00

综合交流区版块每日发帖之星
日期:2015-10-14 06:20:00

IT运维版块每日发帖之星
日期:2015-10-25 06:20:00

IT运维版块每日发帖之星
日期:2015-11-06 06:20:00

IT运维版块每日发帖之星
日期:2015-12-10 06:20:00

平安夜徽章
日期:2015-12-26 00:06:30

2016猴年福章徽章
日期:2016-02-18 15:30:34

IT运维版块每日发帖之星
日期:2016-04-15 06:20:00

IT运维版块每日发帖之星
日期:2016-05-21 06:20:00

综合交流区版块每日发帖之星
日期:2016-08-16 06:20:00

2015七夕节徽章
日期:2015-08-21 11:06:17

IT运维版块每日发帖之星
日期:2015-08-14 06:20:00

14楼 [报告]

发表于 2013-09-13 16:56 |只看该作者

回复 13# SlowLaris

不好意思，之前一直没仔细看这个问题，今天无意中翻起来，又认真思考了一下，写了下边的，但有点冗余，但比那个容易理解多了。思路完全一样。

awk 'NR==1{p1=$1;p2=$2;s=$1"\t"$2}NR>1{
if($1==p1){
if($2==p2+1){
s=s"-"$2
}else{
s=s","$2}
p1=$1;p2=$2
}else {
gsub(/-[^,]*-/,"-",s);print s;
p1=$1;p2=$2;
s=$1"\t"$2
}
}END{gsub(/-[^,]*-/,"-",s);
print s}'
解释，读取第一行的时候，分别赋值p1,p2，和s
第二行，判断第一行是否相等，假如yes,那么判断
是否连续，是的话，-连接，否则,连接
那么第一行p1=4056,p=98,第二行，p1相等，p2不连续，7717 78,198
之后p1=4056;p2=198
此时第一列不等，那么p1,p2分别要赋新的值，然后把之前的格式化后打印（gsub)。此时必须要把s重新赋值，否则s还是之前的4056 78，198不变。
因为下一行打印上1或几行（合并之后），那么最后要有个end把最后一次的打印出来。

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 16

IT运维版块每日发帖之星
日期:2015-08-24 06:20:00

综合交流区版块每日发帖之星
日期:2015-10-14 06:20:00

IT运维版块每日发帖之星
日期:2015-10-25 06:20:00

IT运维版块每日发帖之星
日期:2015-11-06 06:20:00

IT运维版块每日发帖之星
日期:2015-12-10 06:20:00

平安夜徽章
日期:2015-12-26 00:06:30

2016猴年福章徽章
日期:2016-02-18 15:30:34

IT运维版块每日发帖之星
日期:2016-04-15 06:20:00

IT运维版块每日发帖之星
日期:2016-05-21 06:20:00

综合交流区版块每日发帖之星
日期:2016-08-16 06:20:00

2015七夕节徽章
日期:2015-08-21 11:06:17

IT运维版块每日发帖之星
日期:2015-08-14 06:20:00

15楼 [报告]

发表于 2013-09-22 17:12 |只看该作者

http://bbs.chinaunix.net/thread-4098548-2-1.html

在这里19楼我发了贴，其实是一类问题。这个先sort -k1,1 -k2n ，由于坐标中$2<$3是成立的。所以

awk 'NR==1{tag=$1;start=$2;end=$3}NR>1{
if($1==tag){
if($2<end && $3>=end)
end=$3
else if($3<end)next
else{
print tag,start,end;start=$2;end=$3;tag=$1
}
}
else {
print tag,start,end;tag=$1;start=$2;end=$3
}
}END{print tag,start,end}'

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

12 / 2 页

发新帖

Chinaunix › 论坛 › 程序设计 › Shell › 【awk数据归类】求expert1解释~

北京盛拓优讯信息技术有限公司. 版权所有京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号：11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员联系我们：huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP