论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2012-05-14 12:06 |只看该作者 |倒序浏览

shell 处理脚本编写：
功能为合并第一列前缀相同的内容，并累加计算出后续列内容及数量，脚本越简单越好。
-----------------------------------
Abcd err1 100 err2 2000
Abcdf err2 2000 err4 200
Bdadf err10 90 err90 10
Badfa err10 10 err23 50

-------------------------
输出结果
A err1 100 err2 4000 err4 200
B err10 100 err90 10 err23 50

文库|博客

mpstat

富足长乐

论坛徽章:: 0

2楼 [报告]

发表于 2012-05-14 13:24 |只看该作者

没看懂........

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

e_member

白手起家

论坛徽章:: 0

3楼 [报告]

发表于 2012-05-14 13:42 |只看该作者

自己实现了一个方法，比较乱

awk '{
idx1=substr($1,1,4)""$2;
for( i = 2; i < NF;i+=2)
{
      idx2=sprintf("%s %s",idx1,$i);
      err_list[idx2]+=$(i+1);
}
}END{
for(i in err_list )
{
   printf("%s %.0f\n",i,err_list[i])|"sort"

}
}'  $1 | awk 'BEGIN{
run_once = 1;
}{
cnt=arr[$1];
if( run_once == 1 && cnt == 0)
{
      run_once = 2;
      printf("%s %s %.0f",$1,$2,$3);
      arr[$1]=1;
      err[$2]=1;
}
else if( cnt == 0 )
{
      printf("\n%s %s %.0f",$1,$2,$3);
      arr[$1]=1;
      err[$2]=1;
}
else
{
      arr[$1]++;
      printf(" %s %.0f" ,$2 ,$3);
}
}END{
printf("\n");
}'

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

e_member

白手起家

论坛徽章:: 0

4楼 [报告]

发表于 2012-05-14 13:44 |只看该作者

意思很简单，分类统计信息，规则就像描述的测试数据一样。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

jason680

富可敌国

论坛徽章:: 145

5楼 [报告]

发表于 2012-05-14 14:13 |只看该作者

回复 1# e_member

How about this one

perl -ane '{$k=substr(shift(@F),0,1);while($n=shift(@F)){$v=shift(@F);$h{$k}{$n}+=$v}}END{for(sort keys %h){print "$_ ";for $k(sort keys %{$h{$_}}){print "$k $h{$_}{$k} "}print"\n"}}' FILE
A err1 100 err2 4000 err4 200
B err10 100 err23 50 err90 10

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

rdcwayx

版主

论坛徽章:: 15

6楼 [报告]

发表于 2012-05-14 14:13 |只看该作者

awk '{s=substr($1,1,1);b[s];for (i=2;i<=NF;i=i+2) {a[s FS $i]+=$(i+1);c[$i]}}
END{ for (i in b)
{ printf i OFS;
for (j in c) if (a[i FS j]+0!="0") printf j OFS a[i FS j] OFS;
printf ORS
}
}' OFS="\t" infile
A err1 100 err2 4000 err4 200
B err23 50 err90 10 err10 100

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

e_member

白手起家

论坛徽章:: 0

7楼 [报告]

发表于 2012-05-14 16:08 |只看该作者

谢谢您的回答！使用perl来处理是个很不错的方法，用shell写完了，我可以在使用perl试试，应该比shell实现起来简单些。
回复 5# jason680

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

e_member

白手起家

论坛徽章:: 0

8楼 [报告]

发表于 2012-05-14 16:10 |只看该作者

这个比较精简了，就需要这种思路。谢谢版主的回答！回复 6# rdcwayx

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

zooyo zooyo 当前离线禁止发言好友博客消息论坛徽章: 3	9楼 [报告] 发表于 2012-05-14 22:38 \|只看该作者提示: 作者被禁止或删除内容自动屏蔽
zooyo zooyo 当前离线禁止发言好友博客消息论坛徽章: 3	实战分享：从技术角度谈机器学习入门\| 【大话IT】RadonDB低门槛向MySQL集群下战书 \| ChinaUnix打赏功能已上线！ \| 新一代分布式关系型数据库RadonDB知多少？

返回列表

Chinaunix › 论坛 › 程序设计 › Shell › shell二维表信息处理问题，亟待解决！

zooyo zooyo 当前离线禁止发言好友博客消息论坛徽章: 3	9楼 [报告] 发表于 2012-05-14 22:38 \|只看该作者提示: 作者被禁止或删除内容自动屏蔽
zooyo zooyo 当前离线禁止发言好友博客消息论坛徽章: 3	实战分享：从技术角度谈机器学习入门\| 【大话IT】RadonDB低门槛向MySQL集群下战书 \| ChinaUnix打赏功能已上线！ \| 新一代分布式关系型数据库RadonDB知多少？

shell二维表信息处理问题，亟待解决！ [复制链接]

浏览过的版块