12 / 2 页下一页

论坛徽章:: 4

电梯直达

1楼 [收藏(0)] [报告]

发表于 2015-07-31 00:05 |只看该作者 |倒序浏览

初学shell，请教用shell怎样实现如下功能！谢谢！

操作文件对象是TSV文件。

例:
#cat abc_aa.TSV
a wrqwrewq aaeqwew1
b wqeqwewq aaeqwew2
c wqeqwe aaeqwew3
f 123456 aaeqwew4

#cat def_aa.TSV
d wrqwrewq bbqeqwew5
e          rttuyirewq bbeqwew6
f tytyrqwre bbeqwefef7
f 10000000000 bbeqwew8

#cat ghi_aa.TSV
g wrwewqe cceqwewq9
h          wewgfrgts cceqwewq10
i tyytuyyu cceqwewq11
f 5000000000    cceqwewq12

要求实现:
取以上每个文件中的最后一行的数据的第二个字段的数值,然后相加计算出总和。
要求在每取出文件最后一条记录第二个字段的数值之后，并删除最后一行数据。
最后将所有去掉最后一行纪录的文件合并成一个文件，合并后的结果如下:
a wrqwrewq aaeqwew1
b wqeqwewq aaeqwew2
c wqeqwe aaeqwew3
d wrqwrewq bbqeqwew5
e          rttuyirewq bbeqwew6
f tytyrqwre bbeqwefef7
g wrwewqe cceqwewq9
h          wewgfrgts cceqwewq10
i tyytuyyu cceqwewq11

文库|博客

haooooaaa

大富大贵

论坛徽章:: 54

2楼 [报告]

发表于 2015-07-31 08:06 |只看该作者

本帖最后由 haooooaaa 于 2015-07-31 08:06 编辑

awk 'FILENAME!=b&&b{split(f,t);d+=t[2];f=0}f{a[++c]=f}{f=$0;b=FILENAME}END{print d+$2;for(i=1;i<=length(a);i++){print a[i]>"new.txt"}}' a b c

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

jason680

富可敌国

论坛徽章:: 145

3楼 [报告]

发表于 2015-07-31 08:43 |只看该作者

回复 1# robinhappiness

$ awk '{if(FNR!=1)print s;s=$0}' abc_aa.TSV def_aa.TSV ghi_aa.TSV
a             wrqwrewq             aaeqwew1
b             wqeqwewq             aaeqwew2
c             wqeqwe             aaeqwew3
d             wrqwrewq                bbqeqwew5
e             rttuyirewq             bbeqwew6
f             tytyrqwre             bbeqwefef7
g             wrwewqe             cceqwewq9
h             wewgfrgts             cceqwewq10
i             tyytuyyu             cceqwewq11

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

MMMIX

广告杀手

论坛徽章:: 95

4楼 [报告]

发表于 2015-07-31 09:08 |只看该作者

本帖最后由 MMMIX 于 2015-07-31 09:14 编辑

回复 1# robinhappiness

awk '{ if ($2 ~ /^[0-9]+$/) {t += $2} else {print} } END { print t }' *.TSV

复制代码

当然，若是最后一行之前的行其第二列也可能为数字，那么就需要如下的代码：

awk '{ if (FNR != 1) print p; p = $0 } ENDFILE { split(p, a); t += a[2] } END { print t }' *.TSV

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

robinhappiness

丰衣足食

论坛徽章:: 4

5楼 [报告]

发表于 2015-07-31 09:08 |只看该作者

回复 2# haooooaaa

谢谢前辈！
非常抱歉，本人水平有限，能麻烦您解释一下这条命令的意思吗？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

haooooaaa

大富大贵

论坛徽章:: 54

6楼 [报告]

发表于 2015-07-31 09:11 |只看该作者

本帖最后由 haooooaaa 于 2015-07-31 09:12 编辑

回复 5# robinhappiness

我这个有点2, 不好,

刚才参考 jason 的,

改了一下,

这样....

awk 'FNR==1{d+=k}FNR!=1{print s>"new.txt"}{s=$0;k=$2}END{print d+$2}' a b c

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

robinhappiness

丰衣足食

论坛徽章:: 4

7楼 [报告]

发表于 2015-07-31 09:16 |只看该作者

回复 3# jason680

谢谢！

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

tigerpower

白手起家

论坛徽章:: 0

8楼 [报告]

发表于 2015-07-31 09:30 |只看该作者

本帖最后由 tigerpower 于 2015-07-31 09:40 编辑

perl -anlE 'if(eof){$t+=@F[1]}else{say}END{say STDERR $t}' *_aa.TSV > new.TSV

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

robinhappiness

丰衣足食

论坛徽章:: 4

9楼 [报告]

发表于 2015-07-31 09:40 |只看该作者

回复 4# MMMIX

多谢了！

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

toddhai

稍有积蓄

论坛徽章:: 5

10楼 [报告]

发表于 2015-07-31 09:48 |只看该作者

本帖最后由 toddhai 于 2015-07-31 09:48 编辑

FNR!=1,我不懂什么意思。
在读这三个文件的时候FNR的值分别是1,2,3,4/1,2,3,4/1,2,3,4 。那么FNR！=1不就是筛选出来2,3,4行了吗，可是为什么执行这条语句的结果却是把筛选出了1,2,3行呢？
求大神指点！
回复 3# jason680

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

12 / 2 页下一页

返回列表

Chinaunix › 论坛 › 程序设计 › Shell › 怎样计算多个TSV文件中指定行字段的值的总和，并删除指 ...

[文本处理] 怎样计算多个TSV文件中指定行字段的值的总和，并删除指定行，最后合并文件内容? [复制链接]