免费注册	查看新帖 \|


平台论坛博客文库

› 论坛 › 程序设计 › Shell › 文本处理求助

12 / 2 页下一页

最近访问板块

发新帖

查看: 3281 | 回复: 11

上一主题

下一主题

文本处理求助 [复制链接]

论坛徽章:: 0

电梯直达

跳转到指定楼层

1楼 [收藏(0)] [报告]

发表于 2008-04-23 11:42 |只看该作者 |倒序浏览

10可用积分

1.txt是一个形如
30 a1 9876
29 a2 9874
28 a3 9872
27 a4 9870
26 a5 9868
25 a6 9866
24 a7 9864
23 a8 9862
22 a9 9860
21 a10 9858
20 a11 9856
19 a12 9854
18 a13 9852
17 a14 9850
16 a15 9848
15 a16 9846
14 a17 9844
13 a18 9842
12 a19 9840
11 a20 9838
10 a21 9836
9 a22 9834
8 a23 9832
7 a24 9830
6 a25 9828
5 a26 9826
4 a27 9824
的文本，现在需要统计该文本从第一行开始直到总行数第20%行的第三列的数据之和
请问，我怎么去找到这个20%的行
除了这样的方法
eval `awk '{ total_num+=$1/$1; total_flow+=$3 }END {print "total_num="total_num,"total_flow="total_flow}' 1.txt`
awk -v total_num=$total_num '{ x+=$1/$1; if ( x < total_num*0.2 ) y+=$3 } END { print "y="y}'1.txt

最佳答案

查看完整内容

文库|博客

论坛徽章:: 0

2楼 [报告]

发表于 2008-04-23 11:42 |只看该作者

#!/usr/bin/sh
C=$(wc -l 1.txt | awk '{printf "%d", $1*0.2}')
head -n $C 1.txt| awk '{sum+= $3};END{print sum}'

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

3楼 [报告]

发表于 2008-04-23 11:56 |只看该作者

awk '{a[NR]=$3}END{for(i=1;i<=NR/5;i++)sum+=a[i];print sum}' file

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

4楼 [报告]

发表于 2008-04-23 12:09 |只看该作者

try

awk 'a[NR]=$3 ;END{b=(index(NR/5,"."))?int(NR/5)+1:NR/5;for(i=1;i<=b;i++){c+=a[i]}print c}' a

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 1

荣誉会员
日期:2011-11-23 16:44:17

5楼 [报告]

发表于 2008-04-23 12:21 |只看该作者

试试这个：
awk 'FNR<NR{
if (FNR==1)
   lines=int((NR-1)*.2);
sum+=$3;
if (FNR ==lines){
   print sum;
   exit}}' 1.txt 1.txt

读文件两次，第一次得到文件总行数，并计算第20%的行号；第二次累加第3列，达到第20%行后打印总和并退出程序。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

6楼 [报告]

发表于 2008-04-23 13:19 |只看该作者

total=$(wc -l data|awk '{print $1}') && awk 'dead=NR/'$total' {if(dead<=0.2){result+=$3}} END{print result}' data

[ 本帖最后由 jackymail 于 2008-4-23 13:20 编辑 ]

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 3

2015年迎新春徽章
日期:2015-03-04 09:56:11

数据库技术版块每日发帖之星
日期:2016-08-03 06:20:00

数据库技术版块每日发帖之星
日期:2016-08-04 06:20:00

7楼 [报告]

发表于 2008-04-23 13:27 |只看该作者

awk 'BEGIN{a[0]=0}{a[NR]=a[NR-1]+$3}END{print a[int(NR/5)]}'

[ 本帖最后由 cjaizss 于 2008-4-23 13:32 编辑 ]

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

8楼 [报告]

发表于 2008-04-23 13:49 |只看该作者

如果总行数不能被5整除，
怎么知道你要处理的行数？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

9楼 [报告]

发表于 2008-04-23 14:03 |只看该作者

原帖由 davistar 于 2008-4-23 11:56 发表

awk '{a[NR]=$3}END{for(i=1;i

恩谢谢你啊

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

10楼 [报告]

发表于 2008-04-23 14:15 |只看该作者

原帖由 davistar 于 2008-4-23 11:56 发表

awk '{a[NR]=$3}END{for(i=1;i

我想问一下，我可以吧这个放到循环中去吗？
比如这样for((j=1;j<9;j++))
do
awk -v y=$y '{a[NR]=$3}END{ for(i=1;i<=j*NR/10;i++) sum+=a; print sum y }' url.txt >url1.txt
echo "the $j 0% has \n"
awk '{print $1 / $2}' url1.txt
echo 0
done

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

12 / 2 页下一页

发新帖

Chinaunix › 论坛 › 程序设计 › Shell › 文本处理求助

北京盛拓优讯信息技术有限公司. 版权所有京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号：11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员联系我们：huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP