免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: 刀鱼
打印 上一主题 下一主题

文本统计与排序问题求解 [复制链接]

论坛徽章:
0
11 [报告]
发表于 2007-11-29 15:53 |只看该作者
那不对啊,我还有个疑问!!

[root@cms101 28]# awk -F '[ ?]+' '{a[$7]++}END{for(i in a)printf "%s %d\n",i,a[  i  ]}' www_access_log | sort -k2nr | head -5
/ 7985
/img/2007/bg_login.gif 6715
/detailcount/count.aspx 3502
/_vti_bin/owssvr.dll 1995
/MSOffice/cltreq.asp 1956
[root@cms101 28]# awk '{print $7}' www_access_log  | sort | uniq -c | sort -nr | head -5
   7465 /
   6715 /img/2007/bg_login.gif
   1868 /&
   1563 /rest/text.htm
   1552 /lbi-image/homepage/gif9901.gif

这个我知道了,是URL参数的问题!

但是awk -F '[ ?]+' '{a[$7]++}解释不通啊!

[root@rhel401 del]# cat file
1 2 3 4 5
1?2?3?4?5
[root@rhel401 del]# awk -F '[?]+' '{print $1}' file
1 2 3 4 5
1
哪里来的$7呢?

论坛徽章:
0
12 [报告]
发表于 2007-11-29 16:10 |只看该作者
原帖由 linuxnextyear 于 2007-11-29 15:53 发表
那不对啊,我还有个疑问!!

[root@cms101 28]# awk -F '[ ?]+' '{a[$7]++}END{for(i in a)printf "%s %d\n",i,a[  i  ]}' www_access_log | sort -k2nr | head -5
/ 7985
/img/2007/bg_login.gif 6715
/de ...

没看懂你维的啥意思?
上面的输出没错啊

论坛徽章:
0
13 [报告]
发表于 2007-11-29 16:17 |只看该作者
但是awk -F '[ ?]+' '{a[$7]++}解释不通啊!

[root@rhel401 del]# cat file
1 2 3 4 5
1?2?3?4?5
[root@rhel401 del]# awk -F '[?]+' '{print $1}' file
1 2 3 4 5
1
我的意思是设置?为分隔符的时候,第一个?以前是$1,第二个?以前是$2啊,
所以a[$7]++}中的$7是怎么来的?
还是空格做分割?

论坛徽章:
0
14 [报告]
发表于 2007-11-29 16:20 |只看该作者
原帖由 linuxnextyear 于 2007-11-29 16:17 发表
但是awk -F '[ ?]+' '{a[$7]++}解释不通啊!

[root@rhel401 del]# cat file
1 2 3 4 5
1?2?3?4?5
[root@rhel401 del]# awk -F '[?]+' '{print $1}' file
1 2 3 4 5
1
我的意思是设置?为分隔符的时候 ...


FS 支持 RE
[ ?]+
表示 不管 空格 还是?  都作为分割

论坛徽章:
0
15 [报告]
发表于 2007-11-29 16:23 |只看该作者

又学了一招

论坛徽章:
0
16 [报告]
发表于 2007-11-29 16:24 |只看该作者
有什么解释不通的?

-F '[ ?]+'

表示以  空格  或  ?  作为分隔符
因此,当有多个连续的空格 、  多个连续的?  、 多个空格与?的组合  的时候,就认为是字段分隔

记住,表达式中,问号前面有空格
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP