123 / 3 页下一页

[文本处理] 请教各位大侠一个换行的问题 [复制链接]

redir

白手起家

论坛徽章:: 0

11楼 [报告]

发表于 2012-08-31 09:55 |只看该作者

$9取日志里面的内容，比如请求内容里面的uid，还有$10,取name之类的

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

rdcwayx

版主

论坛徽章:: 15

12楼 [报告]

发表于 2012-08-31 10:06 |只看该作者

awk 里，条件一条一条的加，你自己试一下啦。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

redir

白手起家

论坛徽章:: 0

13楼 [报告]

发表于 2012-08-31 10:27 |只看该作者

求rdcwayx大大指点

awk '{if ($8!="-") {print $1, $2 ,$8} else {print $1,$2}}' OFS="," test
日志如下：

13:46:07 127.0.0.1 GET /test testsets 80 - 127.0.0.1 asdfasdfadfadfasdf123123123username123123123123uid=asd1;asdfasdfasdfemail=123123123@123.com;asdfasdfasdfasdf 200 0 0 1823 1147 31

如上如何在一行取出uid和email呢？感激不尽！

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

rdcwayx

版主

论坛徽章:: 15

14楼 [报告]

发表于 2012-08-31 11:27 |只看该作者

1. 要保证第九个字段没有空格，否则命令还得调整：
2. 需要gawk 支持

awk '{s=gensub(/.+uid=([^;]+);.+email=([^;]+);.+/,"\\1 \\2","g",$9);print $1,$2,$8,s}' infile
13:46:07 127.0.0.1 127.0.0.1 asd1 123123123@123.com

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

redir

白手起家

论坛徽章:: 0

15楼 [报告]

发表于 2012-08-31 12:17 |只看该作者

本帖最后由 redir 于 2012-08-31 13:09 编辑

感激rdcwayx大大，试用了下，效果可以，但是email和uid不存在的时候，把后面日志的内容也输出来了，如何判断uid不存在的话就输出email,如果email也不存在就输出none呢？谢谢。
我这样写了

awk '{s=gensub(/.+uid=([^;]+);.+email=([^;]+);.+/,"\\1 \\2","g",$9);if(s~/uid/){print $1,$2,$8,s}else if(s~email){print $1,$2,$8,s}else print $1,$2,$8,"null"}' infile

复制代码

但是这样当日志文件大的时候判断起来速度好慢。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

rdcwayx

版主

论坛徽章:: 15

16楼 [报告]

发表于 2012-08-31 13:18 |只看该作者

awk '{ uid=($9~/uid=/)?gensub(/.+uid=([^;]+);.+/,"\\1","g",$9):"null";
email=($9~/email=/)?gensub(/.+email=([^;]+);.+/,"\\1","g",$9):"null";
print $1,$2,$8,uid,email}' infile

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

redir

白手起家

论坛徽章:: 0

17楼 [报告]

发表于 2012-08-31 13:26 |只看该作者

可以了，

日志里面如果有如下：
asdfasdfadfadfasdf123123123username123123123123uid=asd1;asdfasdfasdfemail=123123123@123.com;test=test11111 asdfasdfasdfasdf 200 0 0 1823 1147 31

如何匹配出这个test11111啊？这后面是个空格。斐擦汗功能感谢rdcwayx大大不厌其烦回答。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

rdcwayx

版主

论坛徽章:: 15

18楼 [报告]

发表于 2012-08-31 13:35 |只看该作者

我猜想你的$9应该是已经按照分号 ; 分段的，如果这样的话，命令要方便很多。但是你给的例子里已经重新改过，就找不到这个特征了。

awk '{ uid=($9~/uid=/)?gensub(/.+uid=([^;]+);.+/,"\\1","g",$9):"null";
email=($9~/email=/)?gensub(/.+email=([^;]+);.+/,"\\1","g",$9):"null";
test=($9~/test=/)?gensub(/.+test=(.+)/,"\\1","g",$9):"null";
print $1,$2,$8,uid,email,test}' infile

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

redir

白手起家

论坛徽章:: 0

19楼 [报告]

发表于 2012-08-31 13:48 |只看该作者

%9里面是正常的IIS日志，都是以空格分割了，貌似这个test还会把后面的内容取出来，
查看了下，这个test字段出现的位置比较麻烦，如下：
asdfasdfadfadfasdf123123123username123123123123uid=asd1;asdfasdfasdfemail=123123123@123.com;test=test11111 asdfasdfasdfasdf 200 0 0 1823 1147 31

asdfasdfadfadfasdf123123123username123123123123uid=asd1asdfasdfasdfemail=123123123@123.com;test=test11111;asdfasdfasdfasdf 200 0 0 1823 1147 31

asdfasdfadfadfasdf123123123username123123123123uid=asd1;asdfasdfasdfemail=123123123@123.com;test=test11111&asdfasdfasdfasdf 200 0 0 1823 1147 31
asdfasdfadfadfasdf123123123username123123123123uid=asd1;asdfasdfasdfemail=123123123@123.com;asdfasdfasdfasdf test=test11111 200 0 0 1823 1147 31

是这样乱序的，后面不是分号就是空格。这样该咋写呢

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

rdcwayx

版主

论坛徽章:: 15

20楼 [报告]

发表于 2012-08-31 14:38 |只看该作者

这个应该是通用的了。

awk '{ uid=(/uid=/)?gensub(/.+uid=([^&; ]+)[&; ].+/,"\\1","g"):"null";
email=(/email=/)?gensub(/.+email=([^&; ]+)[^&; ].+/,"\\1","g"):"null";
test=(/test=/)?gensub(/.+test=([^&; ]+)[^&; ].+/,"\\1","g"):"null";
print $1,$2,$8,uid,email,test}' infile

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

123 / 3 页下一页

返回列表

Chinaunix › 论坛 › 程序设计 › Shell › 请教各位大侠一个换行的问题

[文本处理] 请教各位大侠一个换行的问题 [复制链接]

浏览过的版块