免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3051 | 回复: 3
打印 上一主题 下一主题

[网络配置] 关于大数据分析的网络日志标准问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-05-04 12:20 |只看该作者 |倒序浏览
大数据技术现在风头正劲,其中重要的功能是对非结构化的网络日志数据做分析,典型是web访问日志,连hadoop的demo程序里都放两个web日志片段作为样本数据。

web访问数据很普遍,大家也很熟悉,也似乎有Apache和IIS的基本标准的格式。
然后对一个大型网络来说,网络日志数据应该有防火墙日志、NAT转换日志、路由器日志、web日志、行为审计日志等,而不仅仅是由外向内访问的web日志,除了web日志外,其他的几种日志似乎都五花八门,没有相对统一的日志格式和规范,而就大数据分析而言,其他日志有时也许才是重点,比如行为审计日志;

我的问题是,除了web日志外,其他日志是否有相对的标准和规范?哪里可以查询?还是不同公司产品各异?其他几种日志间有无某种联系(比如行为审计日志实质上包含了NAT、路由器等设备日志)?
请熟悉的大虾指点

论坛徽章:
6
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-03 17:33:522015元宵节徽章
日期:2015-03-06 15:50:39IT运维版块每日发帖之星
日期:2016-01-11 06:20:00IT运维版块每日发帖之星
日期:2016-03-19 06:20:0019周年集字徽章-19
日期:2019-09-06 18:56:11
2 [报告]
发表于 2013-05-04 22:39 |只看该作者
比如有syslog日志traffice log和WELF目前最好的商业日志分析软件有Splunk等,你指的日志之间的联系就是日志的关联了,有ossim系统可以帮你解决问题,不过要购买商业版的哦,最后补充一点开源的软件也有,不过需要你话相当的力气去搞。

论坛徽章:
0
3 [报告]
发表于 2013-05-05 09:44 |只看该作者
啊,大湿,我其实真的很想知道日志格式啊
MapReduce有很强大的编程功能,除了能适应一些常见格式外,通过编程能支持任何自定义格式,因为日志文本的标准不外乎 XXXX YYYY ZZZZ 或者 XXXX,YYYYY,ZZZZ等,并且以换行为新纪录分隔,于是每条记录中我们只需要关注每个字段如何处理。

据我所知,防火墙、路由器及NAT转换的日志似乎很多国内外网络设备提供商都遵循相对标准日志记录,但我不知道这个“标准”是谁制定或者具体规范是什么;而行为审计大都由本地厂商研发,五花八门,没有固定格式,因为记录的内容和深度也可能完全不同或自定义;

请知道内幕的大侠提示或再做补充

论坛徽章:
6
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-03 17:33:522015元宵节徽章
日期:2015-03-06 15:50:39IT运维版块每日发帖之星
日期:2016-01-11 06:20:00IT运维版块每日发帖之星
日期:2016-03-19 06:20:0019周年集字徽章-19
日期:2019-09-06 18:56:11
4 [报告]
发表于 2014-12-17 09:28 |只看该作者
对于这类问题《UNIX/Linux网络日志分析与流量监控》一书值得参考。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP