免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2122 | 回复: 3
打印 上一主题 下一主题

[算法] 一个模式识别问题的请教 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-10-10 17:58 |只看该作者 |倒序浏览
各位大虾:
    小弟有一个需求,是从不同的字符串中提取信息,字符串的格式不固定,有多种样式,例如:

Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 2.0.50727)
Mozilla/5.0 (iPod; CPU iPhone OS 5_1_1 like Mac OS X) AppleWebKit/534.46 (KHTML, like Gecko) Mobile/9B206
PPTV 1.2.11 (iPhone; iPhone OS 5.1.1; zh_CN)
3.9.7/190 (Linux; U; Android 2.3.5; zh-cn; Lenovo A65; Build/GRJ90; ; Lenovo)
......

     现需要从这些字符串中提取指定的信息,如操作系统类型、版本、程序名等。

    对于这类问题,我应该采用什么样的思路来设计这个程序?模式识别还是其它什么?
    小弟之前没搞过这种问题,请各位大虾指教,小弟在线等。
    谢谢谢谢!!!

论坛徽章:
0
2 [报告]
发表于 2012-10-10 18:59 |只看该作者
正则搞不定?

论坛徽章:
5
狮子座
日期:2013-08-20 10:12:24午马
日期:2013-11-23 18:04:102015年辞旧岁徽章
日期:2015-03-03 16:54:152015亚冠之德黑兰石油
日期:2015-06-29 18:11:1115-16赛季CBA联赛之新疆
日期:2024-02-21 10:00:53
3 [报告]
发表于 2012-10-10 19:02 |只看该作者
http header里面的那个吧?(叫什么来着……)

关键是这玩意儿的结构到底是什么样子的,你不知道具体结构,肯定搞不定。

可以看看http_parser,看看它是如何分析的。

论坛徽章:
4
水瓶座
日期:2013-09-06 12:27:30摩羯座
日期:2013-09-28 14:07:46处女座
日期:2013-10-24 14:25:01酉鸡
日期:2014-04-07 11:54:15
4 [报告]
发表于 2012-10-12 20:38 |只看该作者
本帖最后由 linux_c_py_php 于 2012-10-12 20:38 编辑

ua没有固定格式, 谈不上识别.
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP