免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 10470 | 回复: 21
打印 上一主题 下一主题

url截取问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-07-07 11:42 |只看该作者 |倒序浏览
本帖最后由 liqingfang 于 2011-07-07 12:25 编辑

最近老遇到字符串url的截取问题,也没有一个比较好的解决算法,只能对具体的问题具体分析,贴出来,看大家有没有比较好解决方案,牛人指点!哈哈

有客户端会发向服务端发送类似的url

   http://212.22.34.5/meili.php
   http://34.89.90.2:40440/kuaile/hao123/haha.php
   http://89.89.0.34
   http://www.baidu.com/shenghuo/lehelehe.php
   http://news.sina.com/country/news.html

   服务端的工作就是将这些url 中的ip地址截取下来,212.22.34.5,34.89.90.2(不要端口号),89.89.0.34,对于域名的url,只输出一级域名即:baidu.com,sina.com

   我是对‘/’进行的截取,还有处理一些特殊的情况,如第三个url,问问大家是否有好的算法?  waiting...

论坛徽章:
0
2 [报告]
发表于 2011-07-07 12:04 |只看该作者
不是必须用C的话,Perl正则就搞定了。

论坛徽章:
0
3 [报告]
发表于 2011-07-07 12:21 |只看该作者
回复 2# JCheung


    这是服务端的程序,需要高性能,尽量用C ,C++,Perl不熟,perl怎么实现?

论坛徽章:
5
狮子座
日期:2013-08-20 10:12:24午马
日期:2013-11-23 18:04:102015年辞旧岁徽章
日期:2015-03-03 16:54:152015亚冠之德黑兰石油
日期:2015-06-29 18:11:1115-16赛季CBA联赛之新疆
日期:2024-02-21 10:00:53
4 [报告]
发表于 2011-07-07 13:01 |只看该作者
本帖最后由 starwing83 于 2011-07-07 13:03 编辑

需要多高的性能?你自己写的在某些情况下性能未必就比perl的正则快……

论坛徽章:
0
5 [报告]
发表于 2011-07-07 13:12 |只看该作者
回复 4# starwing83


    perl的正则,能写几句样例代码吗》

论坛徽章:
0
6 [报告]
发表于 2011-07-07 13:16 |只看该作者
1.
get the exp,
and then chang the exp to NFA , change the NFA to  DFA.....

2. find the first ".",
    find the last "/", if not existed, then it is the and.
   then we got the   .*****/
   then you just try to identfy it is a ip or  others.

论坛徽章:
0
7 [报告]
发表于 2011-07-07 13:57 |只看该作者
本帖最后由 greensnow 于 2011-07-07 13:58 编辑

首先你得搞懂url的语法...你才有可能写出正确的算法
http://tools.ietf.org/html/rfc3986

论坛徽章:
0
8 [报告]
发表于 2011-07-07 16:43 |只看该作者
回复 7# greensnow

  那我最开始的思路是否正确呢,有没有较好的?谢谢!

论坛徽章:
0
9 [报告]
发表于 2011-07-07 17:59 |只看该作者
你这不就是要拿http的Hosts么

论坛徽章:
0
10 [报告]
发表于 2011-07-07 18:03 |只看该作者
本帖最后由 PKkingSon 于 2011-07-07 18:05 编辑

wireshark玩这个很溜,给你放个shell

  1. #!/bin/sh

  2. #Flydragon ipv6china@comsenz.com

  3. export PATH=$PATH:/usr/local/php/bin

  4. capdir=`pwd`

  5. while :;

  6. do

  7. TMPDIR=$capdir tshark -n -t a -c 100000 -R 'http.request.uri ' -T fields  -e "ip.src" -e "http.request.method" -e "http.host"


  8.    rm -f $capdir/ether*

  9.       sleep 1

  10. done
复制代码
脚本需要安装 wireshark
centos上 yum -y install wireshark
debian系 apt-get install tshark
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP