免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3494 | 回复: 5

高难度取字符串,求助 [复制链接]

论坛徽章:
0
发表于 2008-12-18 16:45 |显示全部楼层
tinyurl.com/693tpn
blog.sina.com.cn/main/top_new/article_so
hot.yikuai.com/inc_page/qidian/vg_text_q
221.206.121.36/war3/200708/200708281606.
img.kx2233.cn/kx2233/peer_se_01.html
cn.mail.yahoo.com/img/loginrec.htm?rr=39
www.dreamgm.com/
www.2lipslive.com
ivy.pconline.com.cn/adpuba/show2?channel
auction1.taobao.com/auction/item_detail-
www.933999.com/Article_List.asp?type=19
c.ikaka.com/KakaURLRedirect/Index.aspx?F
games.enet.com.cn/download/startdwn.php?
updatem.360safe.com/safe/safeupm.cab?typ
trace.qq.com/collect?pj=1990&dm=news.qq.
z.alimama.com
updatem.360safe.comhttp://updatem.360safe.com/safe/safeupm.cab?typ

-----------------------------------------------------------------------------------------------
想在3000万的数据中取出URL和IP地址,如上面的URL中取出域名或IP,不包括www.只要www.后面到第一个/之间的域名如下
tinyurl.com
yikuai.com
221.206.121.36
kx2233.cn
yahoo.com

本人用了instr 和substr函数,写SQL语句都不成功.,请高手指教!!

论坛徽章:
1
丑牛
日期:2014-08-07 17:07:05
发表于 2008-12-18 16:55 |显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
发表于 2008-12-18 22:28 |显示全部楼层
原帖由 myeer 于 2008-12-18 16:45 发表
tinyurl.com/693tpn
blog.sina.com.cn/main/top_new/article_so
hot.yikuai.com/inc_page/qidian/vg_text_q
221.206.121.36/war3/200708/200708281606.
img.kx2233.cn/kx2233/peer_se_01.html
cn.mail.yah ...



select regexp_replace (your-addr-col, '^(www[.])?([^/]+).*', '\2')
from your-table
;

我不是很确定这个结果是否正确。oracle的正则和unix的ERE很类似,但是不全像。手头也没有环境。I hope it will work

论坛徽章:
1
丑牛
日期:2014-08-07 17:07:05
发表于 2008-12-19 10:00 |显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
发表于 2008-12-19 13:48 |显示全部楼层
10g以下的版本你可以测试一下这个
select  substr(replace(your-addr-col,'www.'),1,instr(your-addr-col,'/')-1) from your-addr-table

论坛徽章:
0
发表于 2008-12-22 13:43 |显示全部楼层
oracle是10G的,谢谢大家帮忙,我去试试一下!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP