免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3475 | 回复: 11

[其他] [正则]借人气求一个python正则 [复制链接]

论坛徽章:
0
发表于 2014-10-19 21:50 |显示全部楼层
要用Python从一个很长的串中提取一些字串(它们都以/jobs?viewJob=&jobId=开始,以%3Aprimary结束),

多谢了,各位

论坛徽章:
3
丑牛
日期:2014-09-13 18:19:22摩羯座
日期:2014-10-10 17:43:02水瓶座
日期:2014-10-16 01:00:22
发表于 2014-10-19 22:06 |显示全部楼层
学生党:飘过~请楼主给详细点儿的文本方便测试~谢谢嗯

论坛徽章:
3
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:51:162015年亚洲杯之阿曼
日期:2015-04-07 20:00:59
发表于 2014-10-19 22:20 |显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
发表于 2014-10-19 22:29 |显示全部楼层
re.findall((?<=right_text)(.*)?(?=left_text)),whole_text)

论坛徽章:
0
发表于 2014-10-19 22:47 |显示全部楼层
回复 2# 李满满


    :{"lix_header_lowercase":"control","EndorseDialogJS"unsaveJobUrl":"/job/consumer/savedItems/unsaveJobAjax?jobId=11339728&csrfToken=ajax%3A6032962507117593044&trk=vsrp_jobs_res_sec_act&trkInfo=VSRPsearchId%3A3779929881413714367824%2CVSRPtargetId%3A11339728%2CVSRPcmpt%3Aprimary"}]},"primaryAction":"view","saveJobUrl":"/job/consumer/savedItems/saveJobAjax?jobId=11339728&csrfToken=ajax%3A6032962507117593044&trk=vsrp_jobs_res_pri_act&trkInfo=VSRPsearchId%3A3779929881413714367824%2CVSRPtargetId%3A11339728%2CVSRPcmpt%3Aprimary","link_vie</script><script type="text/javascript">fs.embed("voltron_srp_main","

多谢了

论坛徽章:
0
发表于 2014-10-19 22:50 |显示全部楼层
回复 5# ghostvic


    好像没有目标数据...

看这个:
:{"lix_header_lowercase":"control","EndorseDialogJS":photo":"/jobs?viewJob=&jobId=11307997&trk=vsrp_jobs_res_photo&trkInfo=VSRPsearchId%3A3779929881413714367824%2CVSRPtargetId%3A11307997%2CVSRPcmpt%3Aprimary","fmt_job_recency":"3 days ago","postedDate":1413414469000,"companyLogoId":"/p/2/000/294/05d/0b9c5b8.png","companyId":406315,"fmt_postedDate":"Oct 15, 2014","link_biz_overview_5":"/company/406315?trk=vsrp_jobs_res_name&trkInfo=VSRPsearchId%3A3779929881413714367824%2CVSRPtargetId%3A11307997%2CVSRPcmpt%3Aprimary","link_viewJob":"/jobs?viewJob=&jobId=11307997&trk=vsrp_jobs_res_name&trkInfo=VSRPsearchId%3A3779929881413714367824%2CVSRPtargetId%3A11307997%2CVSRPcmpt%3Aprimary","isApplied":false,"id":11307997,"link_voltron_job_search_5":"/vsearch/j?rsid=3779929881413714367824&pivotType=sim&pid=11307997&trk=vsrp_jobs_res_sim&trkInfo=VSRPsearchId%3A37799298</script><script type="text/javascript">fs.embed("voltron_srp_main","

论坛徽章:
0
发表于 2014-10-20 10:01 |显示全部楼层
回复 4# yinyuemi


   我试了下,不知道为啥不行,我啥地方写错了么?
foundURL = re.findall(r'(?<=/jobs?viewJob)(.*)?(?=%3Aprimary)',data)

谢谢

论坛徽章:
0
发表于 2014-10-20 10:44 |显示全部楼层
ghostvic 发表于 2014-10-20 10:01
回复 4# yinyuemi


自己搞出来了,
foundURL = re.findall(r'\/jobs\?viewJob.*?%3Aprimary',data)

但是用(?<=right_text)(.*)?(?=left_text) 总报错

论坛徽章:
3
天蝎座
日期:2013-12-10 19:37:11酉鸡
日期:2014-08-04 20:05:38双鱼座
日期:2014-08-09 21:53:54
发表于 2014-10-20 11:01 |显示全部楼层
本帖最后由 欧阳西风 于 2014-10-20 11:06 编辑

回复 7# ghostvic


    这个可以 将第二个?使用反斜线转义,把第三个?放到括号里面 foundURL = re.findall(r'(?<=/jobs\?viewJob)(.*?)(?=%3Aprimary)',data)

另外 这个正则匹配到的字符串是不包含/jobs?viewJob以及%3Aprimary头尾的,只会获得头尾之间的字符串。

论坛徽章:
4
狮子座
日期:2014-04-17 10:45:47双鱼座
日期:2014-08-21 17:16:41处女座
日期:2014-08-26 13:46:46水瓶座
日期:2014-10-28 14:08:50
发表于 2014-10-20 11:23 |显示全部楼层
  1. re.findall(r'\/jobs\?viewJob=(.*)%3Aprimary',url)
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP