免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2190 | 回复: 1
打印 上一主题 下一主题

请教一下if语句的逻辑问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2016-03-05 22:10 |只看该作者 |倒序浏览
本帖最后由 奔跑的糖葫芦 于 2016-03-05 22:15 编辑

想做一个输入网址就能下载这个页面里的所有图片的东西。自己水平不高,也是网上搜索了很久。不知道这样可行不可行。
我是想做豆瓣和百度的图片下载。好像这俩网站的jpg格式不一样,所以准备根据两个网站图片名称的不同弄两个函数来匹配。然后在调用下载。目前只是先把jpg格式的链接取出来。
为了方便,就想利用if判断要选择哪一个网站,接着调用这个网站的正则匹配。
现在先测试的是豆瓣的,还没有写完。测试运行的时候发现提示很不对。我觉得可能是我逻辑上没有想清楚。所以导致的这种情况。但自己也不明白是哪里出问题了。
所以贴上代码,虚心请教一下。请各位大神指点!


----------------------------------------------------

这里是源代码
  1. import re
  2. import urllib
  3. #调用模块

  4. def getHtml(url):
  5.     page = urllib.urlopen(url)
  6.     html = page.read()
  7.     return html
  8. #创建函数getHtml,作用是获取到页面的字符数据

  9. def getImg(html):
  10.     reg = r'src="(.+?\.jpg)"'
  11.     imgre = re.compile(reg)
  12.     imglist = re.findall(imgre,html)
  13.     return imglist      
  14. #创建函数getImg,作用是通过正则表达式来匹配结尾是.jpg的字符串。这个函数匹配的是豆瓣网站的JPG

  15. site = raw_input("想要下载哪个网站的图片?\n1.豆瓣\n2.百度\n请输入序号:")
  16. print site

  17. if site == 1:
  18.     wangzhi = raw_input("请输入你想获取的信息的URL(需要输入http或者https):")
  19.     #指定要获取的网址
  20.     html = getHtml(wangzhi)
  21.     print getImg(html)
  22.     #打印出正则表达式匹配过后的字符
  23. elif site == 2:
  24.     print "百度的正则表达式还没有提取出来"
  25. else:
  26.     print "hahaha....没有了。"
复制代码
-----------------------------------------------
这里是运行之后的提示:

>>>
想要下载哪个网站的图片?
1.豆瓣
2.百度
请输入序号:1
1
hahaha....没有了。
>>>


以上就是问题所在。请帮助一下。谢谢~

论坛徽章:
84
每日论坛发贴之星
日期:2015-12-29 06:20:00每日论坛发贴之星
日期:2016-01-16 06:20:00每周论坛发贴之星
日期:2016-01-17 22:22:00程序设计版块每日发帖之星
日期:2016-01-20 06:20:00每日论坛发贴之星
日期:2016-01-20 06:20:00程序设计版块每日发帖之星
日期:2016-01-21 06:20:00每日论坛发贴之星
日期:2016-01-21 06:20:00程序设计版块每日发帖之星
日期:2016-01-23 06:20:00程序设计版块每日发帖之星
日期:2016-01-31 06:20:00数据库技术版块每日发帖之星
日期:2016-01-16 06:20:00程序设计版块每日发帖之星
日期:2016-01-16 06:20:00程序设计版块每日发帖之星
日期:2016-01-14 06:20:00
2 [报告]
发表于 2016-03-10 18:26 |只看该作者
读进来的是字符串  site == "1"
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP