- 论坛徽章:
- 0
|
运行每各个测试时请将"#"符号分段取消,请各为大佬看看,有啥应再修改的?
中文转码问题还米找出头绪
#定义引用的模块
import urllib.request
import os
#测试用的数据
url='http://www.baidu.com'
data='python'
data1={'wd':'python'}
data2={'wd':'python list go'}
data3={'q1':'python'}
data4={'q1':'python','q2':'','q3':'','q4':'','rn':100,'lm':1,'ct':1,'ft':'','q5':'','q6':'','tn':'baiduadv'}
#页面保存函数
def savehtm(page):
page1=page.read()
op=open('abc011.htm','wb')
op.write(page1)
op.close()
#第一种测试(只发送网址,没有查询)_____成功
#req=urllib.request.urlopen(url)
#savehtm(req)
#第二种测试(发送网址,并且进行查询)_____成功
#getstring=url+r'/s?'+urllib.parse.urlencode(data1)
#response=urllib.request.urlopen(getstring)
#savehtm(response)
#第三种测试(发送网址,并且用多关键字查询)_____成功
#getstring=url+r'/s?'+urllib.parse.urlencode(data2)
#response=urllib.request.urlopen(getstring)
#savehtm(response)
#第四种测试(发送网址,并且进行高级查询)_____成功
#getstring=url+r'/s?'+urllib.parse.urlencode(data4)
#response=urllib.request.urlopen(getstring)
#savehtm(response)
|
<td width="300">包含以下<b>全部</b>的关键词</td>
<td><input size="35" name="q1" maxlength="100"> <input value="百度一下" type="submit"></td>
是百度的源代码,找到'input'看到后面有个name="q1",知道这是要输入的内容的地方,那我就data4={'q1':'python','q2':'','q3':'','q4':'','rn':100,'lm':1,'ct':1,'ft':'','q5':'','q6':'','tn':'baiduadv'}
[ 本帖最后由 我不是老手 于 2009-5-14 18:10 编辑 ] |
|