免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 6980 | 回复: 4
打印 上一主题 下一主题

如何用python写个查询下面网站并且得到信息的脚本? [复制链接]

论坛徽章:
8
2016科比退役纪念章
日期:2018-10-24 08:24:0115-16赛季CBA联赛之北控
日期:2019-03-12 14:34:562016科比退役纪念章
日期:2019-04-01 10:33:0915-16赛季CBA联赛之山东
日期:2019-04-17 12:46:3215-16赛季CBA联赛之广夏
日期:2019-05-09 16:40:4015-16赛季CBA联赛之广夏
日期:2019-10-10 15:33:4015-16赛季CBA联赛之辽宁
日期:2019-10-15 08:37:0615-16赛季CBA联赛之北控
日期:2021-03-30 15:53:34
1 [报告]
发表于 2019-04-23 12:52 |显示全部楼层
  1. import sys
  2. import requests
  3. from bs4 import BeautifulSoup

  4. url="http://jzsc.mohurd.gov.cn/dataservice/query/staff/list"
  5. header={"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64; rv:34.0) Gecko/20100101 Firefox/34.0"}

  6. def getRegNum(name="张三"):
  7.     formdata={"ry_type":"",
  8.         "ry_reg_type":"",
  9.         "ry_name":"",
  10.         "reg_seal_code":"",
  11.         "ry_cardno":"",
  12.         "ry_qymc":"",
  13.         "complexname":name
  14.         }
  15.     r = requests.post(url,formdata,headers=header)
  16.     s = BeautifulSoup(r.text,"lxml")
  17.     for td in s.find_all("td",attrs={"data-header":"注册号(执业印章号)"}):
  18.         print(td.get_text().strip())

  19. def main():
  20.     if len(sys.argv)==1:
  21.         getRegNum()
  22.     elif len(sys.argv)==2:
  23.         getRegNum(sys.argv[1])
  24.     else:
  25.         print("useage: {} [name]".format(sys.argv[0]))

  26. if __name__ == '__main__':
  27.     main()
复制代码

  1. python test.py
  2. 津112060903926
  3. B06120001146
复制代码

评分

参与人数 1信誉积分 +5 收起 理由
萍水e相逢 + 5 赞一个!

查看全部评分

论坛徽章:
8
2016科比退役纪念章
日期:2018-10-24 08:24:0115-16赛季CBA联赛之北控
日期:2019-03-12 14:34:562016科比退役纪念章
日期:2019-04-01 10:33:0915-16赛季CBA联赛之山东
日期:2019-04-17 12:46:3215-16赛季CBA联赛之广夏
日期:2019-05-09 16:40:4015-16赛季CBA联赛之广夏
日期:2019-10-10 15:33:4015-16赛季CBA联赛之辽宁
日期:2019-10-15 08:37:0615-16赛季CBA联赛之北控
日期:2021-03-30 15:53:34
2 [报告]
发表于 2019-04-23 16:27 |显示全部楼层
缺库的问题 自己肯定能解决。
我还真不是用的vim,换行符的问题可能是论坛复制出来就这样了。
我python版本是3.6.4

论坛徽章:
8
2016科比退役纪念章
日期:2018-10-24 08:24:0115-16赛季CBA联赛之北控
日期:2019-03-12 14:34:562016科比退役纪念章
日期:2019-04-01 10:33:0915-16赛季CBA联赛之山东
日期:2019-04-17 12:46:3215-16赛季CBA联赛之广夏
日期:2019-05-09 16:40:4015-16赛季CBA联赛之广夏
日期:2019-10-10 15:33:4015-16赛季CBA联赛之辽宁
日期:2019-10-15 08:37:0615-16赛季CBA联赛之北控
日期:2021-03-30 15:53:34
3 [报告]
发表于 2019-04-24 16:49 |显示全部楼层
回复 8# xiaomm250
不会写啥高级的代码,也不会调试,只会print

论坛徽章:
8
2016科比退役纪念章
日期:2018-10-24 08:24:0115-16赛季CBA联赛之北控
日期:2019-03-12 14:34:562016科比退役纪念章
日期:2019-04-01 10:33:0915-16赛季CBA联赛之山东
日期:2019-04-17 12:46:3215-16赛季CBA联赛之广夏
日期:2019-05-09 16:40:4015-16赛季CBA联赛之广夏
日期:2019-10-10 15:33:4015-16赛季CBA联赛之辽宁
日期:2019-10-15 08:37:0615-16赛季CBA联赛之北控
日期:2021-03-30 15:53:34
4 [报告]
发表于 2019-04-25 12:48 |显示全部楼层
回复 10# xiaomm250
sys.argv是命令行运行脚本时的 命令行参数。
不带参数运行,是因为写了默认参数是张三,查的是张三的结果。
也可以带一个名字参数运行,查的就是相应的结果。
如果写再多的参数就没支持了,直接打印一句简单的用法。

其实sys.argv这种是python最基本的,既然要写就应该自己去查python手册。

论坛徽章:
8
2016科比退役纪念章
日期:2018-10-24 08:24:0115-16赛季CBA联赛之北控
日期:2019-03-12 14:34:562016科比退役纪念章
日期:2019-04-01 10:33:0915-16赛季CBA联赛之山东
日期:2019-04-17 12:46:3215-16赛季CBA联赛之广夏
日期:2019-05-09 16:40:4015-16赛季CBA联赛之广夏
日期:2019-10-10 15:33:4015-16赛季CBA联赛之辽宁
日期:2019-10-15 08:37:0615-16赛季CBA联赛之北控
日期:2021-03-30 15:53:34
5 [报告]
发表于 2019-04-25 13:23 |显示全部楼层
回复 13# 萍水e相逢

哈哈 全国同名的人太多了,据说全国叫张伟的人有近30万人,我用张伟查了一下也有15条,难道你也叫张伟
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP