免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1974 | 回复: 0
打印 上一主题 下一主题

python多线程抓新浪天气的代码 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-03-05 14:01 |只看该作者 |倒序浏览

                               
               
                # -*- coding: utf-8 -*-
import os,sys,time,re
from threading import Thread
class DownloadWeather(Thread):
    def __init__(self, path, url, num_of_workers=5, timeout = 2):
        Thread.__init__(self)
        self.path = path
        self.url = url
        #self.city = city
    def run(self):
        #use command "curl" download data from sina.com.cn
        os.popen("/usr/local/bin/curl --limit-rate 200k --compressed -s -o %s -e %s" % (self.path, self.url))
time1=time.time()
f = open("/var/www/weather/city.txt")
for city in f.readlines():
    city=city.strip()
    wtime=str(time.time())[:10]
    path='/var/www/weather/data/' + city
    url='http://weather.sina.com.cn http://php.weather.sina.com.cn/js2.php?city=' +city+ '&time=' +wtime
    # an instance of class DownloadWeather
    mydownload=DownloadWeather(path,url)
    #mydownload=DownloadWeather(path,city,wtime)
    mydownload.setDaemon(1)
    mydownload.start()
mydownload.join()
f.close()
print (time.time() - time1)
读出/var/www/weather/city.txt的文件,里面一行是一个城市的名称,也是从天气页面下载的,注意,这个文件必须是gb2312编码的,不然无法curl正确的数据,只是因为url编码的问题。
               
               

本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u/8111/showart_489836.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP