免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3830 | 回复: 3
打印 上一主题 下一主题

python gzip MemoryError 问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-10-14 15:57 |只看该作者 |倒序浏览
coinlogroot = r'd:\test.log.gz'
f = gzip.open(coinlogroot, 'rb')
报错:
  File "C:\Python25\lib\gzip.py", line 297, in _add_read_data
    self.extrabuf = self.extrabuf + data
MemoryError
这个文件有好几个G。

论坛徽章:
0
2 [报告]
发表于 2010-10-14 16:00 |只看该作者
我以前写的代码,你如果是要做gzip检测可以用到它
  1. #coding:utf-8


  2. import urllib2
  3. import StringIO,gzip,re
  4. from time import ctime

  5. MANZZBD_PPURLGF = 'http://.+?\..+?\..+'
  6. URLXFPE_RAWORDV = "http://"
  7. WORSPA_SOZGVERT = "http://www."
  8. urlroot=urllib2.HTTPHandler(debuglevel=1)
  9. opener = urllib2.build_opener(urlroot)


  10. class VaurlpathzxcrError(BaseException) : pass
  11. class MrhandirzkanrError(VaurlpathzxcrError) : pass



  12. class URLrOotavrManroot:
  13.    
  14.      def __init__(self,lower):
  15.      
  16.          self.lower = lower
  17.          self.pack  = False
  18.          self.data  = False
  19.          self.cgix  = False
  20.          self.inurlSpcltGagdg()
  21.          self.sooRrootManseek()
  22.          self.vuiBichuHworldn()
  23.       


  24.    #发送gzip压缩请求
  25.      def inurlSpcltGagdg(self):
  26.          valchar = urllib2.Request(self.lower,
  27.                 headers={'Accept-encoding':'gzip'})
  28.          self.cgix = opener.open(valchar).read()
  29.       


  30.    #解压gzip文件
  31.      def sooRrootManseek(self):
  32.          self.pack = self.cgix
  33.          passdir = StringIO.StringIO(self.pack)
  34.          gzipper = gzip.GzipFile(fileobj=passdir)
  35.          self.data = gzipper.read()


  36.    #压缩前后进行对比
  37.      def vuiBichuHworldn(self):
  38.          if len(self.data) is len(self.cgix):
  39.             raise VaurlpathzxcrError("Don't support the link")
  40.          else:
  41.             print "The current time %s" % ctime()



  42.                                                                                           
  43. class URLcossNoruermoher:
  44.      def __init__(self,hasrrt):
  45.         if   not WORSPA_SOZGVERT in hasrrt:
  46.              hasrrt = WORSPA_SOZGVERT + hasrrt
  47.         if   not URLXFPE_RAWORDV in hasrrt:
  48.              hasrrt = URLXFPE_RAWORDV + hasrrt
  49.         if   re.findall(MANZZBD_PPURLGF,hasrrt):
  50.              self.seek = URLrOotavrManroot(hasrrt)
  51.         else:
  52.              raise MrhandirzkanrError('url requirements specification')
  53.       
  54.    

  55. def main():
  56.      URLcossNoruermoher('http://www.gov.cn/')


  57. if __name__=="__main__":
  58.      main()

  59.    
  60.          
复制代码

论坛徽章:
0
3 [报告]
发表于 2010-10-14 16:04 |只看该作者
谢谢了,我就是想解压本地的一个日志文件了,没有那么复杂。

论坛徽章:
0
4 [报告]
发表于 2010-10-15 09:43 |只看该作者
自己顶一下
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP