12 / 2 页下一页

论坛徽章:: 4

电梯直达

1楼 [收藏(0)] [报告]

发表于 2008-06-20 19:59 |只看该作者 |正序浏览

看到有人要cu自动登录的代码我这里有一个
本来是说要给瑞儿做一个cu站内短信群发的

但是发短信部分的数据包一直没时间抓自己也懒哎。。。

登录部分肯定是没问题的已经验证过因为我自己就用它登录后来下载cu的站内短信的

短信处理部分的我就不发了

这个是主体部分

import re
import time
import urlparse
from GRequest import GetUrl

class HiCu(object):
def __init__(self, user, passwd):
      self.user = user
      self.passwd = passwd
      self.Engine = GetUrl()

def Login(self):
      LoginFlg = False
      PostUrl = 'http://hi.chinaunix.net/batch.login.php?action=login'
      PostFrame = {} #用字典来保存要提交的表单
      PostFrame['username'] = 'ghostwwl'  #这里是你的用户名
      PostFrame['password'] = '***' #这里是你的密码
      PostFrame['loginsubmit'] = '登陆'  #这个是固定的抓包可以看出来

      try:
         PostDat = self.Engine.InitTable(PostFrame)
         Flag, Result = self.Engine.RequestUrl(PostUrl, PostDat)
         if Flag:
            Result = unicode(Result, 'GBK', 'ignore')
            Rlist = re.findall(u'已经成功登录站点', Result) #这个是登录成功后返回页面的特征字符串
            if Rlist:
                  LoginFlg = True
      except Exception, e:
         raise Exception("[%s] Login Error: %s" % \
            (time.strftime("%Y-%m-%d %H:%M:%S"), str(e)))
      return LoginFlg

下面是用到的一个类

#!/usr/bin/env python
#-*- coding:utf-8 -*-

#***********************************
# Author: ghostwwl
# DateTime: 2008.2
# Email: ghostwwl@gmail.com
# Note: 自动cookie支持
# Lience：MIT
#***********************************

import urllib2
import urllib
import cookielib
import types
import socket

class GetUrl(object):
'''
web url 访问类支持自动cookie 他的cookie独立于浏览器cookie
当类实例销毁的时候就没了如果需要保存自己包cookies这个对象保存下
'''
def __init__(self, proxy = None, TimeOut = 120):
      '''
      TimeOut 是请求url的超时时间注意这里用的socket的全局设置
      '''
      socket.setdefaulttimeout(TimeOut)
      self.cookies = urllib2.HTTPCookieProcessor(cookielib.CookieJar())
      self.proxy = proxy

def RequestUrl(self, url, dat = None, **headers):
      '''
      请求一个URL 并返回执行情况和结果所有请求都是post请求
      dat 是经Init_Table编码后的表单数据
      proxy 是一个http代理字符串格式为 "ip:port"
      headers 是一个需要添加的头字典
      '''
      try:
         result = False
         SockFile = None
         request = urllib2.Request(url, dat)
         request.add_header('User-Agent', 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; SV1; .NET CLR 1.1.4322)')
         request.add_header('Pragma', 'no-cache')
         request.add_header('Cache-Control', 'no-cache')
         if headers:
            #headers 是额外的请求头
            for k, v in headers.items:
                  if type(k) == types.StringType and type(v) == types.StringType:
                     request.add_header(k, v)
         if self.proxy:
            request.set_proxy(self.proxy, 'http')
         opener = urllib2.build_opener(self.cookies)
         SockFile = opener.open(request)
         ret = SockFile.read()
         if ret:
            result = True
      except Exception, e:
         ret = 'Open %s Error: %s' % (str(url), str(e))
      if SockFile:
         SockFile.close()
      return (result, ret)

def InitTable(self, inDat, TheEncode = 'GB2312'):
      '''
      需要Post请求的表单封装
      inDat 是一个Dict类型
      TheEncode 是把表单数据编码的目标编码类型
      '''
      L = []
      for k, v in inDat.items():
         v = str(v)
         v = unicode(v, 'utf-8')
         v = v.encode(TheEncode, 'ignore')
         s = str(k) + '=' + urllib.quote(v,'')
         s = s.replace('+','%20')
         L.append(s)
      return '&'.join(L)

评分

参与人数 1	可用积分 +5	收起理由
aero	+ 5	原创内容

查看全部评分

文库|博客

yishanju

白手起家

论坛徽章:: 0

20楼 [报告]

发表于 2008-06-28 20:38 |只看该作者

我的代码定写得很烂，我很自卑

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

yishanju

白手起家

论坛徽章:: 0

19楼 [报告]

发表于 2008-06-28 20:37 |只看该作者

我也过类似的程序：论坛审核提示 http://bbs.chinaunix.net/viewthr ... ;highlight=yishanju

是用来登陆Discuz论坛的。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

yishanju

白手起家

论坛徽章:: 0

18楼 [报告]

发表于 2008-06-26 18:58 |只看该作者

ghostwwl
用的是什么抓包工具
介绍一下。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

MePython

白手起家

论坛徽章:: 0

17楼 [报告]

发表于 2008-06-26 13:31 |只看该作者

暂时看不懂

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

retuor

白手起家

论坛徽章:: 0

16楼 [报告]

发表于 2008-06-24 01:17 |只看该作者

以下代码是我从 lz 的代码中挑选出来的：

#!/usr/bin/env python
#-*- coding:utf-8 -*-
import urllib, urllib2, cookielib
url='http://hi.chinaunix.net/batch.login.php?action=login'
values={'username':'华南虎', 'password':'周正龙', 'loginsubmit':'登录'}
data=urllib.urlencode(values)
fd=urllib2.urlopen(url, data)
html=fd.read()
print html

复制代码

如果要登录，只要上述几行就可以了。

这个是从用户空间进去的，但我始终无法从大门进去。就是这里：http://bbs.chinaunix.net/logging.php?action=login

始终给我 302. 这个门的 loginsubmit 不是 '登录'，而是

'提 &nbsp 交'

复制代码

.

不清楚哪里没写对。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

james.liu

家境小康

论坛徽章:: 0

15楼 [报告]

发表于 2008-06-23 13:28 |只看该作者

原帖由 ghostwwl 于 2008-6-22 14:59 发表
肯定是可以带refer的

test = GetUrl()
result, ret = test.RequestUrl("http://www.artxun.com", None, Referer = "www.baidu.com")
print ret

GET / HTTP/1.1
Accept-Encoding: identi ...

我的意思，，你1楼的代码我执行了下，没有任何错误或者正确信息。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

wangyouqi

白手起家

论坛徽章:: 0

14楼 [报告]

发表于 2008-06-23 12:01 |只看该作者

原帖由 ghostwwl 于 2008-6-22 14:59 发表
肯定是可以带refer的

test = GetUrl()
result, ret = test.RequestUrl("http://www.artxun.com", None, Referer = "www.baidu.com")
print ret

GET / HTTP/1.1
Accept-Encoding: identi ...

看到楼上在这里也发了贴了
不知解决了没有

http://bbs.chinaunix.net/thread-1165469-2-1.html
http://bbs.chinaunix.net/thread-1167738-1-1.html

[ 本帖最后由 wangyouqi 于 2008-6-26 02:39 编辑 ]

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

aero

版主

论坛徽章:: 1

13楼 [报告]

发表于 2008-06-22 20:56 |只看该作者

原帖由 ghostwwl 于 2008-6-22 11:21 发表
才看到原来楼主也是在北京也是摄影爱好
我是摄影新手啊什么时候交交偶

，纯玩的～

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

ghostwwl

小富即安

论坛徽章:: 4

12楼 [报告]

发表于 2008-06-22 14:59 |只看该作者

肯定是可以带refer的

test = GetUrl()
result, ret = test.RequestUrl("http://www.artxun.com", None, Referer = "www.baidu.com")
print ret

GET / HTTP/1.1
Accept-Encoding: identity
Host: www.artxun.com
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; SV1; .NET CLR 1.1.4322)
Connection: close
Referer: www.baidu.com
Pragma: no-cache
Cache-Control: no-cache

这个是我抓包抓的http请求包

还有就是原来代码里面for k, v in headers.items(): 写错了 items后面掉了括号

            for k, v in headers.items:
                  if type(k) == types.StringType and type(v) == types.StringType:
                     request.add_header(k, v)

改为 for k, v in headers.items():
         request.add_header(str(k), str(v))

嘿嘿

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

12 / 2 页下一页

返回列表

Chinaunix › 论坛 › 程序设计 › Python › [原创]自动登录CU

[原创]自动登录CU [复制链接]

评分

浏览过的版块