#!/usr/bin/env python import sys import urllib import htmlparser class CustomParser(htmlparser.htmlparser): selected = ('table', 'h1', 'font', 'ul', 'li', 'tr', 'td', 'a') def reset(self): htmlparser.htmlparser.reset(self) self._level_stack = [] def handle_starttag(self, tag, attrs): if tag in CustomParser.selected: self._level_stack.append(...
python 是由 Guido van Rossum 开发的、可免费获得的、非常高级的解释型语言。其语法简单易懂,而其面向对象的语义功能强大(但又灵活)。python 可以广泛使用并具有高度的可移植性。 字符串 -- 不可改变的序列 如同大多数高级编程语言一样,变长字符串是 python 中的基本类型。python 在“后台”分配内存以保存字符串(或其它值),程序员不必为此操心。python 还有一些其它高级语言没有的字符串处理功能。 在 python 中,字符串...
刚刚开始接触python,还没入门。 1.统计某个英文文本中共有多少个不同的单词 我写的linux命令是: sort test.txt | tr -cs 'a-zA-Z0-9' '[\n*]' | sort | uniq | wc 写的python是: import string r=file('test2.txt','r') w=file('test3.txt','w') a=r.read() s=string.maketrans(string.punctuation,' '*32) m=a.translate(s,) m=m.lower() m=m.split() c=set(m) d=list(c) d.sort() print(len(d)) 但是两个结果不一样,谁能帮我...
import org.htmlparser.Node; import org.htmlparser.NodeFilter; import org.htmlparser.Parser; import org.htmlparser.filters.TagNameFilter; import org.htmlparser.tags.TableTag; import org.htmlparser.util.NodeList; /** * * 标题: * 功能概要: * 版权: cityyouth.cn (c) 2005 * 公司:上海城市青年网 * 创建时间:2005-12-21 * 修改时间: * 修改原因: * * @author 张伟 * @version 1.0 */ public cl...
python cgi文件上传程序(修改)import cgitb cgitb.enable() import cgi, os, urllib, md5 print "Content-type: text/html" print print """ CGI File Example""" form = cgi.FieldStorage() if form.has_key('file'): fileitem = form['file'] if not fileitem.file: print "Error: not a file upload." else: print "Got file: %s" % cgi.escape(fileitem.filename) m = md5.new() ...
1.读取一个文本文件之后得到里面出现最多的关键字的代码如下: from time import time from operator import itemgetter def test(): # 取 10 个,有需要可以修改, 及定义读取的文件 test.txt iList = 10 strFileName = 'test.txt' count = {} for word in open(strFileName).read().split(): if count.has_key(word): count[word] = count[word] + 1 else: ...
windows下,我希望能处理一些文本文件 比如我希望搜索a文件夹内所有文件中231_2后面的第一个aab的部分内容,并且暂时保存 然后搜索b文件夹内所有文件的231_2后面的第一个ccx的部分内容,然后和上一个结果一起输出。。 当然我希望能一次循环玩,比如从231_1到231_111,都搞出来 或者 比如我希望搜索a文件夹内所有文件中1122333(固定格式)后面的部分内容,保存成X 然后再b文件件内所有文件夹内搜索X之后第一个ccx的内容,然后输...
import wx def load(event): file = open(filename.GetValue()) contents.SetValue(file.read()) file.close() def save(event): file = open(filename.GetValue(), 'w') file.write(contents.GetValue()) file.close() app = wx.App() win = wx.Frame(None, title="Simple Editor", size=(410, 335)) bkg = wx.Panel(win) loadButton = wx.Button(bkg, label='Open') loadButton.Bind(wx.EVT_BU...