ChinaUnix.net
相关文章推荐:

python HTMLParser 纯文本

今天遇到一个问题,从网上查到的7天连锁酒店北京分店,保存成文本后,居然编程用空格分隔的一行了。 想请教各位,怎么把它处理成每行: 店名 城市 行政区 地址 的格式? 我在vim中没想出好办法解决(只能录制宏了)。用python怎么处理呢? 谢谢! 北京劲松店 北京市 朝阳区 劲松南路5号楼 北京奥运村店 北京市 朝阳区 奥体东门安苑东里1区4号 北京国贸店 北京市 朝阳区西大望路下甸厂坡村16号(八王坟长途汽车站对...

by nickleeh - Python - 2009-01-22 12:04:46 阅读(6268) 回复(20)

相关讨论

#!/usr/bin/env python import sys import urllib import htmlparser class CustomParser(htmlparser.htmlparser): selected = ('table', 'h1', 'font', 'ul', 'li', 'tr', 'td', 'a') def reset(self): htmlparser.htmlparser.reset(self) self._level_stack = [] def handle_starttag(self, tag, attrs): if tag in CustomParser.selected: self._level_stack.append(...

by qing - Python - 2012-01-12 22:46:38 阅读(3234) 回复(4)

python 是由 Guido van Rossum 开发的、可免费获得的、非常高级的解释型语言。其语法简单易懂,而其面向对象的语义功能强大(但又灵活)。python 可以广泛使用并具有高度的可移植性。 字符串 -- 不可改变的序列 如同大多数高级编程语言一样,变长字符串是 python 中的基本类型。python 在“后台”分配内存以保存字符串(或其它值),程序员不必为此操心。python 还有一些其它高级语言没有的字符串处理功能。 在 python 中,字符串...

by linxh - Python文档中心 - 2006-09-07 00:29:32 阅读(1288) 回复(0)

刚刚开始接触python,还没入门。 1.统计某个英文文本中共有多少个不同的单词 我写的linux命令是: sort test.txt | tr -cs 'a-zA-Z0-9' '[\n*]' | sort | uniq | wc 写的python是: import string r=file('test2.txt','r') w=file('test3.txt','w') a=r.read() s=string.maketrans(string.punctuation,' '*32) m=a.translate(s,) m=m.lower() m=m.split() c=set(m) d=list(c) d.sort() print(len(d)) 但是两个结果不一样,谁能帮我...

by stoneduke - Python - 2009-01-07 10:22:08 阅读(3636) 回复(4)

import org.htmlparser.Node; import org.htmlparser.NodeFilter; import org.htmlparser.Parser; import org.htmlparser.filters.TagNameFilter; import org.htmlparser.tags.TableTag; import org.htmlparser.util.NodeList; /** * * 标题: * 功能概要: * 版权: cityyouth.cn (c) 2005 * 公司:上海城市青年网 * 创建时间:2005-12-21 * 修改时间: * 修改原因: * * @author 张伟 * @version 1.0 */ public cl...

by ztk12 - Java文档中心 - 2006-05-12 14:24:40 阅读(785) 回复(0)

python cgi文件上传程序(修改)import cgitb cgitb.enable() import cgi, os, urllib, md5 print "Content-type: text/html" print print """ CGI File Example""" form = cgi.FieldStorage() if form.has_key('file'): fileitem = form['file'] if not fileitem.file: print "Error: not a file upload." else: print "Got file: %s" % cgi.escape(fileitem.filename) m = md5.new() ...

by hkebao - Python - 2012-09-05 09:42:15 阅读(2347) 回复(1)

1.读取一个文本文件之后得到里面出现最多的关键字的代码如下: from time import time from operator import itemgetter def test(): # 取 10 个,有需要可以修改, 及定义读取的文件 test.txt iList = 10 strFileName = 'test.txt' count = {} for word in open(strFileName).read().split(): if count.has_key(word): count[word] = count[word] + 1 else: ...

by hkebao - Python文档中心 - 2009-03-06 12:45:08 阅读(1788) 回复(0)

windows下,我希望能处理一些文本文件 比如我希望搜索a文件夹内所有文件中231_2后面的第一个aab的部分内容,并且暂时保存 然后搜索b文件夹内所有文件的231_2后面的第一个ccx的部分内容,然后和上一个结果一起输出。。 当然我希望能一次循环玩,比如从231_1到231_111,都搞出来 或者 比如我希望搜索a文件夹内所有文件中1122333(固定格式)后面的部分内容,保存成X 然后再b文件件内所有文件夹内搜索X之后第一个ccx的内容,然后输...

by dgfsdgs - Python - 2009-03-17 12:32:25 阅读(1580) 回复(3)

比如最后生成的报表要是文本文件,有没有好用的设计或比较灵活的库好用呢?

by THEBEST - Python - 2008-11-26 00:40:09 阅读(2216) 回复(0)

import wx def load(event): file = open(filename.GetValue()) contents.SetValue(file.read()) file.close() def save(event): file = open(filename.GetValue(), 'w') file.write(contents.GetValue()) file.close() app = wx.App() win = wx.Frame(None, title="Simple Editor", size=(410, 335)) bkg = wx.Panel(win) loadButton = wx.Button(bkg, label='Open') loadButton.Bind(wx.EVT_BU...

by blueycx - Python文档中心 - 2008-11-19 14:10:02 阅读(1559) 回复(0)

python中怎样从文本中识别链接? 用正泽表达式可以么

by 六轮驱动 - Python - 2006-09-06 21:58:01 阅读(4287) 回复(15)