python HTMLParser 纯文本

请教：python处理文本

今天遇到一个问题，从网上查到的7天连锁酒店北京分店，保存成文本后，居然编程用空格分隔的一行了。想请教各位，怎么把它处理成每行：店名城市行政区地址的格式？我在vim中没想出好办法解决（只能录制宏了）。用python怎么处理呢？谢谢！北京劲松店北京市朝阳区劲松南路5号楼北京奥运村店北京市朝阳区奥体东门安苑东里1区4号北京国贸店北京市朝阳区西大望路下甸厂坡村16号(八王坟长途汽车站对...

by nickleeh - Python - 2009-01-22 12:04:46 阅读（6268）回复（20）

其他文章推荐

QQ空间新浪微博腾讯微博人人网开心网豆瓣网百度空间更多

转贴一个python htmlparser的使用例子

#!/usr/bin/env python import sys import urllib import htmlparser class CustomParser(htmlparser.htmlparser): selected = ('table', 'h1', 'font', 'ul', 'li', 'tr', 'td', 'a') def reset(self): htmlparser.htmlparser.reset(self) self._level_stack = [] def handle_starttag(self, tag, attrs): if tag in CustomParser.selected: self._level_stack.append(...

by qing - Python - 2012-01-12 22:46:38 阅读（3234）回复（4）

python文本处理

python 是由 Guido van Rossum 开发的、可免费获得的、非常高级的解释型语言。其语法简单易懂，而其面向对象的语义功能强大（但又灵活）。python 可以广泛使用并具有高度的可移植性。字符串 -- 不可改变的序列如同大多数高级编程语言一样，变长字符串是 python 中的基本类型。python 在“后台”分配内存以保存字符串（或其它值），程序员不必为此操心。python 还有一些其它高级语言没有的字符串处理功能。在 python 中，字符串...

by linxh - Python文档中心 - 2006-09-07 00:29:32 阅读（1288）回复（0）

python新手求教文本统计问题

刚刚开始接触python，还没入门。 1.统计某个英文文本中共有多少个不同的单词我写的linux命令是： sort test.txt | tr -cs 'a-zA-Z0-9' '[\n*]' | sort | uniq | wc 写的python是： import string r=file('test2.txt','r') w=file('test3.txt','w') a=r.read() s=string.maketrans(string.punctuation,' '*32) m=a.translate(s,) m=m.lower() m=m.split() c=set(m) d=list(c) d.sort() print(len(d)) 但是两个结果不一样，谁能帮我...

by stoneduke - Python - 2009-01-07 10:22:08 阅读（3636）回复（4）

htmlparser例子

import org.htmlparser.Node; import org.htmlparser.NodeFilter; import org.htmlparser.Parser; import org.htmlparser.filters.TagNameFilter; import org.htmlparser.tags.TableTag; import org.htmlparser.util.NodeList; /** * * 标题: * 功能概要: * 版权: cityyouth.cn (c) 2005 * 公司:上海城市青年网 * 创建时间:2005-12-21 * 修改时间: * 修改原因： * * @author 张伟 * @version 1.0 */ public cl...

by ztk12 - Java文档中心 - 2006-05-12 14:24:40 阅读（785）回复（0）

python实现CGI获取小文本文件

python cgi文件上传程序(修改)import cgitb cgitb.enable() import cgi, os, urllib, md5 print "Content-type: text/html" print print """ CGI File Example""" form = cgi.FieldStorage() if form.has_key('file'): fileitem = form['file'] if not fileitem.file: print "Error: not a file upload." else: print "Got file: %s" % cgi.escape(fileitem.filename) m = md5.new() ...

by hkebao - Python - 2012-09-05 09:42:15 阅读（2347）回复（1）

python处理文本文件内容专题

1.读取一个文本文件之后得到里面出现最多的关键字的代码如下： from time import time from operator import itemgetter def test(): # 取 10 个，有需要可以修改, 及定义读取的文件 test.txt iList = 10 strFileName = 'test.txt' count = {} for word in open(strFileName).read().split(): if count.has_key(word): count[word] = count[word] + 1 else: ...

by hkebao - Python文档中心 - 2009-03-06 12:45:08 阅读（1788）回复（0）

想问下python处理文本方面的问题

windows下，我希望能处理一些文本文件比如我希望搜索a文件夹内所有文件中231_2后面的第一个aab的部分内容，并且暂时保存然后搜索b文件夹内所有文件的231_2后面的第一个ccx的部分内容，然后和上一个结果一起输出。。当然我希望能一次循环玩，比如从231_1到231_111，都搞出来或者比如我希望搜索a文件夹内所有文件中1122333（固定格式）后面的部分内容，保存成X 然后再b文件件内所有文件夹内搜索X之后第一个ccx的内容，然后输...

by dgfsdgs - Python - 2009-03-17 12:32:25 阅读（1580）回复（3）

python有没有文本样式的报表库？

比如最后生成的报表要是文本文件，有没有好用的设计或比较灵活的库好用呢？

by THEBEST - Python - 2008-11-26 00:40:09 阅读（2216）回复（0）

python图形编程之简单文本编辑器

import wx def load(event): file = open(filename.GetValue()) contents.SetValue(file.read()) file.close() def save(event): file = open(filename.GetValue(), 'w') file.write(contents.GetValue()) file.close() app = wx.App() win = wx.Frame(None, title="Simple Editor", size=(410, 335)) bkg = wx.Panel(win) loadButton = wx.Button(bkg, label='Open') loadButton.Bind(wx.EVT_BU...

by blueycx - Python文档中心 - 2008-11-19 14:10:02 阅读（1559）回复（0）

python中怎样从文本中识别链接？

python中怎样从文本中识别链接？用正泽表达式可以么

by 六轮驱动 - Python - 2006-09-06 21:58:01 阅读（4287）回复（15）

盛拓传媒：

IT168 | 泡泡网 | 汽车之家 | 二手车之家 | 渠道168 | ITPUB | IXPUB | ChinaUnix | 安卓之家 | 苹果园 | 家商城 | 苹果论坛

python HTMLParser 纯文本

请教：python处理文本

给UIView添加阴影

php+mysql+apache集成开发环境

关于recvfrom()

如何对shell脚本进行批量注释

Oprofile 使用指南

求助同步RAID磁盘

Qt的窗體中是否可能放入一個gtk+的窗體,作為Qt窗體的控件?

Unlocker 1.8.4

Wireshark的Pcap文件格式分析

MegaRAID Storage Manager