免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 9401 | 回复: 9
打印 上一主题 下一主题

Python 删除特定字符的行 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2016-01-02 04:29 |只看该作者 |倒序浏览
A.txt文件有10万行。

只要行中出现 gmail 或者 aol 或者 yahoo 就删除这个行。

用Python怎么写,谢谢啦!

论坛徽章:
6
程序设计版块每日发帖之星
日期:2016-01-15 06:20:00操作系统版块每日发帖之星
日期:2016-01-16 06:20:00IT运维版块每日发帖之星
日期:2016-02-04 06:20:00数据库技术版块每日发帖之星
日期:2016-02-04 06:20:00程序设计版块每日发帖之星
日期:2016-02-10 06:20:01每日论坛发贴之星
日期:2016-02-10 06:20:01
2 [报告]
发表于 2016-01-05 13:39 |只看该作者
一个非常简单但很耗资源的办法,仅供参考

import re

lines = []
f = open('A.txt')
for line in f.readlines():
     if  not re.search('gmail|aol|yahoo', line):
           lines.append(line)
f.close()

f = open('A.txt', 'w')
f.writelines(lines)
f.close()

论坛徽章:
0
3 [报告]
发表于 2016-01-08 21:55 |只看该作者
谢谢,已经足够用了。

论坛徽章:
11
2015年迎新春徽章
日期:2015-03-04 09:55:282017金鸡报晓
日期:2017-02-08 10:39:4215-16赛季CBA联赛之辽宁
日期:2016-12-15 10:24:1715-16赛季CBA联赛之佛山
日期:2016-11-30 09:04:2015-16赛季CBA联赛之江苏
日期:2016-04-29 15:56:1215-16赛季CBA联赛之同曦
日期:2016-04-12 13:21:182016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之山东
日期:2016-02-16 11:37:52每日论坛发贴之星
日期:2016-02-07 06:20:00程序设计版块每日发帖之星
日期:2016-02-07 06:20:0015-16赛季CBA联赛之新疆
日期:2018-01-09 16:25:37
4 [报告]
发表于 2016-02-05 10:56 |只看该作者
readlines()改为xreadlines()就不耗资源了

论坛徽章:
6
程序设计版块每日发帖之星
日期:2016-01-15 06:20:00操作系统版块每日发帖之星
日期:2016-01-16 06:20:00IT运维版块每日发帖之星
日期:2016-02-04 06:20:00数据库技术版块每日发帖之星
日期:2016-02-04 06:20:00程序设计版块每日发帖之星
日期:2016-02-10 06:20:01每日论坛发贴之星
日期:2016-02-10 06:20:01
5 [报告]
发表于 2016-02-07 18:34 |只看该作者
回复 4# bskay


    的确,迭代可以有效减少内存开销。
    另外推荐一种方式,那就是使用with语句来读写文件,一样可以达到控制资源消耗的目的。

论坛徽章:
0
6 [报告]
发表于 2016-02-17 14:48 |只看该作者
新人受教了

论坛徽章:
4
金牛座
日期:2013-10-11 16:12:50卯兔
日期:2014-07-31 09:17:19辰龙
日期:2014-08-08 09:28:02狮子座
日期:2014-09-14 20:32:05
7 [报告]
发表于 2016-02-18 13:56 |只看该作者
规则太简单,就不用正则表达式了。
  1. import fileinput
  2. todelete = ['gmail', 'aol', 'yahoo']
  3. with fileinput.input('A.txt', inplace = True) as f:
  4.     for line in f:
  5.         if all(string not in line for string in todelete):
  6.             print(line, end = '')
复制代码

论坛徽章:
0
8 [报告]
发表于 2016-02-19 10:47 |只看该作者
回复 7# ssfjhh


    请问您的python版本号是多少?我在2.7.3上运行这个代码会出错。

论坛徽章:
4
金牛座
日期:2013-10-11 16:12:50卯兔
日期:2014-07-31 09:17:19辰龙
日期:2014-08-08 09:28:02狮子座
日期:2014-09-14 20:32:05
9 [报告]
发表于 2016-02-19 12:03 |只看该作者
一天睡三次 发表于 2016-02-19 10:47
回复 7# ssfjhh


python3.5

论坛徽章:
8
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015小元宵徽章
日期:2015-03-06 15:58:18每日论坛发贴之星
日期:2015-06-08 22:20:00每日论坛发贴之星
日期:2015-06-08 22:20:00操作系统版块每日发帖之星
日期:2015-06-14 22:20:00数据库技术版块每日发帖之星
日期:2015-11-09 06:20:00数据库技术版块每日发帖之星
日期:2016-02-22 06:20:0015-16赛季CBA联赛之上海
日期:2017-01-01 23:58:53
10 [报告]
发表于 2016-02-19 13:41 |只看该作者
我也来一个
  1. #coding:utf-8
  2. import shutil
  3. #读取文件
  4. #print file('d:\\a.txt').read()
  5. tt = ['gmail','yahoo']

  6. with open('d:\\a.txt','r') as f:
  7.     with open ('d:\\a1.txt','w') as g:
  8.         for line in f.readlines():
  9.             if all(string not in line for string in tt) :
  10.                  g.write(line)
  11. shutil.move('d:\\a1.txt', 'd:\\a.txt')


  12.                
  13.         
  14.             
  15.             
  16.    
  17.          
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP