Chinaunix

标题: python读有文件结束符的txt文本文件 [打印本页]

作者: fall_bernana    时间: 2009-11-11 16:37
标题: python读有文件结束符的txt文本文件

一直用python读文件都是文本文件。用的方法是:
lines=open('ft.txt')
但是前两天读一个几百兆的大文件的时候,遇到了奇怪的问题,觉得是内容没有读完。定位最后读到的行,用emeditor打开,发现有一个怪字符“”。编码是“\x001a”,一查,原来是文件结束符号。
一直郁闷,奇怪为啥文本文件里面有文件结束符,试了好多办法,都不行,最后经
limodou
指点,原来这种情况要当成二进制文件来读。
lines=open('ft.txt','rb')
文件内容如下:
abcdefg
两种不同情况的结果如下:
>>> f=open('ft.txt')
>>> f.read()
'abc'
>>> f=open('ft.txt','rb')
>>> f.read()
'abc\x1adefg'

本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u2/60589/showart_2091806.html




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2