文件中的内容中英文混杂,如何一个字一个字地处理?
比如:a我美女是
b c
d e
f g
h i
j k
l m
n o
pqrst
python如何读,才能先读出a,再读出我,再读出美。。。。
for i in ...... 本帖最后由 linlone 于 2017-05-25 15:10 编辑
回复 2# haooooaaa
回复 2# haooooaaa
$ cat ./t.py
#! /usr/bin/env python
# -*- coding: utf-8 -*-
import re
with open('test.txt') as fp:
for line in fp:
for one in line:
print one
$ cat test.txt
a我美女是
b c
d e
f g
h i
j k
l m
n o
pqrst
$ xxd test.txt
0000000: 61e6 8891 e7be 8ee5 a5b3 e698 af0a 0962a..............b
0000010: 2063 0a09 0964 2065 0a09 0909 6620 670a c...d e....f g.
0000020: 0968 2069 0a09 096a 206b 0a09 6c20 6d0a.h i...j k..l m.
0000030: 0909 6e20 6f0a 7071 7273 740a ..n o.pqrst.
$ ./t.py | xxd
0000000: 610a e60a 880a 910a e70a be0a 8e0a e50aa...............
0000010: a50a b30a e60a 980a af0a 0a0a 090a 620a..............b.
0000020: 200a 630a 0a0a 090a 090a 640a 200a 650a .c.......d. .e.
0000030: 0a0a 090a 090a 090a 660a 200a 670a 0a0a........f. .g...
0000040: 090a 680a 200a 690a 0a0a 090a 090a 6a0a..h. .i.......j.
0000050: 200a 6b0a 0a0a 090a 6c0a 200a 6d0a 0a0a .k.....l. .m...
0000060: 090a 090a 6e0a 200a 6f0a 0a0a 700a 710a....n. .o...p.q.
0000070: 720a 730a 740a 0a0a r.s.t...
for in 实际读取的一个字节一个字节,如何解决呢?
本帖最后由 linlone 于 2017-05-25 15:10 编辑
回复 2# haooooaaa
回复 4# linlone
搞定:$ cat ./t.py
#! /usr/bin/env python
# -*- coding: utf-8 -*-
import re
with open('test.txt') as fp:
for line in fp:
for z in line.decode('utf-8'):
print(z.encode('utf-8'))
$ cat test.txt
a我美女是
b c
$ ./t.py
a
我
美
女
是
b
c
页:
[1]