文件中的内容中英文混杂，如何一个字一个字地处理？

linlone 发表于 2017-05-25 13:55

比如：
a我美女是
b c
d e
f g
h i
j k
l m
n o
pqrst

python如何读，才能先读出a，再读出我，再读出美。。。。

haooooaaa 发表于 2017-05-25 14:20

for i in ......

linlone 发表于 2017-05-25 15:06

本帖最后由 linlone 于 2017-05-25 15:10 编辑

回复 2# haooooaaa

linlone 发表于 2017-05-25 15:08

回复 2# haooooaaa

$ cat ./t.py
#! /usr/bin/env python
# -*- coding: utf-8 -*-

import re

with open('test.txt') as fp:
for line in fp:
   for one in line:
         print one

$ cat test.txt
a我美女是
b c
d e
f g
h i
j k
l m
n o
pqrst

$ xxd test.txt
0000000: 61e6 8891 e7be 8ee5 a5b3 e698 af0a 0962a..............b
0000010: 2063 0a09 0964 2065 0a09 0909 6620 670a c...d e....f g.
0000020: 0968 2069 0a09 096a 206b 0a09 6c20 6d0a.h i...j k..l m.
0000030: 0909 6e20 6f0a 7071 7273 740a          ..n o.pqrst.

$ ./t.py | xxd
0000000: 610a e60a 880a 910a e70a be0a 8e0a e50aa...............
0000010: a50a b30a e60a 980a af0a 0a0a 090a 620a..............b.
0000020: 200a 630a 0a0a 090a 090a 640a 200a 650a .c.......d. .e.
0000030: 0a0a 090a 090a 090a 660a 200a 670a 0a0a........f. .g...
0000040: 090a 680a 200a 690a 0a0a 090a 090a 6a0a..h. .i.......j.
0000050: 200a 6b0a 0a0a 090a 6c0a 200a 6d0a 0a0a .k.....l. .m...
0000060: 090a 090a 6e0a 200a 6f0a 0a0a 700a 710a....n. .o...p.q.
0000070: 720a 730a 740a 0a0a                   r.s.t...

for in 实际读取的一个字节一个字节，如何解决呢？

linlone 发表于 2017-05-25 15:08

本帖最后由 linlone 于 2017-05-25 15:10 编辑

回复 2# haooooaaa

linlone 发表于 2017-05-25 16:19

回复 4# linlone

搞定：$ cat ./t.py
#! /usr/bin/env python
# -*- coding: utf-8 -*-

import re

with open('test.txt') as fp:
for line in fp:
for z in line.decode('utf-8'):
print(z.encode('utf-8'))

$ cat test.txt
a我美女是
b c

$ ./t.py
a
我
美
女
是

b

c

页: [1]

Chinaunix's Archiver

文件中的内容中英文混杂，如何一个字一个字地处理？