linlone 发表于 2017-05-25 13:55

文件中的内容中英文混杂,如何一个字一个字地处理?

比如:
a我美女是
        b c
                d e
                        f g
        h i
                j k
        l m
                n o
pqrst


python如何读,才能先读出a,再读出我,再读出美。。。。



haooooaaa 发表于 2017-05-25 14:20

for i in ......

linlone 发表于 2017-05-25 15:06

本帖最后由 linlone 于 2017-05-25 15:10 编辑

回复 2# haooooaaa

linlone 发表于 2017-05-25 15:08

回复 2# haooooaaa

$ cat ./t.py
#! /usr/bin/env python
# -*- coding: utf-8 -*-

import re

with open('test.txt') as fp:
    for line in fp:
      for one in line:
            print one

$ cat test.txt
a我美女是
        b c
                d e
                        f g
        h i
                j k
        l m
                n o
pqrst

$ xxd test.txt
0000000: 61e6 8891 e7be 8ee5 a5b3 e698 af0a 0962a..............b
0000010: 2063 0a09 0964 2065 0a09 0909 6620 670a   c...d e....f g.
0000020: 0968 2069 0a09 096a 206b 0a09 6c20 6d0a.h i...j k..l m.
0000030: 0909 6e20 6f0a 7071 7273 740a            ..n o.pqrst.

$ ./t.py | xxd
0000000: 610a e60a 880a 910a e70a be0a 8e0a e50aa...............
0000010: a50a b30a e60a 980a af0a 0a0a 090a 620a..............b.
0000020: 200a 630a 0a0a 090a 090a 640a 200a 650a   .c.......d. .e.
0000030: 0a0a 090a 090a 090a 660a 200a 670a 0a0a........f. .g...
0000040: 090a 680a 200a 690a 0a0a 090a 090a 6a0a..h. .i.......j.
0000050: 200a 6b0a 0a0a 090a 6c0a 200a 6d0a 0a0a   .k.....l. .m...
0000060: 090a 090a 6e0a 200a 6f0a 0a0a 700a 710a....n. .o...p.q.
0000070: 720a 730a 740a 0a0a                      r.s.t...


for in 实际读取的一个字节一个字节,如何解决呢?

linlone 发表于 2017-05-25 15:08

本帖最后由 linlone 于 2017-05-25 15:10 编辑

回复 2# haooooaaa


linlone 发表于 2017-05-25 16:19

回复 4# linlone

搞定:$ cat ./t.py
#! /usr/bin/env python
# -*- coding: utf-8 -*-

import re

with open('test.txt') as fp:
    for line in fp:
      for z in line.decode('utf-8'):
            print(z.encode('utf-8'))

$ cat test.txt
a我美女是
    b c

$ ./t.py
a





b

c


页: [1]
查看完整版本: 文件中的内容中英文混杂,如何一个字一个字地处理?