免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1741 | 回复: 5

文件中的内容中英文混杂,如何一个字一个字地处理? [复制链接]

论坛徽章:
0
发表于 2017-05-25 13:55 |显示全部楼层
比如:
  1. a我美女是
  2.         b c
  3.                 d e
  4.                         f g
  5.         h i
  6.                 j k
  7.         l m
  8.                 n o
  9. pqrst
复制代码


python如何读,才能先读出a,再读出我,再读出美。。。。



论坛徽章:
54
2015亚冠之德黑兰石油
日期:2015-07-07 13:00:1615-16赛季CBA联赛之深圳
日期:2016-03-31 09:03:5415-16赛季CBA联赛之辽宁
日期:2016-05-09 20:38:15程序设计版块每日发帖之星
日期:2016-05-12 06:20:0015-16赛季CBA联赛之四川
日期:2016-05-13 15:19:4715-16赛季CBA联赛之福建
日期:2016-05-15 20:24:34每日论坛发贴之星
日期:2016-05-16 06:20:0015-16赛季CBA联赛之吉林
日期:2016-05-26 11:49:4715-16赛季CBA联赛之广东
日期:2016-05-26 13:49:18极客徽章
日期:2016-12-07 14:05:2315-16赛季CBA联赛之广夏
日期:2016-12-20 17:33:532017金鸡报晓
日期:2017-01-10 15:19:56
发表于 2017-05-25 14:20 |显示全部楼层
for i in ......

论坛徽章:
0
发表于 2017-05-25 15:06 |显示全部楼层
本帖最后由 linlone 于 2017-05-25 15:10 编辑

回复 2# haooooaaa

论坛徽章:
0
发表于 2017-05-25 15:08 |显示全部楼层
回复 2# haooooaaa

  1. $ cat ./t.py
  2. #! /usr/bin/env python  
  3. # -*- coding: utf-8 -*-  

  4. import re

  5. with open('test.txt') as fp:
  6.     for line in fp:
  7.         for one in line:
  8.             print one

  9. $ cat test.txt
  10. a我美女是
  11.         b c
  12.                 d e
  13.                         f g
  14.         h i
  15.                 j k
  16.         l m
  17.                 n o
  18. pqrst

  19. $ xxd test.txt
  20. 0000000: 61e6 8891 e7be 8ee5 a5b3 e698 af0a 0962  a..............b
  21. 0000010: 2063 0a09 0964 2065 0a09 0909 6620 670a   c...d e....f g.
  22. 0000020: 0968 2069 0a09 096a 206b 0a09 6c20 6d0a  .h i...j k..l m.
  23. 0000030: 0909 6e20 6f0a 7071 7273 740a            ..n o.pqrst.

  24. $ ./t.py | xxd
  25. 0000000: 610a e60a 880a 910a e70a be0a 8e0a e50a  a...............
  26. 0000010: a50a b30a e60a 980a af0a 0a0a 090a 620a  ..............b.
  27. 0000020: 200a 630a 0a0a 090a 090a 640a 200a 650a   .c.......d. .e.
  28. 0000030: 0a0a 090a 090a 090a 660a 200a 670a 0a0a  ........f. .g...
  29. 0000040: 090a 680a 200a 690a 0a0a 090a 090a 6a0a  ..h. .i.......j.
  30. 0000050: 200a 6b0a 0a0a 090a 6c0a 200a 6d0a 0a0a   .k.....l. .m...
  31. 0000060: 090a 090a 6e0a 200a 6f0a 0a0a 700a 710a  ....n. .o...p.q.
  32. 0000070: 720a 730a 740a 0a0a                      r.s.t...
复制代码


for in 实际读取的一个字节一个字节,如何解决呢?

论坛徽章:
0
发表于 2017-05-25 15:08 |显示全部楼层
本帖最后由 linlone 于 2017-05-25 15:10 编辑

回复 2# haooooaaa


论坛徽章:
0
发表于 2017-05-25 16:19 |显示全部楼层
回复 4# linlone

搞定:
  1. $ cat ./t.py
  2. #! /usr/bin/env python  
  3. # -*- coding: utf-8 -*-  

  4. import re

  5. with open('test.txt') as fp:
  6.     for line in fp:
  7.         for z in line.decode('utf-8'):
  8.             print(z.encode('utf-8'))

  9. $ cat test.txt
  10. a我美女是
  11.     b c

  12. $ ./t.py
  13. a





  14. b

  15. c
复制代码


您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

SACC2019中国系统架构师大会

【数字转型 架构演进】SACC2019中国系统架构师大会,8.5折限时优惠重磅来袭!
2019年10月31日~11月2日第11届中国系统架构师大会(SACC2019)将在北京隆重召开。四大主线并行的演讲模式,1个主会场、20个技术专场、超千人参与的会议规模,100+来自互联网、金融、制造业、电商等领域的嘉宾阵容,将为广大参会者提供一场最具价值的技术交流盛会。

限时8.5折扣期:2019年9月30日前


----------------------------------------

大会官网>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP