免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1135 | 回复: 3
打印 上一主题 下一主题

新人求教 [复制链接]

论坛徽章:
2
2015年亚洲杯之沙特阿拉伯
日期:2015-03-27 17:28:472015年亚洲杯之韩国
日期:2015-03-27 22:34:22
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2016-09-10 21:28 |只看该作者 |倒序浏览
向各位大神请教一个排序问题!
文本包含3列,tab分隔

A1    X    XX “X1”; XXX "XX1";
A1    Y    YY “YY”; YYY "YYY"; Y_N "1"; E
A1    Y   YY “YY”; YYY "YYY"; Y_N "3"; E
A1    Y    YY “YY”; YYY "YYY"; Y_N "2"; E
A1    Z    ZZ "ZZ"; ZZZ "ZZZ";
A1    X    XX “X2”; XXX "XX2";
A1    Y   YY “YY”; YYY "YYY"; Y_N "3"; E
A1    Z    ZZ "ZZ"; ZZZ "ZZZ";
A1    Y    YY “YY”; YYY "YYY"; Y_N "2"; E
A1    Y    YY “YY”; YYY "YYY"; Y_N "1"; E
A1    Y    YY “YY”; YYY "YYY"; Y_N "4"; E
B1    X    XX “X4”; XXX "XX4";
B1    Z    ZZ "ZZ"; ZZZ "ZZZ";
B1    Y    YY “YY”; YYY "YYY"; Y_N "2"; E
B1    Y    YY “YY”; YYY "YYY"; Y_N "1"; E



我想把第2列按X Z Y 排序,同时Y的几行按照最后的数字进行排序。
每次X第一次出现后,下跟的几行数目不定,到下一个X出现,最后仍按照现在的模式输出如下,还请大神指点!
A1    X    XX “X1”; XXX "XX1";
A1    Z    ZZ "ZZ"; ZZZ "ZZZ";
A1    Y    YY “YY”; YYY "YYY"; Y_N "1"; E
A1    Y    YY “YY”; YYY "YYY"; Y_N "2"; E
A1    Y   YY “YY”; YYY "YYY"; Y_N "3"; E
A1    X    XX “X2”; XXX "XX2";
A1    Z    ZZ "ZZ"; ZZZ "ZZZ";
A1    Y    YY “YY”; YYY "YYY"; Y_N "1"; E
A1    Y    YY “YY”; YYY "YYY"; Y_N "2"; E
A1    Y   YY “YY”; YYY "YYY"; Y_N "3"; E
A1    Y    YY “YY”; YYY "YYY"; Y_N "4"; E
B1    X    XX “X”; XXX "XX";
B1    Z    ZZ "ZZ"; ZZZ "ZZZ";
B1    Y    YY “YY”; YYY "YYY"; Y_N "1"; E
B1    Y    YY “YY”; YYY "YYY"; Y_N "2"; E



论坛徽章:
54
2015亚冠之德黑兰石油
日期:2015-07-07 13:00:1615-16赛季CBA联赛之深圳
日期:2016-03-31 09:03:5415-16赛季CBA联赛之辽宁
日期:2016-05-09 20:38:15程序设计版块每日发帖之星
日期:2016-05-12 06:20:0015-16赛季CBA联赛之四川
日期:2016-05-13 15:19:4715-16赛季CBA联赛之福建
日期:2016-05-15 20:24:34每日论坛发贴之星
日期:2016-05-16 06:20:0015-16赛季CBA联赛之吉林
日期:2016-05-26 11:49:4715-16赛季CBA联赛之广东
日期:2016-05-26 13:49:18极客徽章
日期:2016-12-07 14:05:2315-16赛季CBA联赛之广夏
日期:2016-12-20 17:33:532017金鸡报晓
日期:2017-01-10 15:19:56
2 [报告]
发表于 2016-09-12 11:05 |只看该作者
  1. m = {"Y":[], "Z":[]}

  2. def pp(n):
  3.     for j in sorted(n):
  4.         print j
  5.         n.remove(j)

  6. with open("tt") as f:
  7.     for i in f:
  8.         tmp = i.split("\t")
  9.         if tmp[1] == "X":
  10.             if len(m["Y"]):
  11.                 pp(m["Z"])
  12.                 pp(m["Y"])
  13.             print i.strip()
  14.         else:
  15.             m[tmp[1]].append(i.strip())

  16.     pp(m["Z"])
  17.     pp(m["Y"])
复制代码

论坛徽章:
30
申猴
日期:2014-04-10 09:43:532015年亚洲杯纪念徽章
日期:2015-03-20 14:40:232015亚冠之阿尔纳斯尔
日期:2015-06-02 18:59:042015亚冠之阿尔希拉尔
日期:2015-06-30 15:22:572015亚冠之大阪钢巴
日期:2015-07-20 10:44:332015亚冠之阿尔纳斯尔
日期:2015-10-28 14:57:5215-16赛季CBA联赛之新疆
日期:2015-12-25 10:18:45黑曼巴
日期:2016-06-26 21:39:5315-16赛季CBA联赛之山西
日期:2016-07-25 21:54:2715-16赛季CBA联赛之北京
日期:2016-10-27 12:07:2315-16赛季CBA联赛之八一
日期:2017-07-07 16:39:0915-16赛季CBA联赛之吉林
日期:2017-09-04 12:14:43
3 [报告]
发表于 2016-09-12 11:15 |只看该作者
回复 1# tingshuibanxia


  1. a={}
  2. b={}
  3. c=[]
  4. import re
  5. with open('file.txt','r') as f:
  6.         for l in f:
  7.                 if re.search(r' +X +',l):
  8.                         a.setdefault(l,[])
  9.                         b.setdefault(l,[])
  10.                         c.append(l)
  11.                         s = l
  12.                 elif re.search(r' +Y +',l):
  13.                         a[s].append(l)
  14.                 elif re.search(r' +Z +',l):
  15.                         b[s].append(l)

  16. for i in sorted(c,key=lambda x:int(re.search(r'(?<=X)\d+',x).group(0))):
  17.         print i,"".join(b[i]),"".join(sorted(a[i],key=lambda x:int(re.search(r'(?<=\")\d+(?=\")',x).group(0)))),
复制代码

论坛徽章:
95
程序设计版块每日发帖之星
日期:2015-09-05 06:20:00程序设计版块每日发帖之星
日期:2015-09-17 06:20:00程序设计版块每日发帖之星
日期:2015-09-18 06:20:002015亚冠之阿尔艾因
日期:2015-09-18 10:35:08月度论坛发贴之星
日期:2015-09-30 22:25:002015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39程序设计版块每日发帖之星
日期:2015-10-05 06:20:00每日论坛发贴之星
日期:2015-10-05 06:20:002015年亚冠纪念徽章
日期:2015-10-06 10:06:482015亚冠之塔什干棉农
日期:2015-10-19 19:43:35程序设计版块每日发帖之星
日期:2015-10-21 06:20:00每日论坛发贴之星
日期:2015-09-14 06:20:00
4 [报告]
发表于 2016-09-12 23:44 |只看该作者
回复 1# tingshuibanxia

  1. #!/usr/bin/env python3

  2. import sys, re

  3. def file2block(filename):
  4.     with open(filename) as file:
  5.         block = { 'X':None, 'Y':[], 'Z':[] }
  6.         for line in file:
  7.             s = re.search('\t([XYZ])\t', line).group(1)
  8.             if s == 'X':
  9.                 if block['X']:
  10.                     yield block
  11.                     block = { 'X':line, 'Y':[], 'Z':[] }
  12.                 else:
  13.                     block['X'] = line
  14.             else:
  15.                 block[s].append(line)

  16.         yield block


  17. def print_block(block):
  18.     print(block['X'], end='')

  19.     for Z in block['Z']:
  20.         print(Z, end='')

  21.     # Schwartzian transform
  22.     # Note: May not be worth it.
  23.     Ys = map(lambda r: r[0],
  24.              sorted(map(lambda s: [s, re.search('"(\d+)"', s).group(1)], block['Y']),
  25.                     key = lambda r: r[1]))

  26.     for Y in Ys:
  27.         print(Y, end='')


  28. def main():
  29.     for b in file2block(sys.argv[1]):
  30.         print_block(b)

  31. if __name__ == '__main__':
  32.     main()

复制代码

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP