免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 2920 | 回复: 15
打印 上一主题 下一主题

文本匹配和比较 [复制链接]

论坛徽章:
8
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015小元宵徽章
日期:2015-03-06 15:58:18每日论坛发贴之星
日期:2015-06-08 22:20:00每日论坛发贴之星
日期:2015-06-08 22:20:00操作系统版块每日发帖之星
日期:2015-06-14 22:20:00数据库技术版块每日发帖之星
日期:2015-11-09 06:20:00数据库技术版块每日发帖之星
日期:2016-02-22 06:20:0015-16赛季CBA联赛之上海
日期:2017-01-01 23:58:53
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2016-11-23 20:25 |只看该作者 |倒序浏览
本帖最后由 zl624867243 于 2016-11-23 20:31 编辑

原始文件如下:
  1. place|qc_app_place_release|pre
  2. sms|qc_app_v1.0_dev_xxg_1121|pre
  3. stadium|qc_app_v1.0_dev|pre
  4. scheduler|qc_app_v1.0_dev|pre


  5. ########################################
  6. place|qc_app_place_release|prod
  7. sms|qc_app_v1.0_dev_xxg_1121|prod
  8. stadium|qc_app_v1.1_dev|prod
复制代码
说明: place是项目名字,qc_app_place_release 是分支名字,pre 和prod代表生产和预发布环境


我要比较预发布和生产的分支是否相同。
想要的结果如下:
  1. place|qc_app_place_release|pre     分支相同
  2. place|qc_app_place_release|prod
  3. ..................

  4. sms|qc_app_v1.0_dev_xxg_1121|pre  分支相同
  5. sms|qc_app_v1.0_dev_xxg_1121|prod
  6. .......................

  7. stadium|qc_app_v1.0_dev|pre       分支不同
  8. stadium|qc_app_v1.1_dev|prod

  9. ...........................
  10. scheduler|qc_app_v1.0_dev|pre    pre环境有,prod环境无







复制代码
用py实现?

论坛徽章:
30
申猴
日期:2014-04-10 09:43:532015年亚洲杯纪念徽章
日期:2015-03-20 14:40:232015亚冠之阿尔纳斯尔
日期:2015-06-02 18:59:042015亚冠之阿尔希拉尔
日期:2015-06-30 15:22:572015亚冠之大阪钢巴
日期:2015-07-20 10:44:332015亚冠之阿尔纳斯尔
日期:2015-10-28 14:57:5215-16赛季CBA联赛之新疆
日期:2015-12-25 10:18:45黑曼巴
日期:2016-06-26 21:39:5315-16赛季CBA联赛之山西
日期:2016-07-25 21:54:2715-16赛季CBA联赛之北京
日期:2016-10-27 12:07:2315-16赛季CBA联赛之八一
日期:2017-07-07 16:39:0915-16赛季CBA联赛之吉林
日期:2017-09-04 12:14:43
2 [报告]
发表于 2016-11-24 14:15 |只看该作者
回复 1# zl624867243


  1. import re
  2. with open('file.txt') as f:
  3.         t=f.read()

  4. a = []
  5. for i in re.split(r'\n\n\n#*#\n',t):
  6.         a.append(i.split('\n'))

  7. m = max(map(len,a))

  8. for i in zip(*a):
  9.         if i[0].split('|')[1] == i[1].split('|')[1]:
  10.                 print '{0:<35s}\t分支相同\n{1}\n........'.format(i[0],i[1])
  11.         else:
  12.                 print '{0:<35s}\t分支不同\n{1}\n.......'.format(i[0],i[1])


  13. for i in a:
  14.         if len(i) == 4:
  15.                 if i[m-1].split('|')[-1] == 'pre':
  16.                         print '{:<35s}pre环境有,prod环境无\n.......'.format(i[m-1])
  17.                 else:
  18.                         print '{:<35s}prod环境有,pre环境无\n.......'.format(i[m-1])
复制代码

论坛徽章:
8
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015小元宵徽章
日期:2015-03-06 15:58:18每日论坛发贴之星
日期:2015-06-08 22:20:00每日论坛发贴之星
日期:2015-06-08 22:20:00操作系统版块每日发帖之星
日期:2015-06-14 22:20:00数据库技术版块每日发帖之星
日期:2015-11-09 06:20:00数据库技术版块每日发帖之星
日期:2016-02-22 06:20:0015-16赛季CBA联赛之上海
日期:2017-01-01 23:58:53
3 [报告]
发表于 2016-11-24 23:53 |只看该作者
回复 2# zxy877298415

报错

QQ截图20161124235254.png (13.79 KB, 下载次数: 59)

QQ截图20161124235254.png

论坛徽章:
30
申猴
日期:2014-04-10 09:43:532015年亚洲杯纪念徽章
日期:2015-03-20 14:40:232015亚冠之阿尔纳斯尔
日期:2015-06-02 18:59:042015亚冠之阿尔希拉尔
日期:2015-06-30 15:22:572015亚冠之大阪钢巴
日期:2015-07-20 10:44:332015亚冠之阿尔纳斯尔
日期:2015-10-28 14:57:5215-16赛季CBA联赛之新疆
日期:2015-12-25 10:18:45黑曼巴
日期:2016-06-26 21:39:5315-16赛季CBA联赛之山西
日期:2016-07-25 21:54:2715-16赛季CBA联赛之北京
日期:2016-10-27 12:07:2315-16赛季CBA联赛之八一
日期:2017-07-07 16:39:0915-16赛季CBA联赛之吉林
日期:2017-09-04 12:14:43
4 [报告]
发表于 2016-11-25 10:10 |只看该作者
回复 3# zl624867243

估计是文本的问题,我的文本是这样的,把你的文本直接贴一下!

place|qc_app_place_release|pre
sms|qc_app_v1.0_dev_xxg_1121|pre
stadium|qc_app_v1.0_dev|pre
scheduler|qc_app_v1.0_dev|pre

########################################
place|qc_app_place_release|prod
sms|qc_app_v1.0_dev_xxg_1121|prod
stadium|qc_app_v1.1_dev|prod

论坛徽章:
8
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015小元宵徽章
日期:2015-03-06 15:58:18每日论坛发贴之星
日期:2015-06-08 22:20:00每日论坛发贴之星
日期:2015-06-08 22:20:00操作系统版块每日发帖之星
日期:2015-06-14 22:20:00数据库技术版块每日发帖之星
日期:2015-11-09 06:20:00数据库技术版块每日发帖之星
日期:2016-02-22 06:20:0015-16赛季CBA联赛之上海
日期:2017-01-01 23:58:53
5 [报告]
发表于 2016-11-25 12:57 |只看该作者
本帖最后由 zl624867243 于 2016-11-25 12:58 编辑

回复 4# zxy877298415

你看下都上传了

QQ截图20161125125638.png (14.88 KB, 下载次数: 67)

QQ截图20161125125638.png

Downloads.zip

708 Bytes, 下载次数: 14

论坛徽章:
30
申猴
日期:2014-04-10 09:43:532015年亚洲杯纪念徽章
日期:2015-03-20 14:40:232015亚冠之阿尔纳斯尔
日期:2015-06-02 18:59:042015亚冠之阿尔希拉尔
日期:2015-06-30 15:22:572015亚冠之大阪钢巴
日期:2015-07-20 10:44:332015亚冠之阿尔纳斯尔
日期:2015-10-28 14:57:5215-16赛季CBA联赛之新疆
日期:2015-12-25 10:18:45黑曼巴
日期:2016-06-26 21:39:5315-16赛季CBA联赛之山西
日期:2016-07-25 21:54:2715-16赛季CBA联赛之北京
日期:2016-10-27 12:07:2315-16赛季CBA联赛之八一
日期:2017-07-07 16:39:0915-16赛季CBA联赛之吉林
日期:2017-09-04 12:14:43
6 [报告]
发表于 2016-11-25 14:40 |只看该作者
回复 5# zl624867243

用这个吧,应该没问题了!
  1. import re
  2. with open('file.txt') as f:
  3.         t=f.read()


  4. a = []
  5. for i in re.split(r'\n\n#*#\n',t):
  6.         a.append(i.split('\n'))


  7. for i in zip(*a):
  8.         if i[0] and  i[1]:
  9.                 if i[0].split('|')[1] == i[1].split('|')[1]:
  10.                         print '{0:<35s}\t分支相同\n{1}\n........'.format(i[0],i[1])
  11.                 else:
  12.                         print '{0:<35s}\t分支不同\n{1}\n.......'.format(i[0],i[1])
  13.         elif not i[1]:
  14.                 print '{:<35s}pre环境有,prod环境无\n.......'.format(i[0])
  15.         elif not i[0]:
  16.                 print '{:<35s}prod环境有,pre环境无\n.......'.format(i[i])
复制代码

论坛徽章:
8
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015小元宵徽章
日期:2015-03-06 15:58:18每日论坛发贴之星
日期:2015-06-08 22:20:00每日论坛发贴之星
日期:2015-06-08 22:20:00操作系统版块每日发帖之星
日期:2015-06-14 22:20:00数据库技术版块每日发帖之星
日期:2015-11-09 06:20:00数据库技术版块每日发帖之星
日期:2016-02-22 06:20:0015-16赛季CBA联赛之上海
日期:2017-01-01 23:58:53
7 [报告]
发表于 2016-11-25 16:24 |只看该作者
回复 6# zxy877298415

可能你那脚本还要改下:
  1. place|qc_app_place_release|pre
  2. sms|qc_app_v1.0_dev_xxg_1121|pre
  3. stadium|qc_app_v1.0_dev|pre

  4. scheduler|qc_app_v1.0_dev|pre

  5. ########################################
  6. place|qc_app_place_release|prod
  7. sms|qc_app_v1.0_dev_xxg_1121|prod
  8. stadium|qc_app_v1.1_dev|prod
复制代码
file.txt如上。
结果:

55.png (15.87 KB, 下载次数: 62)

55.png

论坛徽章:
8
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015小元宵徽章
日期:2015-03-06 15:58:18每日论坛发贴之星
日期:2015-06-08 22:20:00每日论坛发贴之星
日期:2015-06-08 22:20:00操作系统版块每日发帖之星
日期:2015-06-14 22:20:00数据库技术版块每日发帖之星
日期:2015-11-09 06:20:00数据库技术版块每日发帖之星
日期:2016-02-22 06:20:0015-16赛季CBA联赛之上海
日期:2017-01-01 23:58:53
8 [报告]
发表于 2016-11-25 16:59 |只看该作者
回复 2# zxy877298415

就按你的方式写,在pre里再加一条数据就出不来了
file.txt
  1. place|qc_app_place_release|pre
  2. sms|qc_app_v1.0_dev_xxg_1121|pre
  3. stadium|qc_app_v1.0_dev|pre
  4. scheduler|qc_app_v1.0_dev|pre
  5. remoteMiddleware|qc_app_v1.0_dev|pre

  6. ########################################
  7. place|qc_app_place_release|prod
  8. sms|qc_app_v1.0_dev_xxg_1121|prod
  9. stadium|qc_app_v1.1_dev|prod
复制代码


QQ截图20161125165815.png (34.07 KB, 下载次数: 64)

QQ截图20161125165815.png

论坛徽章:
30
申猴
日期:2014-04-10 09:43:532015年亚洲杯纪念徽章
日期:2015-03-20 14:40:232015亚冠之阿尔纳斯尔
日期:2015-06-02 18:59:042015亚冠之阿尔希拉尔
日期:2015-06-30 15:22:572015亚冠之大阪钢巴
日期:2015-07-20 10:44:332015亚冠之阿尔纳斯尔
日期:2015-10-28 14:57:5215-16赛季CBA联赛之新疆
日期:2015-12-25 10:18:45黑曼巴
日期:2016-06-26 21:39:5315-16赛季CBA联赛之山西
日期:2016-07-25 21:54:2715-16赛季CBA联赛之北京
日期:2016-10-27 12:07:2315-16赛季CBA联赛之八一
日期:2017-07-07 16:39:0915-16赛季CBA联赛之吉林
日期:2017-09-04 12:14:43
9 [报告]
发表于 2016-11-27 23:48 |只看该作者
本帖最后由 zxy877298415 于 2016-11-28 10:20 编辑

  1. <p> </p>
复制代码
  1. import re
  2. with open('file.txt') as f:
  3.         t=f.read()

  4. a = []
  5. for n,i in enumerate(re.split(r'\n#*#\n',re.sub('\n*\n','\n',t))):
  6.         m = re.subn(r'\n','\n',i)[1]+1
  7.         if n == 0:
  8.                 m1 = m
  9.                 n1 = n
  10.         elif m1 > m:
  11.                  m1 = m
  12.                  n1 = n
  13.         a.append(i.split('\n'))

  14. m2=max(map(len,a))

  15. for i in range(0,m2-m1):
  16.         a[n1].append('')

  17. for i in zip(*a):
  18.         if i[0] and  i[1]:
  19.                 if i[0].split('|')[1] == i[1].split('|')[1]:
  20.                         print '{0:<40s}\t分支相同\n{1}\n........'.format(i[0],i[1])
  21.                 else:
  22.                         print '{0:<40s}\t分支不同\n{1}\n.......'.format(i[0],i[1])
  23.         elif not i[1]:
  24.                 print '{:<40s}pre环境有,prod环境无\n.......'.format(i[0])
  25.         elif not i[0]:
  26.                 print '{:<40s}prod环境有,pre环境无\n.......'.format(i[1])
复制代码

论坛徽章:
8
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015小元宵徽章
日期:2015-03-06 15:58:18每日论坛发贴之星
日期:2015-06-08 22:20:00每日论坛发贴之星
日期:2015-06-08 22:20:00操作系统版块每日发帖之星
日期:2015-06-14 22:20:00数据库技术版块每日发帖之星
日期:2015-11-09 06:20:00数据库技术版块每日发帖之星
日期:2016-02-22 06:20:0015-16赛季CBA联赛之上海
日期:2017-01-01 23:58:53
10 [报告]
发表于 2016-11-28 21:52 |只看该作者
回复 9# zxy877298415

这下可以了 幸苦了
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP