免费注册	查看新帖 \|


平台论坛博客文库

› 论坛 › 程序设计 › Python › 文本匹配和比较

12 / 2 页下一页

最近访问板块

发新帖

查看: 2920 | 回复: 15

上一主题

下一主题

文本匹配和比较 [复制链接]

论坛徽章:: 8

2015年辞旧岁徽章
日期:2015-03-03 16:54:15

2015小元宵徽章
日期:2015-03-06 15:58:18

每日论坛发贴之星
日期:2015-06-08 22:20:00

每日论坛发贴之星
日期:2015-06-08 22:20:00

操作系统版块每日发帖之星
日期:2015-06-14 22:20:00

数据库技术版块每日发帖之星
日期:2015-11-09 06:20:00

数据库技术版块每日发帖之星
日期:2016-02-22 06:20:00

15-16赛季CBA联赛之上海
日期:2017-01-01 23:58:53

电梯直达

跳转到指定楼层

1楼 [收藏(0)] [报告]

发表于 2016-11-23 20:25 |只看该作者 |倒序浏览

本帖最后由 zl624867243 于 2016-11-23 20:31 编辑

原始文件如下：

place|qc_app_place_release|pre
sms|qc_app_v1.0_dev_xxg_1121|pre
stadium|qc_app_v1.0_dev|pre
scheduler|qc_app_v1.0_dev|pre
########################################
place|qc_app_place_release|prod
sms|qc_app_v1.0_dev_xxg_1121|prod
stadium|qc_app_v1.1_dev|prod

复制代码

说明: place是项目名字，qc_app_place_release 是分支名字,pre 和prod代表生产和预发布环境

我要比较预发布和生产的分支是否相同。
想要的结果如下：

place|qc_app_place_release|pre 分支相同
place|qc_app_place_release|prod
..................
sms|qc_app_v1.0_dev_xxg_1121|pre 分支相同
sms|qc_app_v1.0_dev_xxg_1121|prod
.......................
stadium|qc_app_v1.0_dev|pre 分支不同
stadium|qc_app_v1.1_dev|prod
...........................
scheduler|qc_app_v1.0_dev|pre pre环境有，prod环境无

复制代码

用py实现？

文库|博客

论坛徽章:: 30

申猴
日期:2014-04-10 09:43:53

2015年亚洲杯纪念徽章
日期:2015-03-20 14:40:23

2015亚冠之阿尔纳斯尔
日期:2015-06-02 18:59:04

2015亚冠之阿尔希拉尔
日期:2015-06-30 15:22:57

2015亚冠之大阪钢巴
日期:2015-07-20 10:44:33

2015亚冠之阿尔纳斯尔
日期:2015-10-28 14:57:52

15-16赛季CBA联赛之新疆
日期:2015-12-25 10:18:45

黑曼巴
日期:2016-06-26 21:39:53

15-16赛季CBA联赛之山西
日期:2016-07-25 21:54:27

15-16赛季CBA联赛之北京
日期:2016-10-27 12:07:23

15-16赛季CBA联赛之八一
日期:2017-07-07 16:39:09

15-16赛季CBA联赛之吉林
日期:2017-09-04 12:14:43

2楼 [报告]

发表于 2016-11-24 14:15 |只看该作者

回复 1# zl624867243

import re
with open('file.txt') as f:
t=f.read()
a = []
for i in re.split(r'\n\n\n#*#\n',t):
a.append(i.split('\n'))
m = max(map(len,a))
for i in zip(*a):
if i[0].split('|')[1] == i[1].split('|')[1]:
print '{0:<35s}\t分支相同\n{1}\n........'.format(i[0],i[1])
else:
print '{0:<35s}\t分支不同\n{1}\n.......'.format(i[0],i[1])
for i in a:
if len(i) == 4:
if i[m-1].split('|')[-1] == 'pre':
print '{:<35s}pre环境有，prod环境无\n.......'.format(i[m-1])
else:
print '{:<35s}prod环境有，pre环境无\n.......'.format(i[m-1])

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 8

2015年辞旧岁徽章
日期:2015-03-03 16:54:15

2015小元宵徽章
日期:2015-03-06 15:58:18

每日论坛发贴之星
日期:2015-06-08 22:20:00

每日论坛发贴之星
日期:2015-06-08 22:20:00

操作系统版块每日发帖之星
日期:2015-06-14 22:20:00

数据库技术版块每日发帖之星
日期:2015-11-09 06:20:00

数据库技术版块每日发帖之星
日期:2016-02-22 06:20:00

15-16赛季CBA联赛之上海
日期:2017-01-01 23:58:53

3楼 [报告]

发表于 2016-11-24 23:53 |只看该作者

回复 2# zxy877298415

报错

QQ截图20161124235254.png (13.79 KB, 下载次数: 59)

QQ截图20161124235254.png

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 30

申猴
日期:2014-04-10 09:43:53

2015年亚洲杯纪念徽章
日期:2015-03-20 14:40:23

2015亚冠之阿尔纳斯尔
日期:2015-06-02 18:59:04

2015亚冠之阿尔希拉尔
日期:2015-06-30 15:22:57

2015亚冠之大阪钢巴
日期:2015-07-20 10:44:33

2015亚冠之阿尔纳斯尔
日期:2015-10-28 14:57:52

15-16赛季CBA联赛之新疆
日期:2015-12-25 10:18:45

黑曼巴
日期:2016-06-26 21:39:53

15-16赛季CBA联赛之山西
日期:2016-07-25 21:54:27

15-16赛季CBA联赛之北京
日期:2016-10-27 12:07:23

15-16赛季CBA联赛之八一
日期:2017-07-07 16:39:09

15-16赛季CBA联赛之吉林
日期:2017-09-04 12:14:43

4楼 [报告]

发表于 2016-11-25 10:10 |只看该作者

回复 3# zl624867243

估计是文本的问题，我的文本是这样的，把你的文本直接贴一下！

place|qc_app_place_release|pre
sms|qc_app_v1.0_dev_xxg_1121|pre
stadium|qc_app_v1.0_dev|pre
scheduler|qc_app_v1.0_dev|pre

########################################
place|qc_app_place_release|prod
sms|qc_app_v1.0_dev_xxg_1121|prod
stadium|qc_app_v1.1_dev|prod

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 8

2015年辞旧岁徽章
日期:2015-03-03 16:54:15

2015小元宵徽章
日期:2015-03-06 15:58:18

每日论坛发贴之星
日期:2015-06-08 22:20:00

每日论坛发贴之星
日期:2015-06-08 22:20:00

操作系统版块每日发帖之星
日期:2015-06-14 22:20:00

数据库技术版块每日发帖之星
日期:2015-11-09 06:20:00

数据库技术版块每日发帖之星
日期:2016-02-22 06:20:00

15-16赛季CBA联赛之上海
日期:2017-01-01 23:58:53

5楼 [报告]

发表于 2016-11-25 12:57 |只看该作者

本帖最后由 zl624867243 于 2016-11-25 12:58 编辑

回复 4# zxy877298415

你看下都上传了

QQ截图20161125125638.png (14.88 KB, 下载次数: 67)

QQ截图20161125125638.png

708 Bytes, 下载次数: 14

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 30

申猴
日期:2014-04-10 09:43:53

2015年亚洲杯纪念徽章
日期:2015-03-20 14:40:23

2015亚冠之阿尔纳斯尔
日期:2015-06-02 18:59:04

2015亚冠之阿尔希拉尔
日期:2015-06-30 15:22:57

2015亚冠之大阪钢巴
日期:2015-07-20 10:44:33

2015亚冠之阿尔纳斯尔
日期:2015-10-28 14:57:52

15-16赛季CBA联赛之新疆
日期:2015-12-25 10:18:45

黑曼巴
日期:2016-06-26 21:39:53

15-16赛季CBA联赛之山西
日期:2016-07-25 21:54:27

15-16赛季CBA联赛之北京
日期:2016-10-27 12:07:23

15-16赛季CBA联赛之八一
日期:2017-07-07 16:39:09

15-16赛季CBA联赛之吉林
日期:2017-09-04 12:14:43

6楼 [报告]

发表于 2016-11-25 14:40 |只看该作者

回复 5# zl624867243

用这个吧，应该没问题了！

import re
with open('file.txt') as f:
t=f.read()
a = []
for i in re.split(r'\n\n#*#\n',t):
a.append(i.split('\n'))
for i in zip(*a):
if i[0] and i[1]:
if i[0].split('|')[1] == i[1].split('|')[1]:
print '{0:<35s}\t分支相同\n{1}\n........'.format(i[0],i[1])
else:
print '{0:<35s}\t分支不同\n{1}\n.......'.format(i[0],i[1])
elif not i[1]:
print '{:<35s}pre环境有，prod环境无\n.......'.format(i[0])
elif not i[0]:
print '{:<35s}prod环境有，pre环境无\n.......'.format(i[i])

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 8

2015年辞旧岁徽章
日期:2015-03-03 16:54:15

2015小元宵徽章
日期:2015-03-06 15:58:18

每日论坛发贴之星
日期:2015-06-08 22:20:00

每日论坛发贴之星
日期:2015-06-08 22:20:00

操作系统版块每日发帖之星
日期:2015-06-14 22:20:00

数据库技术版块每日发帖之星
日期:2015-11-09 06:20:00

数据库技术版块每日发帖之星
日期:2016-02-22 06:20:00

15-16赛季CBA联赛之上海
日期:2017-01-01 23:58:53

7楼 [报告]

发表于 2016-11-25 16:24 |只看该作者

回复 6# zxy877298415

可能你那脚本还要改下:

place|qc_app_place_release|pre
sms|qc_app_v1.0_dev_xxg_1121|pre
stadium|qc_app_v1.0_dev|pre
scheduler|qc_app_v1.0_dev|pre
########################################
place|qc_app_place_release|prod
sms|qc_app_v1.0_dev_xxg_1121|prod
stadium|qc_app_v1.1_dev|prod

复制代码

file.txt如上。
结果：

55.png (15.87 KB, 下载次数: 62)

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 8

2015年辞旧岁徽章
日期:2015-03-03 16:54:15

2015小元宵徽章
日期:2015-03-06 15:58:18

每日论坛发贴之星
日期:2015-06-08 22:20:00

每日论坛发贴之星
日期:2015-06-08 22:20:00

操作系统版块每日发帖之星
日期:2015-06-14 22:20:00

数据库技术版块每日发帖之星
日期:2015-11-09 06:20:00

数据库技术版块每日发帖之星
日期:2016-02-22 06:20:00

15-16赛季CBA联赛之上海
日期:2017-01-01 23:58:53

8楼 [报告]

发表于 2016-11-25 16:59 |只看该作者

回复 2# zxy877298415

就按你的方式写，在pre里再加一条数据就出不来了
file.txt

place|qc_app_place_release|pre
sms|qc_app_v1.0_dev_xxg_1121|pre
stadium|qc_app_v1.0_dev|pre
scheduler|qc_app_v1.0_dev|pre
remoteMiddleware|qc_app_v1.0_dev|pre
########################################
place|qc_app_place_release|prod
sms|qc_app_v1.0_dev_xxg_1121|prod
stadium|qc_app_v1.1_dev|prod

复制代码

QQ截图20161125165815.png (34.07 KB, 下载次数: 64)

QQ截图20161125165815.png

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 30

申猴
日期:2014-04-10 09:43:53

2015年亚洲杯纪念徽章
日期:2015-03-20 14:40:23

2015亚冠之阿尔纳斯尔
日期:2015-06-02 18:59:04

2015亚冠之阿尔希拉尔
日期:2015-06-30 15:22:57

2015亚冠之大阪钢巴
日期:2015-07-20 10:44:33

2015亚冠之阿尔纳斯尔
日期:2015-10-28 14:57:52

15-16赛季CBA联赛之新疆
日期:2015-12-25 10:18:45

黑曼巴
日期:2016-06-26 21:39:53

15-16赛季CBA联赛之山西
日期:2016-07-25 21:54:27

15-16赛季CBA联赛之北京
日期:2016-10-27 12:07:23

15-16赛季CBA联赛之八一
日期:2017-07-07 16:39:09

15-16赛季CBA联赛之吉林
日期:2017-09-04 12:14:43

9楼 [报告]

发表于 2016-11-27 23:48 |只看该作者

本帖最后由 zxy877298415 于 2016-11-28 10:20 编辑

<p> </p>

复制代码

import re
with open('file.txt') as f:
t=f.read()
a = []
for n,i in enumerate(re.split(r'\n#*#\n',re.sub('\n*\n','\n',t))):
m = re.subn(r'\n','\n',i)[1]+1
if n == 0:
m1 = m
n1 = n
elif m1 > m:
m1 = m
n1 = n
a.append(i.split('\n'))
m2=max(map(len,a))
for i in range(0,m2-m1):
a[n1].append('')
for i in zip(*a):
if i[0] and i[1]:
if i[0].split('|')[1] == i[1].split('|')[1]:
print '{0:<40s}\t分支相同\n{1}\n........'.format(i[0],i[1])
else:
print '{0:<40s}\t分支不同\n{1}\n.......'.format(i[0],i[1])
elif not i[1]:
print '{:<40s}pre环境有，prod环境无\n.......'.format(i[0])
elif not i[0]:
print '{:<40s}prod环境有，pre环境无\n.......'.format(i[1])

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 8

2015年辞旧岁徽章
日期:2015-03-03 16:54:15

2015小元宵徽章
日期:2015-03-06 15:58:18

每日论坛发贴之星
日期:2015-06-08 22:20:00

每日论坛发贴之星
日期:2015-06-08 22:20:00

操作系统版块每日发帖之星
日期:2015-06-14 22:20:00

数据库技术版块每日发帖之星
日期:2015-11-09 06:20:00

数据库技术版块每日发帖之星
日期:2016-02-22 06:20:00

15-16赛季CBA联赛之上海
日期:2017-01-01 23:58:53

10楼 [报告]

发表于 2016-11-28 21:52 |只看该作者

回复 9# zxy877298415

这下可以了幸苦了

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

12 / 2 页下一页

发新帖

Chinaunix › 论坛 › 程序设计 › Python › 文本匹配和比较

北京盛拓优讯信息技术有限公司. 版权所有京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号：11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员联系我们：huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP