免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 6109 | 回复: 13
打印 上一主题 下一主题

比较两个文本数据,如何写shell脚本 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-07-26 18:55 |只看该作者 |倒序浏览
我现在有两个文本数据,里面的数据点都是相对应的,怎么把每一行中只要有一个数据的不同(数据小数点后一位之前相等的就算是相同)就把那行提取出来?
正则表达式怎么写,用awk或sed都可以。 文件内容如下
文件1
  1.          1            78.635            36.679          4712.145            22.033             1.833
  2.          2            92.523            42.973        268449.688             0.347             1.268
  3.          3            98.147            45.522          6041.566             8.566             0.735
  4.          4           106.101            49.127        185796.875             0.495             1.449
  5.          5           130.191            60.044         28432.342             2.386             0.949
  6.          6           163.128            74.969          4051.793            14.127             0.679
  7.          7           188.413            86.427        1614997.875             0.107             1.082
  8.          8           229.744           105.155        1243784.625             0.122             0.986
  9.          9           238.396           109.075          6218.803            12.337             1.151
  10.         10           255.755           116.940         16361.922             4.598             1.128
  11.         11           268.798           122.850        7098460.500             0.039             0.988
  12.         12           287.525           131.334          3139.595            14.079             1.051
  13.         13           318.878           145.539          3524.290            12.069             0.925
  14.         14           377.822           172.242         11324.861             5.005             0.977
  15.         15           385.856           175.882        400953.938             0.226             1.019
  16.         16           412.147           187.791         33362.992             1.653             1.011
  17.         17           447.180           203.661         18153.434             2.813             1.100
复制代码
文件2
  1. 1            78.635            36.679          4712.145            22.033             1.834
  2.          2            92.523            42.973        268449.688             0.347             1.268
  3.          3            98.147            45.522          6041.564             8.566             0.735
  4.          4           106.101            49.127        185796.875             0.495             1.449
  5.          5           130.191            60.044         28432.320             2.386             0.949
  6.          6           163.128            74.969          4051.793            14.127             0.679
  7.          7           188.413            86.427        1614997.750             0.107             1.082
  8.          8           229.744           105.155        1243784.500             0.122             0.986
  9.          9           238.396           109.075          6218.830            12.337             1.151
  10.         10           255.755           116.940         16361.922             4.598             1.128
  11.         11           268.798           122.850        7098460.500             0.039             0.988
  12.         12           287.525           131.334          3139.595            14.079             1.051
  13.         13           318.878           145.539          3524.311            12.069             0.925
  14.         14           377.822           172.242         11324.861             5.005             0.977
  15.         15           385.856           175.882        400953.938             0.226             1.019
  16.         16           412.147           187.791         33362.996             1.653             1.011
  17.         17           447.180           203.661         18153.418             2.813             1.100
复制代码

论坛徽章:
0
2 [报告]
发表于 2011-07-26 21:24 |只看该作者
本帖最后由 lionfun 于 2011-07-26 21:27 编辑
  1. [root@lionf ~]# join a.txt b.txt | awk '{a="";b="";for(i=2;i<=6;i++){a=a""substr($i,1,index($i,".")+1);b=b""substr($(5+i),1,index($(5+i),".")+1)}}a!=b{print $0}' | sed 's/ /\t/6'


  2. 7 188.413 86.427 1614997.875 0.107 1.082        188.413 86.427 1614997.750 0.107 1.082
  3. 8 229.744 105.155 1243784.625 0.122 0.986       229.744 105.155 1243784.500 0.122 0.986
  4. 13 318.878 145.539 3524.290 12.069 0.925        318.878 145.539 3524.311 12.069 0.925
复制代码
回复 1# physpy

论坛徽章:
3
CU十二周年纪念徽章
日期:2013-10-24 15:41:34狮子座
日期:2014-03-27 15:44:382015年辞旧岁徽章
日期:2015-03-03 16:54:15
3 [报告]
发表于 2011-07-26 21:38 |只看该作者
菜鸟飘过

论坛徽章:
0
4 [报告]
发表于 2011-07-26 23:01 |只看该作者
回复 2# lionfun


    谢谢!!

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
5 [报告]
发表于 2011-07-26 23:13 |只看该作者
本帖最后由 yinyuemi 于 2011-07-26 23:20 编辑

回复 1# physpy
  1. $ awk 'NR==FNR{for(i=2;i<=NF;i++)a[NR,i]=substr($i,1,index($i,".")+1);b[NR]=$0;next}{l=0;for(i=2;i<=NF;i++){m=substr($i,1,index($i,".")+1);l+=(a[FNR,i]-m)};if(l!=0)print "file1: "b[FNR] RS "file2: "$0}' 1 2
  2. file1:          7           188.413            86.427        1614997.875             0.107             1.082
  3. file2:          7           188.413            86.427        1614997.750             0.107             1.082
  4. file1:          8           229.744           105.155        1243784.625             0.122             0.986
  5. file2:          8           229.744           105.155        1243784.500             0.122             0.986
  6. file1:         13           318.878           145.539          3524.290            12.069             0.925
  7. file2:         13           318.878           145.539          3524.311            12.069             0.925
复制代码

论坛徽章:
0
6 [报告]
发表于 2011-07-27 00:10 |只看该作者
本帖最后由 ywlscpl 于 2011-07-27 00:12 编辑
  1. ywlscpl@ubuntu:~$ awk 'NR==FNR{a[$1]=$0}NR>FNR{split(a[$1],m);for (i=2;i<=NF;i++) if (int($i*10)!=int(m[i]*10)) {print ARGV[1]":"a[$1]"\n"ARGV[2]":"$0;next}}' file1 file2
  2. file1:         7           188.413            86.427        1614997.875             0.107             1.082
  3. file2:         7           188.413            86.427        1614997.750             0.107             1.082
  4. file1:         8           229.744           105.155        1243784.625             0.122             0.986
  5. file2:         8           229.744           105.155        1243784.500             0.122             0.986
  6. file1:        13           318.878           145.539          3524.290            12.069             0.925
  7. file2:        13           318.878           145.539          3524.311            12.069             0.925
复制代码

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
7 [报告]
发表于 2011-07-27 07:45 |只看该作者
ywlscpl 发表于 2011-07-27 00:10



    学习学习

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
8 [报告]
发表于 2011-07-27 10:06 |只看该作者
这比对规则.....怪怪的...

3524.290 3524.311 不同(差 0.021)

3524.290 3524.221 相同(差0.069)

论坛徽章:
0
9 [报告]
发表于 2011-07-27 10:11 |只看该作者
回复 8# jason680

数据小数点后一位之前相等的就算是相同

论坛徽章:
0
10 [报告]
发表于 2011-07-27 10:14 |只看该作者
这题不是说把每一行中只要有一个数据的不同(数据小数点后一位之前相等的就算是相同)就把那行提取出来吗?可是取出这几行都是相同的呀
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP