免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
论坛 程序设计 Shell 求助
最近访问板块 发新帖
查看: 1871 | 回复: 8
打印 上一主题 下一主题

[文本处理] 求助 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-04-24 00:27 |只看该作者 |倒序浏览
file1:
a
c
e
f

file2
a.c
a.e
a.f
c.e
c.f
e.f


input.file3
###c.f.123
###g.c.783
###c.e.192
###a.c.209
###a.e.345
###a.c.111
###h.f.019
###a.c.248
###a.s.347
###a.h.170
###a.b.159
###a.f.240
###e.f.126

问题1:输入文件为file1,怎么输出为file2(意即两两输出file1中元素)
问题2:输入文件为file1和file3,怎么输出file2(如果file3中$_包含任意两个file1中的元素,则输出$_)

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
2 [报告]
发表于 2015-04-24 07:14 |只看该作者
回复 1# 静女,其姝

$ awk 'function C(n){for(t=n+1;t<=NR;t++)print a[n]"."a[t]}{a[NR]=$1}END{for(n=1;n<=NR;n++)C(n)}' file1
a.c
a.e
a.f
c.e
c.f
e.f

$ awk 'function D(n, t){for(t=n+1;t<=NR;t++)d[a[n]"."a[t]]=1}FNR==NR{a[NR]=$1;N=NR;next}FNR==1{for(n=1;n<=N;n++)D(n)}{sub("^###","");sub("[.][0-9]+$","");if(d[$0])print $0}' file1 file3
c.f
c.e
a.c
a.e
a.c
a.c
a.f
e.f

   

论坛徽章:
30
申猴
日期:2014-04-10 09:43:532015年亚洲杯纪念徽章
日期:2015-03-20 14:40:232015亚冠之阿尔纳斯尔
日期:2015-06-02 18:59:042015亚冠之阿尔希拉尔
日期:2015-06-30 15:22:572015亚冠之大阪钢巴
日期:2015-07-20 10:44:332015亚冠之阿尔纳斯尔
日期:2015-10-28 14:57:5215-16赛季CBA联赛之新疆
日期:2015-12-25 10:18:45黑曼巴
日期:2016-06-26 21:39:5315-16赛季CBA联赛之山西
日期:2016-07-25 21:54:2715-16赛季CBA联赛之北京
日期:2016-10-27 12:07:2315-16赛季CBA联赛之八一
日期:2017-07-07 16:39:0915-16赛季CBA联赛之吉林
日期:2017-09-04 12:14:43
3 [报告]
发表于 2015-04-24 09:34 |只看该作者
  1. awk '{a[NR]=$0}END{for(i=1;i<=NR;i++)for(j=i+1;j<=NR;j++)print a[i],a[j]}' file1
  2. a c
  3. a e
  4. a f
  5. c e
  6. c f
  7. e f
  8. awk 'FNR==NR{a[FNR]=$0;t=FNR;next}{match($0,"###(.).(.)",b);for(i=1;i<=t;i++) {if(a[i]==b[1]||a[i]==b[2]) {s=s?s"."b[2]:b[1];++p}}if(p==2) print s;s="";p=""}' file1 file3
  9. c.f
  10. c.e
  11. a.c
  12. a.e
  13. a.c
  14. a.c
  15. a.f
  16. e.f
复制代码
回复 1# 静女,其姝


   

论坛徽章:
0
4 [报告]
发表于 2015-04-25 01:03 |只看该作者
十分感谢,好人一生顺遂
回复 3# zxy877298415


   

论坛徽章:
0
5 [报告]
发表于 2015-04-25 01:07 |只看该作者
额  发错版块了,第二个awk完全看不懂啊,本来想求perl的。不过我会努力读懂第二个awk,并且自己写出perl。昨晚用的grep -v逐步过滤

回复 3# zxy877298415


   

论坛徽章:
22
2015年亚洲杯之科威特
日期:2015-04-18 15:27:07每日论坛发贴之星
日期:2016-01-27 06:20:0015-16赛季CBA联赛之广夏
日期:2016-03-28 16:20:51程序设计版块每日发帖之星
日期:2016-04-09 06:20:00CU十四周年纪念徽章
日期:2016-05-03 09:35:1415-16赛季CBA联赛之天津
日期:2016-11-18 08:31:3115-16赛季CBA联赛之山西
日期:2016-12-07 16:29:5315-16赛季CBA联赛之八一
日期:2017-01-10 11:34:3415-16赛季CBA联赛之吉林
日期:2017-03-30 22:51:1915-16赛季CBA联赛之广夏
日期:2017-04-13 20:51:52程序设计版块每日发帖之星
日期:2016-01-27 06:20:00每日论坛发贴之星
日期:2015-12-28 06:20:00
6 [报告]
发表于 2015-04-25 01:09 |只看该作者
回复 5# 静女,其姝


    原来你也这么忙

论坛徽章:
28
2015年迎新春徽章
日期:2015-03-04 10:16:53午马
日期:2015-03-20 17:11:07亥猪
日期:2015-03-20 17:11:23戌狗
日期:2015-03-20 17:11:33酉鸡
日期:2015-03-20 17:11:47申猴
日期:2015-03-20 17:11:58未羊
日期:2015-03-20 17:12:10子鼠
日期:2015-03-20 17:12:23丑牛
日期:2015-03-20 17:12:40卯兔
日期:2015-03-20 17:12:51辰龙
日期:2015-03-20 17:13:00巳蛇
日期:2015-03-20 17:13:12
7 [报告]
发表于 2015-04-25 13:39 |只看该作者
  1. awk '{a[++i]=$0}END{for(;j++<length(a);)for(k=j;k++<length(a);)print a[j]"."a[k]}' inputfile
复制代码

论坛徽章:
28
2015年迎新春徽章
日期:2015-03-04 10:16:53午马
日期:2015-03-20 17:11:07亥猪
日期:2015-03-20 17:11:23戌狗
日期:2015-03-20 17:11:33酉鸡
日期:2015-03-20 17:11:47申猴
日期:2015-03-20 17:11:58未羊
日期:2015-03-20 17:12:10子鼠
日期:2015-03-20 17:12:23丑牛
日期:2015-03-20 17:12:40卯兔
日期:2015-03-20 17:12:51辰龙
日期:2015-03-20 17:13:00巳蛇
日期:2015-03-20 17:13:12
8 [报告]
发表于 2015-04-25 14:08 |只看该作者
  1. awk -F'[#.]+' 'NR==FNR{a[++i]=$0;next}{k=0;for(j=0;j++<length(a);){$2==a[j]?k++:1;$3==a[j]?k++:1}}k==2' inputfile1 inputfile2
复制代码
是按照楼主1楼举例的文本格式来得,如果原文本格式不太一样的话会有问题.楼主到时候可以贴出来~我再改.

论坛徽章:
0
9 [报告]
发表于 2015-04-25 14:54 |只看该作者
#/usr/bin/perl -w

use strict ;


my $IN_FILE ;
my $OUT_FILE1 ;
my $OUT_FILE2 ;
my @tmp_list ;

open $IN_FILE, '<', "file1" or die "Can't open file" ;
open $OUT_FILE1, '>', "file2";
open $OUT_FILE2, '<', "file3" or die "Can't open file" ;

while( <$IN_FILE> ) {
        chomp ;
        push @tmp_list, $_ ;
}

my $i ;
my $j ;
for( $i = 0; $i <= $#tmp_list; $i++ ) {
        for( $j = $i + 1; $j <= $#tmp_list; $j++ ) {
                while(<$OUT_FILE2>) {
                        chomp ;
                        if( $_ =~ /$tmp_list[$i].$tmp_list[$j]/ ) {
                                print "$_\n" ;               
                        }
                }
                print $OUT_FILE1 "$tmp_list[$i].$tmp_list[$j]\n" ;
        }
}

close( $IN_FILE ) ;
close( $OUT_FILE1 ) ;
close( $OUT_FILE2 ) ;
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP