免费注册 查看新帖 |

ChinaUnix.net

  平台 论坛 博客 文库 频道自动化运维 虚拟化 储存备份 C/C++ PHP MySQL 嵌入式 Linux系统
12下一页
最近访问板块 发新帖
查看: 1321 | 回复: 12

[文本处理] 怎么输出行首匹配到特定字符的列 [复制链接]

论坛徽章:
0
发表于 2018-12-04 15:33 |显示全部楼层
数据有很多列,其格式如下,这是其中几列:

我的目的是将列名中匹配到UVM的这一整列打印出来,即这里的$1 $3 $4 $6使用的命令是
awk '{for(i=1;i<=NF;i++)if($i~/UVM/) print $i}' file.txt
但是打印出的只有列名,没有其它的内容

edu_UVMedu_COADedu_UVMedu_UVMedu_ORedu_UVM
0.119877
0.1071205
0.060752
0.157005
0.534426
0.117144
0.9032
0.8185232
0.093014
0.856304
0.928812
0.115994
0.879704
0.2564788
0.253639
0.940341
0.931214
0.413085
0.766316
0.6743234
0.750682
0.842987
0.766848
0.584756
0.409997
0.5520001
0.851327
0.847317
0.761502
0.782867
0.852237
0.4945728
0.841365
0.8693
0.861446
0.825748
0.104299
0.0807176
0.711478
0.714096
0.072917
0.123553
0.013179
0.0152451
0.013634
0.017473
0.015521
0.013132
0.840895
0.7930055
0.794493
0.855183
0.804639
0.790851

论坛徽章:
21
程序设计版块每日发帖之星
日期:2016-05-03 06:20:0015-16赛季CBA联赛之深圳
日期:2018-06-15 14:59:3715-16赛季CBA联赛之八一
日期:2018-07-03 16:56:4615-16赛季CBA联赛之八一
日期:2018-07-05 10:34:09黑曼巴
日期:2018-07-06 15:19:5015-16赛季CBA联赛之佛山
日期:2018-08-03 13:19:3315-16赛季CBA联赛之山西
日期:2018-08-07 19:46:2315-16赛季CBA联赛之广夏
日期:2018-08-08 19:31:5015-16赛季CBA联赛之青岛
日期:2018-11-26 15:21:5015-16赛季CBA联赛之青岛
日期:2018-06-08 13:45:2815-16赛季CBA联赛之同曦
日期:2018-06-04 19:42:2015-16赛季CBA联赛之山东
日期:2018-05-30 12:44:59
发表于 2018-12-04 17:55 |显示全部楼层
回复 1# elaine2017


  1. awk '{for(i=1;i<=NF;i++){if($i~/UVM/){a[i]=$i}else if(i in a){a[i]=a[i]"->"$i}}}END{for(i in a){print i,a[i]}}' file.txt
复制代码

论坛徽章:
0
发表于 2018-12-04 22:26 |显示全部楼层
  1. #建议保存编码为:bom头 + utf8
  2. $a = import-csv 'a:\pscode\TEMP_2018\temp205\aaa.csv' -Header '1','2','3','4','5','6'
  3. $script:结果 = @()
  4. function 过滤 ($c1,$c2)
  5. {
  6.         if ($c1[0]."$c2" -match 'uvm')
  7.         {
  8.                 return $c2
  9.         }
  10. }

  11. $script:结果 += 过滤 $a  '1'   
  12. $script:结果 += 过滤 $a  '2'
  13. $script:结果 += 过滤 $a  '3'
  14. $script:结果 += 过滤 $a  '4'
  15. $script:结果 += 过滤 $a  '5'
  16. $script:结果 += 过滤 $a  '6' #这里若用for循环道理一样

  17. $a | Select-Object $script:结果
复制代码


结果:
1        3        4        6      
-        -        -        -      
edu_UVM  edu_UVM  edu_UVM  edu_UVM
0.119877 0.060752 0.157005 0.117144
0.9032   0.093014 0.856304 0.115994
0.879704 0.253639 0.940341 0.413085
0.766316 0.750682 0.842987 0.584756
0.409997 0.851327 0.847317 0.782867
0.852237 0.841365 0.8693   0.825748
0.104299 0.711478 0.714096 0.123553
0.013179 0.013634 0.017473 0.013132
0.840895 0.794493 0.855183 0.790851

关系型数据库,字段名不能重名。所以要加上字段名,加什么无所谓,这里加了 123456.

论坛徽章:
0
发表于 2018-12-05 09:59 |显示全部楼层
回复 2# wh7211

这个不对啊,出来的还是只有匹配到的列名,没有底下的内容

论坛徽章:
0
发表于 2018-12-05 10:33 |显示全部楼层
回复 3# 本友会机友会摄友会

这是shell脚本?我文件比较大40多G,这个适用吗

论坛徽章:
21
程序设计版块每日发帖之星
日期:2016-05-03 06:20:0015-16赛季CBA联赛之深圳
日期:2018-06-15 14:59:3715-16赛季CBA联赛之八一
日期:2018-07-03 16:56:4615-16赛季CBA联赛之八一
日期:2018-07-05 10:34:09黑曼巴
日期:2018-07-06 15:19:5015-16赛季CBA联赛之佛山
日期:2018-08-03 13:19:3315-16赛季CBA联赛之山西
日期:2018-08-07 19:46:2315-16赛季CBA联赛之广夏
日期:2018-08-08 19:31:5015-16赛季CBA联赛之青岛
日期:2018-11-26 15:21:5015-16赛季CBA联赛之青岛
日期:2018-06-08 13:45:2815-16赛季CBA联赛之同曦
日期:2018-06-04 19:42:2015-16赛季CBA联赛之山东
日期:2018-05-30 12:44:59
发表于 2018-12-05 14:03 |显示全部楼层
回复 4# elaine2017


这个不对啊,出来的还是只有匹配到的列名,没有底下的内容
  1. cat 1
  2. edu_UVM edu_COAD edu_UVM edu_UVM edu_OR edu_UVM
  3. 1 2 3 4 5 6
  4. 11 22 33 44 55 66
  5. 111 222 333 444 555 666

  6. awk '{for(i=1;i<=NF;i++){if($i~/UVM/){a[i]=$i}else if(i in a){a[i]=a[i]"->"$i}}}END{for(i in a){print i,a[i]}}' 1      
  7. 1 edu_UVM->1->11->111
  8. 3 edu_UVM->3->33->333
  9. 4 edu_UVM->4->44->444
  10. 6 edu_UVM->6->66->666
复制代码

论坛徽章:
0
发表于 2018-12-05 15:39 |显示全部楼层
回复 6# wh7211

好的,谢谢。不过你这个格式都变了啊

论坛徽章:
21
程序设计版块每日发帖之星
日期:2016-05-03 06:20:0015-16赛季CBA联赛之深圳
日期:2018-06-15 14:59:3715-16赛季CBA联赛之八一
日期:2018-07-03 16:56:4615-16赛季CBA联赛之八一
日期:2018-07-05 10:34:09黑曼巴
日期:2018-07-06 15:19:5015-16赛季CBA联赛之佛山
日期:2018-08-03 13:19:3315-16赛季CBA联赛之山西
日期:2018-08-07 19:46:2315-16赛季CBA联赛之广夏
日期:2018-08-08 19:31:5015-16赛季CBA联赛之青岛
日期:2018-11-26 15:21:5015-16赛季CBA联赛之青岛
日期:2018-06-08 13:45:2815-16赛季CBA联赛之同曦
日期:2018-06-04 19:42:2015-16赛季CBA联赛之山东
日期:2018-05-30 12:44:59
发表于 2018-12-05 18:20 |显示全部楼层
回复 7# elaine2017


  1. cat 1
  2. edu_UVM edu_COAD edu_UVM edu_UVM edu_OR edu_UVM
  3. 1 2 3 4 5 6
  4. 11 22 33 44 55 66
  5. 111 222 333 444 555 666

  6. awk 'NR==1{for(i=1;i<=NF;i++){if($i~/UVM/){a[i]++;b=i}}}{for(i=1;i<=NF;i++){if(a[i]){printf("%s",i<b?$i" ":$i"\n")}}}' 1
  7. edu_UVM edu_UVM edu_UVM edu_UVM
  8. 1 3 4 6
  9. 11 33 44 66
  10. 111 333 444 666
复制代码

论坛徽章:
12
CU大牛徽章
日期:2013-04-17 11:20:3615-16赛季CBA联赛之福建
日期:2017-03-13 11:33:442017金鸡报晓
日期:2017-02-08 10:39:422017金鸡报晓
日期:2017-01-10 15:13:29IT运维版块每日发帖之星
日期:2016-03-15 06:20:01IT运维版块每日发帖之星
日期:2015-10-02 06:20:00CU十二周年纪念徽章
日期:2013-10-24 15:41:34CU大牛徽章
日期:2013-09-18 15:15:45CU大牛徽章
日期:2013-09-18 15:15:15CU大牛徽章
日期:2013-04-17 11:46:39CU大牛徽章
日期:2013-04-17 11:46:2815-16赛季CBA联赛之吉林
日期:2017-05-25 16:45:47
发表于 2018-12-06 12:27 |显示全部楼层
这个你也太纠结了吧,列名只有1行,根据这行就可以获得哪些列需要输出
然后cut 输出对应列就好,不一定要只能用一个工具啊。

论坛徽章:
0
发表于 2018-12-10 09:31 |显示全部楼层
回复 9# xdsnet

原数据有7千多列,你要我一个一个去看哪些列需要哪些列不要吗。。。。。。。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

数据风云,十年变迁
DTCC 第十届中国数据库技术大会已启航!

2019年5月8日~5月10日,由IT168旗下ITPUB企业社区平台主办的第十届中国数据库技术大会(DTCC2019),将在北京隆重召开。大会将邀请百余位行业专家,就热点技术话题进行分享,是广大数据领域从业人士的又一次年度盛会和交流平台。与SACC2018类似,本届大会将采用“3+2”模式:3天传统技术演讲+2天深度主题培训。大会不仅提供超100场的主题演讲,还会提供连续2天的深度课程培训,深化数据领域的项目落地实践方案。
DTCC2019,一场值得期待的数据技术盛会,殷切地希望您报名参与!

活动入口>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP