免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1705 | 回复: 9

[文本处理] 取文件行首,分别生成相应的若干个文件 [复制链接]

论坛徽章:
0
发表于 2015-06-18 14:19 |显示全部楼层
文件内容大概如下:
BBBC,021,hdisk0          00f61a0489cfa916                    rootvg          active      
BBBC,022,hdisk1          00f61a043c020771                    oradatavg1                  
BBBC,023,hdisk2          00f61a0439e8d52e                    None                        
BBBC,024,hdisk3          none                                None                        
BBBC,025,hdisk4          none                                None                        
BBBC,026,hdisk5          none                                None                        
BBBC,027,hdisk6          none                                None                        
BBBV,000,VOLUME GROUP:       rootvg                   VG IDENTIFIER:  00f61a0400004c000000014692d70ac7
BBBV,001,VG STATE:           active                   PP SIZE:        128 megabyte(s)
BBBV,002,VG PERMISSION:      read/write               TOTAL PPs:      799 (102272 megabytes)
BBBV,003,MAX LVs:            256                      FREE PPs:       4 (512 megabytes)
BBBV,004,LVs:                19                       USED PPs:       795 (101760 megabytes)
BBBV,005,OPEN LVs:           16                       QUORUM:         2 (Enabled)
BBBV,006,TOTAL PVs:          1                        VG DESCRIPTORS: 2
BBBV,007,STALE PVs:          0                        STALE PPs:      0
BBBV,008,ACTIVE PVs:         1                        AUTO ON:        yes
BBBV,009,MAX PPs per VG:     32512                                    
BBBV,010,MAX PPs per PV:     1016                     MAX PVs:        32
BBBV,011,LTG size (Dynamic): 256 kilobyte(s)          AUTO SYNC:      no
BBBV,012,HOT SPARE:          no                       BB POLICY:      relocatable
BBBV,013,PV RESTRICTION:     none                     INFINITE RETRY: no
CPU_ALL,CPU Total test1,User%,Sys%,Wait%,Idle%,Busy,PhysicalCPUs
PCPU_ALL,PCPU Total test1,User  ,Sys  ,Wait  ,Idle  , Entitled Capacity
SCPU_ALL,SCPU Total test1,User  ,Sys  ,Wait  ,Idle   
CPU01,CPU 1 test1,User%,Sys%,Wait%,Idle%
CPU02,CPU 2 test1,User%,Sys%,Wait%,Idle%
CPU03,CPU 3 test1,User%,Sys%,Wait%,Idle%
CPU04,CPU 4 test1,User%,Sys%,Wait%,Idle%
CPU05,CPU 5 test1,User%,Sys%,Wait%,Idle%
CPU06,CPU 6 test1,User%,Sys%,Wait%,Idle%
CPU07,CPU 7 test1,User%,Sys%,Wait%,Idle%
CPU08,CPU 8 test1,User%,Sys%,Wait%,Idle%
PCPU01,PCPU 1 test1,User ,Sys ,Wait ,Idle
PCPU02,PCPU 2 test1,User ,Sys ,Wait ,Idle
PCPU03,PCPU 3 test1,User ,Sys ,Wait ,Idle
PCPU04,PCPU 4 test1,User ,Sys ,Wait ,Idle




想利用shell直接可以生成BBBC,BBBV,CPU,PCPU,SCPU,CPU等类似文件,请各位大神指点一下

论坛徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之北京
日期:2016-07-06 15:42:0715-16赛季CBA联赛之同曦
日期:2016-06-12 10:38:0915-16赛季CBA联赛之佛山
日期:2016-05-27 11:54:56黄金圣斗士
日期:2015-12-02 11:44:35白银圣斗士
日期:2015-11-25 14:32:43白银圣斗士
日期:2015-11-23 12:53:352015亚冠之布里斯班狮吼
日期:2015-10-21 16:55:482015亚冠之首尔
日期:2015-09-01 16:46:052015亚冠之德黑兰石油
日期:2015-08-31 11:39:192015亚冠之萨济拖拉机
日期:2015-08-28 21:06:5315-16赛季CBA联赛之广东
日期:2016-07-12 14:58:53
发表于 2015-06-18 14:29 |显示全部楼层
  1. awk -F "[, ]" '$1~/^BBB/{print > $1".txt" ; next} { print > $2".txt"}' file
复制代码

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
发表于 2015-06-18 14:34 |显示全部楼层
回复 1# bighead0088

$ awk -F, '{file=$1;sub(/_.+|[0-9]+$/,"",file); print > file;if(!a[f]++)print "file: "file}' FILE
file: BBBC
file: BBBV
file: CPU
file: PCPU
file: SCPU


$ grep -c . BBB? ?CPU CPU
BBBC:7
BBBV:14
PCPU:5
SCPU:1
CPU:9

   

论坛徽章:
11
射手座
日期:2015-08-11 16:10:26辰龙
日期:2015-08-11 16:11:11黑曼巴
日期:2016-04-26 16:58:40
发表于 2015-06-18 15:17 |显示全部楼层
回复 2# reyleon


    第一眼看过去,这绝逼不符合;认真看起来,尼玛晕菜了,仔细看$2,我了个去

论坛徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之北京
日期:2016-07-06 15:42:0715-16赛季CBA联赛之同曦
日期:2016-06-12 10:38:0915-16赛季CBA联赛之佛山
日期:2016-05-27 11:54:56黄金圣斗士
日期:2015-12-02 11:44:35白银圣斗士
日期:2015-11-25 14:32:43白银圣斗士
日期:2015-11-23 12:53:352015亚冠之布里斯班狮吼
日期:2015-10-21 16:55:482015亚冠之首尔
日期:2015-09-01 16:46:052015亚冠之德黑兰石油
日期:2015-08-31 11:39:192015亚冠之萨济拖拉机
日期:2015-08-28 21:06:5315-16赛季CBA联赛之广东
日期:2016-07-12 14:58:53
发表于 2015-06-18 15:36 |显示全部楼层
你在说啥 ??

回复 4# hjfeng1988


   

论坛徽章:
0
发表于 2015-06-18 15:36 |显示全部楼层
大神,不行哦,有些可以分出来,有些还是不行哦

论坛徽章:
25
程序设计版块每日发帖之星
日期:2016-05-03 06:20:0015-16赛季CBA联赛之八一
日期:2018-07-05 10:34:09黑曼巴
日期:2018-07-06 15:19:5015-16赛季CBA联赛之佛山
日期:2018-08-03 13:19:3315-16赛季CBA联赛之山西
日期:2018-08-07 19:46:2315-16赛季CBA联赛之广夏
日期:2018-08-08 19:31:5015-16赛季CBA联赛之青岛
日期:2018-11-26 15:21:5015-16赛季CBA联赛之上海
日期:2018-12-11 09:45:3219周年集字徽章-年
日期:2020-04-18 23:54:5215-16赛季CBA联赛之深圳
日期:2020-04-19 21:40:19黑曼巴
日期:2022-04-03 17:55:1315-16赛季CBA联赛之八一
日期:2018-07-03 16:56:46
发表于 2015-06-18 15:37 |显示全部楼层
  1. #!/bin/bash
  2. while read a;do
  3. b=`echo "$a"|awk -F"," '{print $1}'`
  4. if [[ -f "$b.txt" ]];then
  5.         cat <<EOF>>"$b.txt"
  6. $a
  7. EOF
  8. else
  9.         cat <<EOF>"$b.txt"
  10. $a
  11. EOF
  12. fi
  13. done<file
复制代码

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
发表于 2015-06-18 16:41 |显示全部楼层
  1. import re

  2. with open('input.txt', 'r') as f:
  3.     for each_line in f.readlines():
  4.         filename = re.search(r'([A-Z]+)', each_line).group(1)
  5.         with open(filename, 'a') as new_file:
  6.             new_file.write(each_line)
复制代码

论坛徽章:
0
发表于 2015-06-19 11:07 |显示全部楼层
再追问一下,如果我要把上面的log文件,利用shell把AAA这样的行首作为数据库的表名,直接拆解入库,我应该怎么来做呢???

论坛徽章:
20
卯兔
日期:2015-01-26 22:05:142015亚冠之萨济拖拉机
日期:2015-09-10 15:15:282015亚冠之阿尔希拉尔
日期:2015-09-25 17:37:53程序设计版块每日发帖之星
日期:2015-10-03 06:20:00程序设计版块每日发帖之星
日期:2015-12-09 06:20:00CU十四周年纪念徽章
日期:2015-12-17 09:07:15程序设计版块每日发帖之星
日期:2015-12-25 06:20:34程序设计版块每日发帖之星
日期:2015-12-25 06:20:34程序设计版块每日发帖之星
日期:2015-12-25 06:20:342015亚冠之广州富力
日期:2015-08-27 19:29:56每日论坛发贴之星
日期:2015-08-26 06:20:002015亚冠之阿尔希拉尔
日期:2015-05-18 17:26:27
发表于 2015-06-21 14:48 |显示全部楼层
回复 1# bighead0088
  1. awk -F, '{s=gensub(/^([A-Z]+).*/,"\\1","g",$1);print > s}' file
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP