免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 6973 | 回复: 4
打印 上一主题 下一主题

[文本处理] 请教怎样能够输出指定格式的csv文件 [复制链接]

论坛徽章:
4
程序设计版块每日发帖之星
日期:2015-10-10 06:20:00每日论坛发贴之星
日期:2015-10-10 06:20:00程序设计版块每日发帖之星
日期:2015-10-11 06:20:00程序设计版块每日发帖之星
日期:2015-10-25 06:20:00
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-09-18 19:00 |只看该作者 |倒序浏览
本帖最后由 robinhappiness 于 2015-10-01 13:00 编辑

$cat /home/read.csv
#data A
filename,systemName,countA,countB
A00001,AAAA,1,
A00002,BBBB,2,
A00003,CCCC,3,

countA列的件数在/csvA下用wc -l 取得
#wc -l /csvA/A00001-20150930
1
#wc -l /csvA/A00002-20150930
2
#wc -l /csvA/A00003-20150930
3

countB列的件数在/countcsvA下的文件中记录着,所以可以直接用cat取得
#cat /countcsvA/A00001.csv
4
#cat /countcsvA/A00002.csv
5
#cat /countcsvA/A00003.csv
3

read.csv文件中的filename和目录/csvA下的文件名和目录/countcsvA下文件名的共通部分是
A00001
A00002
A00003

想得到的输出文件result.csv的格式是
#data A
filename,systemName,countA,countB
A00001,AAAA,1,4
A00002,BBBB,2,5
A00003,CCCC,3,3


请教怎样修改如下命令才能得到如上的输出结果?
之前错误认为countB列的件数在/countcsvA目录下的文件中取得的时候也是用wc -l,
实际上countB列的件数直接就用cat /countcsvA目录下的文件名就可以取到!

$ awk 'function get(dir,file,line){cmd="wc -l "dir"/"file;cmd|getline line;close(cmd);return(line+0)}BEGIN{FS=OFS=","}{if(!p){print;if($1=="filename")p=1;next}print $1,$2,get("/csvA",$1"*"),get("/countcsvA",$1".csv")}' read.csv

论坛徽章:
12
IT运维版块每日发帖之星
日期:2015-11-17 06:20:00程序设计版块每日发帖之星
日期:2016-01-19 06:20:0015-16赛季CBA联赛之江苏
日期:2016-01-17 15:31:3915-16赛季CBA联赛之上海
日期:2016-01-16 15:44:3015-16赛季CBA联赛之浙江
日期:2016-01-15 20:38:1815-16赛季CBA联赛之北京
日期:2016-01-09 14:30:15CU十四周年纪念徽章
日期:2016-01-07 12:31:5115-16赛季CBA联赛之四川
日期:2016-01-01 11:49:1515-16赛季CBA联赛之深圳
日期:2015-12-24 14:23:4115-16赛季CBA联赛之山西
日期:2015-12-15 16:22:31技术图书徽章
日期:2015-12-10 17:41:0015-16赛季CBA联赛之北控
日期:2016-02-03 10:03:24
2 [报告]
发表于 2015-09-19 10:32 |只看该作者
cat /home/read.csv | while read filename systemName改成awk -F, '/csv/{print $1,$2}' /home/read.csv| while read filename systemName 试试

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
3 [报告]
发表于 2015-09-19 11:30 |只看该作者
回复 1# robinhappiness

$ awk 'function get(dir,file,line){cmd="wc -l "dir"/"file;cmd|getline line;close(cmd);return(line+0)}BEGIN{FS=OFS=","}{if(!p){print;if($1=="filename")p=1;next}print $1,$2,get("/csvA",$1),get("/countcsvA",$1)}' read.csv
#data A
filename,systemName,countA,countB
A00001.csv,AAAA,1,6
A00002.csv,BBBB,2,4
A00003.csv,CCCC,3,5

   

论坛徽章:
4
程序设计版块每日发帖之星
日期:2015-10-10 06:20:00每日论坛发贴之星
日期:2015-10-10 06:20:00程序设计版块每日发帖之星
日期:2015-10-11 06:20:00程序设计版块每日发帖之星
日期:2015-10-25 06:20:00
4 [报告]
发表于 2015-09-24 10:01 |只看该作者
本帖最后由 robinhappiness 于 2015-09-24 13:34 编辑

回复 3# jason680


非常感谢!

论坛徽章:
4
程序设计版块每日发帖之星
日期:2015-10-10 06:20:00每日论坛发贴之星
日期:2015-10-10 06:20:00程序设计版块每日发帖之星
日期:2015-10-11 06:20:00程序设计版块每日发帖之星
日期:2015-10-25 06:20:00
5 [报告]
发表于 2015-10-01 13:04 |只看该作者
jason680 发表于 2015-09-19 11:30
回复 1# robinhappiness

$ awk 'function get(dir,file,line){cmd="wc -l "dir"/"file;cmd ...


请教一个问题!

想得到的输出文件result.csv的格式是
#data A
filename,systemName,countA,countB
A00001,AAAA,1,4
A00002,BBBB,2,5
A00003,CCCC,3,3


请教怎样修改如下命令才能得到如上的输出结果?
之前错误认为countB列的件数在/countcsvA目录下的文件中取得的时候也是用wc -l,
实际上countB列的件数直接就用cat /countcsvA目录下的文件名就可以取到!

$ awk 'function get(dir,file,line){cmd="wc -l "dir"/"file;cmd|getline line;close(cmd);return(line+0)}BEGIN{FS=OFS=","}{if(!p){print;if($1=="filename")p=1;next}print $1,$2,get("/csvA",$1"*"),get("/countcsvA",$1".csv")}' read.csv
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP