免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1715 | 回复: 7

[文本处理] 删除文件中几个栏位的问题,awk和sed怎么来实现 [复制链接]

论坛徽章:
1
15-16赛季CBA联赛之八一
日期:2017-02-21 17:19:04
发表于 2015-06-30 19:46 |显示全部楼层
有一个格式
"222","a1a","db222","555","ss2","22"
"ac","cc","de2e","5e55","dbb","c "
"11122","c12","dhh","bn","667","23 "
"b1c2","7789","db222","av5","22","  22"
................................

类似于这种格式的,我想删除第一列和第二列,就像下面这样
"db222","555","ss2","22"
"de2e","5e55","dbb","c "

用sed 和awk怎么来实现?

求职 : 机器学习
论坛徽章:
79
2015年亚洲杯纪念徽章
日期:2015-05-06 19:18:572015七夕节徽章
日期:2015-08-21 11:06:172015亚冠之阿尔纳斯尔
日期:2015-09-07 09:30:232015亚冠之萨济拖拉机
日期:2015-10-21 08:26:3915-16赛季CBA联赛之浙江
日期:2015-12-30 09:59:1815-16赛季CBA联赛之浙江
日期:2016-01-10 12:35:21技术图书徽章
日期:2016-01-15 11:07:2015-16赛季CBA联赛之新疆
日期:2016-02-24 13:46:0215-16赛季CBA联赛之吉林
日期:2016-06-26 01:07:172015-2016NBA季后赛纪念章
日期:2016-06-28 17:44:45黑曼巴
日期:2016-06-28 17:44:4515-16赛季CBA联赛之浙江
日期:2017-07-18 13:41:54
发表于 2015-06-30 20:30 |显示全部楼层
本帖最后由 zsszss0000 于 2015-06-30 20:49 编辑

awk -vFS="," '{$1="";$2=""}1' file
  1.   "db222" "555" "ss2" "22"
  2.   "de2e" "5e55" "dbb" "c "
  3.   "dhh" "bn" "667" "23 "
  4.   "db222" "av5" "22" "  22"
复制代码

论坛徽章:
769
金牛座
日期:2014-02-26 17:49:58水瓶座
日期:2014-02-26 18:10:15白羊座
日期:2014-04-15 19:29:52寅虎
日期:2014-04-17 19:43:21酉鸡
日期:2014-04-19 21:24:10子鼠
日期:2014-04-22 13:55:24卯兔
日期:2014-04-22 14:20:58亥猪
日期:2014-04-22 16:13:09狮子座
日期:2014-05-05 22:31:17摩羯座
日期:2014-05-06 10:32:53处女座
日期:2014-05-12 09:23:11子鼠
日期:2014-05-21 18:21:27
发表于 2015-06-30 20:32 |显示全部楼层
回复 1# psmzs


    sed  -r 's/^([^,]*,){2}//' urfile

论坛徽章:
1
15-16赛季CBA联赛之八一
日期:2017-02-21 17:19:04
发表于 2015-06-30 21:25 |显示全部楼层
回复 2# zsszss0000


   我还想其他的保留原样,你这输出后分隔是空格了,如果OFS设置为逗号的话,前面还带着两个逗号啊,

论坛徽章:
11
射手座
日期:2015-08-11 16:10:26辰龙
日期:2015-08-11 16:11:11黑曼巴
日期:2016-04-26 16:58:40
发表于 2015-06-30 21:31 |显示全部楼层
回复 4# psmzs
  1. awk -F ',' '{for(i=3;i<NF;i++){printf $i FS}print $NF}' file
复制代码

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
发表于 2015-06-30 22:16 |显示全部楼层
  1. with open('input.txt') as f:
  2.     for each_line in f:
  3.         fields = each_line.split(',')
  4.         print ','.join(fields[2:]),
复制代码

论坛徽章:
1
15-16赛季CBA联赛之八一
日期:2017-02-21 17:19:04
发表于 2015-06-30 22:38 |显示全部楼层
回复 6# yestreenstars


    大神你这是什么语法。。。。

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
发表于 2015-06-30 23:00 |显示全部楼层
回复 7# psmzs

Python……
   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP