免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1845 | 回复: 8
打印 上一主题 下一主题

[文本处理] 数据提行处理 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-08-12 20:10 |只看该作者 |倒序浏览
有一个文件file1:(tab分隔)
d   1
a,b,c   12
e,r   13
q   2
y   4
u   66
m,n   67
k   4

想要处理成的结果为:(tab分隔)
d   1
a   12
b   12
c   12
e   13
r   13
q   2
y   4
u   6
m   67
n   67
k   4

请问大侠我该怎么做呢??

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
2 [报告]
发表于 2014-08-12 20:12 |只看该作者

论坛徽章:
0
3 [报告]
发表于 2014-08-12 20:16 |只看该作者
谢谢,看到了!!!回复 2# yinyuemi


   

论坛徽章:
5
白羊座
日期:2014-10-28 11:23:27水瓶座
日期:2015-01-20 10:19:022015亚冠之柏斯波利斯
日期:2015-07-11 18:17:2015-16赛季CBA联赛之同曦
日期:2015-12-23 12:38:582016猴年福章徽章
日期:2016-02-18 15:30:34
4 [报告]
发表于 2014-08-12 20:32 |只看该作者
本帖最后由 klainogn 于 2014-08-12 21:41 编辑
  1. sed -r 's/[[:space:]]+/\t/g;:1;s/([^,]+),([^\t ]*)[\t ]+([0-9]+)/\1\t\3\n\2\t\3/;t1'
  2. awk -F'[, ]+' '{for(i=0;i++<NF-1;)print $i,$NF}'
复制代码

论坛徽章:
9
寅虎
日期:2013-12-02 12:49:22巨蟹座
日期:2014-07-18 18:13:34卯兔
日期:2014-07-25 14:43:08子鼠
日期:2014-07-26 10:10:51酉鸡
日期:2014-07-31 15:09:562015亚冠之本尤德科
日期:2015-05-19 09:27:382015亚冠之卡尔希纳萨夫
日期:2015-06-20 10:30:212015亚冠之阿尔纳斯尔
日期:2015-07-01 20:46:062015亚冠之城南
日期:2015-07-15 21:12:00
5 [报告]
发表于 2014-08-12 20:58 |只看该作者
  1. awk '{split($1,a,",");for(i in a)print a[i],$NF}' c.txt
复制代码

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
6 [报告]
发表于 2014-08-13 00:21 |只看该作者
  1. awk '{l=split($1,a,",");for(i=0;i++<l;)print a[i]"\t"$2}'
复制代码

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
7 [报告]
发表于 2014-08-13 00:25 |只看该作者
  1. sed -r 's/([^,]+),(\S+)(.*)/\1\3\n\2\3/;P;D'
复制代码

论坛徽章:
36
摩羯座
日期:2013-09-23 16:37:312015年亚洲杯之沙特阿拉伯
日期:2015-04-14 09:10:172015亚冠之柏太阳神
日期:2015-06-25 08:48:212015亚冠之武里南联
日期:2015-07-28 09:01:082015亚冠之莱赫维亚
日期:2015-07-28 15:44:172015亚冠之柏斯波利斯
日期:2015-09-06 14:08:52白银圣斗士
日期:2015-11-25 17:06:2815-16赛季CBA联赛之吉林
日期:2015-12-09 16:59:072016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之辽宁
日期:2016-04-14 09:29:04luobin
日期:2016-06-17 17:46:3615-16赛季CBA联赛之天津
日期:2016-08-16 14:11:01
8 [报告]
发表于 2014-08-13 09:09 |只看该作者
  1. awk '{for(i=0;i++<split($1,a,",");) print a[i],$2}'
复制代码

论坛徽章:
7
亥猪
日期:2013-10-10 17:00:29辰龙
日期:2013-10-12 16:23:19卯兔
日期:2013-11-18 17:01:27金牛座
日期:2014-09-09 10:17:052015七夕节徽章
日期:2015-08-21 11:06:172015亚冠之柏太阳神
日期:2015-09-25 13:56:42数据库技术版块每日发帖之星
日期:2016-08-06 06:20:00
9 [报告]
发表于 2014-08-13 17:59 |只看该作者
其实写sql也可以实现的。
  1. with A as
  2. (select 'd' as Flist,1 ID from dual
  3. union
  4. select 'a,b,c',12 from dual
  5. UNION
  6. SELECT 'e,r',13 FROM dual
  7. )
  8. SELECT regexp_substr(FLIST, '[^,]+', 1, LEVEL),ID
  9. FROM   A
  10. CONNECT BY id = PRIOR ID
  11. AND PRIOR DBMS_RANDOM.VALUE IS NOT NULL
  12. AND LEVEL <= length(regexp_replace(FLIST, '[^,]'))+1;
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP