免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: ly5066113
打印 上一主题 下一主题

[学习共享] 文本编辑的一点心得--awk篇 [复制链接]

论坛徽章:
0
11 [报告]
发表于 2010-09-23 14:24 |只看该作者
借宝地问个问题。
x    abcd
y    0,1
z    a,b,c

变成:
x abcd y 0 z a
x abcd y 0 z b
x abcd  ...
expert1 发表于 2010-09-23 14:12



    这个不是AWK能解决的,你的这个数据结构其实应该是棵树,而实际文本是多行的,也就是如果从根开始扫描的话,你不知道这个树到底有多少高,而你打印的行是从树根到树梢,那么如果文本很大的话,保存中间结果的内存耗费会很巨大,因为你打印1行完了只是树的最后一层的1个叶子节点的信息被释放

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
12 [报告]
发表于 2010-09-23 15:31 |只看该作者
回复 9# expert1


是这个意思吧:
  1. ly5066113@ubuntu:~$ cat urfile
  2. x    abcd
  3. y    0,1
  4. z    a,b,c
  5. ly5066113@ubuntu:~$ awk -f test.awk urfile
  6. x abcd y 0 z a
  7. x abcd y 1 z a
  8. x abcd y 0 z b
  9. x abcd y 1 z b
  10. x abcd y 0 z c
  11. x abcd y 1 z c
  12. ly5066113@ubuntu:~$ cat test.awk
  13. #! /usr/bin/awk -f

  14. BEGIN {
  15.         FS = "[ ,]+"
  16. }
  17. NR == 1 {
  18.         for(i = 2; i <= NF; i ++)
  19.                 a[i - 1] = $1 " " $i
  20.         l = NF - 1
  21. }
  22. NR > 1 {
  23.         for(i in a)
  24.                 b[i] = a[i]
  25.         for(i = 2; i <= NF; i ++)
  26.                 for(j = 1; j <= l; j ++)
  27.                         a[++ k] = b[j] " " $1 " " $i
  28.         l = k
  29.         k = 0
  30. }
  31. END {
  32.         for(i = 1; i <= l; i ++)
  33.                 print a[i]
  34. }
复制代码

论坛徽章:
0
13 [报告]
发表于 2010-09-23 15:53 |只看该作者
tim哥辛苦了,先顶再看

论坛徽章:
2
狮子座
日期:2014-08-29 16:15:422015亚冠之阿尔纳斯尔
日期:2015-08-28 17:47:49
14 [报告]
发表于 2010-09-23 16:13 |只看该作者
啥也不说了,收!3Q

论坛徽章:
16
IT运维版块每日发帖之星
日期:2015-08-24 06:20:00综合交流区版块每日发帖之星
日期:2015-10-14 06:20:00IT运维版块每日发帖之星
日期:2015-10-25 06:20:00IT运维版块每日发帖之星
日期:2015-11-06 06:20:00IT运维版块每日发帖之星
日期:2015-12-10 06:20:00平安夜徽章
日期:2015-12-26 00:06:302016猴年福章徽章
日期:2016-02-18 15:30:34IT运维版块每日发帖之星
日期:2016-04-15 06:20:00IT运维版块每日发帖之星
日期:2016-05-21 06:20:00综合交流区版块每日发帖之星
日期:2016-08-16 06:20:002015七夕节徽章
日期:2015-08-21 11:06:17IT运维版块每日发帖之星
日期:2015-08-14 06:20:00
15 [报告]
发表于 2010-09-23 16:22 |只看该作者
本帖最后由 expert1 于 2010-09-23 16:33 编辑

回复 12# ly5066113


  我验证了一下,没错的。呵呵,学习一下思路。

论坛徽章:
16
IT运维版块每日发帖之星
日期:2015-08-24 06:20:00综合交流区版块每日发帖之星
日期:2015-10-14 06:20:00IT运维版块每日发帖之星
日期:2015-10-25 06:20:00IT运维版块每日发帖之星
日期:2015-11-06 06:20:00IT运维版块每日发帖之星
日期:2015-12-10 06:20:00平安夜徽章
日期:2015-12-26 00:06:302016猴年福章徽章
日期:2016-02-18 15:30:34IT运维版块每日发帖之星
日期:2016-04-15 06:20:00IT运维版块每日发帖之星
日期:2016-05-21 06:20:00综合交流区版块每日发帖之星
日期:2016-08-16 06:20:002015七夕节徽章
日期:2015-08-21 11:06:17IT运维版块每日发帖之星
日期:2015-08-14 06:20:00
16 [报告]
发表于 2010-09-23 16:44 |只看该作者
本帖最后由 expert1 于 2010-09-23 16:56 编辑

回复 11# justlooks


    呵呵,你说的一点没错,但用树和c咋写呢,我不太会哈哈。给偶开下眼界。

论坛徽章:
0
17 [报告]
发表于 2010-09-23 17:33 |只看该作者
本帖最后由 justlooks 于 2010-09-23 17:34 编辑

回复 16# expert1


    既然每行是树的1层,就读1行就用链表节点保存该行的信息 比如你第2行 有  Y 0,1  那么生成 Y,1   Y ,2  2个节点,然后把这2个节点的指针挂到上一个节点上去啊,那么上一层节点指针可以保存为一个数组啊
你扫描下一行生成节点后对上一行节点的数组进行遍历,并把指针指向上层节点,同时把本层节点放入数组,这样到最后你的低层节点数组中就是你需要打印的所有路径,你只要取一个元素,顺着指针打印到根,那么就是一条路径,整个叶节点打印完了,那么也就是这样了,当然你是树根在前面的,那么从叶走到根,保存走过的信息,最后打印也一样

论坛徽章:
0
18 [报告]
发表于 2010-09-23 17:38 |只看该作者
先顶再看  哈哈

论坛徽章:
0
19 [报告]
发表于 2010-09-23 18:07 |只看该作者
这样想想貌似awk也可以做。…

论坛徽章:
0
20 [报告]
发表于 2010-09-23 20:23 |只看该作者
绝对好东西,收藏学习了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP