免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1411 | 回复: 9
打印 上一主题 下一主题

[文本处理] 根据配置文件进行文本处理添加空行。 [复制链接]

论坛徽章:
1
白羊座
日期:2014-11-13 10:19:16
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-09-25 11:43 |只看该作者 |倒序浏览
本帖最后由 iocg 于 2014-09-25 14:17 编辑

我想将5个文件(a.txt  b.txt  c.txt  d.txt  e.txt)根据我的配置文件信息,添加空行。

设配置文本:setting.txt
  1. a|80        b|60        c|30        d|100        e|75
复制代码
用tab键隔开

根据setting的配置信息,将对应文本添加空行。。
例如:
a|80   代表处理后a.txt中内容行占80%。。即  添加的空行 : 内容行 == 20 : 80
b|60   代表处理后b.txt中内容行占60%。。即  添加的空行 : 内容行 == 40 : 60
c|30   代表处理后c.txt中内容行占30%。。即  添加的空行 : 内容行 == 70 : 30
...

假设b文本:
  1. iocg 1111
  2. iocg 2222
  3. iocg 3333
  4. iocg 4444
  5. iocg 5555
  6. iocg 6666
  7. iocg 7777
  8. iocg 8888
  9. iocg 9999
  10. iocg 0000
复制代码
根据b|60  添加 10/0.6*(1-0.6)=6行的空行在原文本的结尾。。
  1. iocg 1111
  2. iocg 2222
  3. iocg 3333
  4. iocg 4444
  5. iocg 5555
  6. iocg 6666
  7. iocg 7777
  8. iocg 8888
  9. iocg 9999
  10. iocg 0000
  11. .
  12. .
  13. .
  14. .
  15. .
  16. .
复制代码
.表示空格

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
2 [报告]
发表于 2014-09-25 11:58 |只看该作者
空行加在哪呢?首行前还是末行后?

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
3 [报告]
发表于 2014-09-25 12:01 |只看该作者
回复 2# yestreenstars


目测要动态分配,根据文件的行数来决定空行的数量,及每行内容的间距。

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
4 [报告]
发表于 2014-09-25 12:03 |只看该作者
回复 3# ly5066113

Tim兄最近是爱上目测啊,这是要抢我和@关阴月飞PF的饭碗啊~
   

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
5 [报告]
发表于 2014-09-25 12:03 |只看该作者
本帖最后由 yestreenstars 于 2014-09-25 12:03 编辑

回复 3# ly5066113

重复发了,请忽略~
   

论坛徽章:
769
金牛座
日期:2014-02-26 17:49:58水瓶座
日期:2014-02-26 18:10:15白羊座
日期:2014-04-15 19:29:52寅虎
日期:2014-04-17 19:43:21酉鸡
日期:2014-04-19 21:24:10子鼠
日期:2014-04-22 13:55:24卯兔
日期:2014-04-22 14:20:58亥猪
日期:2014-04-22 16:13:09狮子座
日期:2014-05-05 22:31:17摩羯座
日期:2014-05-06 10:32:53处女座
日期:2014-05-12 09:23:11子鼠
日期:2014-05-21 18:21:27
6 [报告]
发表于 2014-09-25 12:53 |只看该作者
回复 1# iocg

不光光是添加吧?还有删除原文件中的空行?
比如你给的哪个数据100%,若原文件有空行要删吗?

论坛徽章:
1
白羊座
日期:2014-11-13 10:19:16
7 [报告]
发表于 2014-09-25 14:05 |只看该作者
本帖最后由 iocg 于 2014-09-25 14:25 编辑

回复 6# Herowinter


    额...其实是这样的。原本的的空行已经先 sed -i '/^$/d' file去掉了。

    要添加的空行直接加到文本的后面就可以哈。。
    100%的话,原文本不加空行~~~

论坛徽章:
2
摩羯座
日期:2014-11-03 15:28:56卯兔
日期:2015-01-04 17:20:51
8 [报告]
发表于 2014-09-25 14:46 |只看该作者
本帖最后由 bulletmarquis 于 2014-09-25 14:59 编辑

回复 1# iocg
  1. awk -vRS='[\t|]' '{fn=$0".txt";getline;l1=$0;if($0<100){_cmd_="sed -n $= "fn;_cmd_|getline l2;close(_cmd_);l3=int(l2*(100-$0)/$0);_cmd_="yes \"\"|head -"l3" >>"fn;_cmd_|getline;close(_cmd_)}}' file
复制代码
最后一个配置项读取会有问题,之前的文件处理测试都是可以的



修改了一下处理方式,下面这个可以实现LZ要求
  1. awk -vRS='\t' -vFS='|' '{fn=$1".txt";if($2<100){_cmd_="sed -n $= "fn;_cmd_|getline l2;close(_cmd_);l3=int(l2*(100-$2)/$2);_cmd_="yes \"\"|head -"l3" >>"fn;print _cmd_}}' file
复制代码

论坛徽章:
2
摩羯座
日期:2014-11-03 15:28:56卯兔
日期:2015-01-04 17:20:51
9 [报告]
发表于 2014-09-25 14:51 |只看该作者
@ly5066113@yestreenstars@Herowinter

烦劳大神指点一下,我拿LZ的例子写个配置文件abc
  1. cat abc
  2. a|80    b|60    c|30    d|100   e|75
复制代码
中间是以TAB间分隔,为何用getline的时候,最后一个变量读不对啊?
  1. awk -vRS='[\t|\n]' '{fn=$0;getline l1;print fn,l1}' abc
  2. a 80
  3. b 60
  4. c 30
  5. d 100
  6. e 100
复制代码

论坛徽章:
2
摩羯座
日期:2014-11-03 15:28:56卯兔
日期:2015-01-04 17:20:51
10 [报告]
发表于 2014-09-25 16:18 |只看该作者
回复 9# bulletmarquis


    大神们都不鸟我

    继续召唤
@Shell_HAT  @blackold
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP