免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 10118 | 回复: 1
打印 上一主题 下一主题

数据展开的脚本 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-02-08 19:20 |只看该作者 |倒序浏览
各位大大好:

1: 一个文本, 每行是由字符 A, B, C, D 字符组成的。如:

A[BC]D[ABC]DA[BC]D
[BCA][ADB]DAA[BC]

2: [AB], [ABCD]..是一组. 在每一组之内, 字符没有重复, 如:

[AAB]   # A 重复
[ABC]   # 没有重复

3: 数据依序扩展

一行比如:  A[BC]D

数据依序扩展为:

ABD
ACD

一行比如: A[BC]D[AC]
数据依序扩展为:

ABDA
ABDC
ACDA
ACDC

4: 行1 输出 file.1, 行2 输出 file.2....

5: 每文本按照 limit 值 输出, (输出行数 <= limit):

一行比如: A[BC]D[AC]

比如: limit = 3, 输出行数 = 3

ABDA
ABDC
ACDA

一行比如: A[BC]
比如: limit = 5, 输出:

AB
AC

测试文件如下:( 假设 limit = 10 )

A[BC]D[ABC]DA[BC]D
[BCA][ADB]DAA[BC]
A[BC]D[AC]


结果:

file.1:
ABDADABD
ABDADACD
ABDBDABD
ABDBDACD
ABDCDABD
ABDCDACD
ACDADABD
ACDADACD
ACDBDABD
ACDBDACD

file.2:
BADAAB
BADAAC
BDDAAB
BDDAAC
BBDAAB
BBDAAC
CADAAB
CADAAC
CDDAAB
CDDAAC

file.3:
ABDA
ABDC
ACDA
ACDC



# 实际的一行数据可能看起来像这样
A[BC]D[AC]DAABACDA[AC]DDACA[BC]D[AC]DAAA[BC]DDDACB[AC]DAABCCD[AC]DCCA[BC]D[AC]DCA[BC]DACDA[BC]D[ABC]DA[BC]D[AC]DABCD[ACB]DA[BC]DACCDABCD[DC]DA[BCA]DDABCCBB

各位大大能不能给我这个数据扩展的脚本 ?

论坛徽章:
7
戌狗
日期:2013-12-15 20:43:38技术图书徽章
日期:2014-03-05 01:33:12技术图书徽章
日期:2014-03-15 20:31:17未羊
日期:2014-03-25 23:48:20丑牛
日期:2014-04-07 22:37:44巳蛇
日期:2014-04-11 21:58:0915-16赛季CBA联赛之青岛
日期:2016-03-17 20:36:13
2 [报告]
发表于 2014-02-16 15:22 |只看该作者
  1. #!/usr/bin/ruby -w
  2. limit = ARGV.shift.to_i
  3. ARGF.each.with_index(1) do |l, i|
  4.   count = 0
  5.   array = l.chomp.split(/(?=\[)|(?<=\])/).map do |e|
  6.     e[0] == ?[ ? e.scan(/\w/).to_a : [e]
  7.   end
  8.   File.open("file.#{i}", "w") do |fh|
  9.     array.shift.product(*array) do |e|
  10.       fh.puts e.join
  11.       break if (count += 1) == limit
  12.     end
  13.   end
  14. end
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP