免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123
最近访问板块 发新帖
楼主: bmne
打印 上一主题 下一主题

[文本处理] 提取。帮助下,账算糊涂了 [复制链接]

论坛徽章:
31
程序设计版块每日发帖之星
日期:2016-02-06 06:20:00程序设计版块每日发帖之星
日期:2016-07-20 06:20:00程序设计版块每日发帖之星
日期:2016-07-26 06:20:00每日论坛发贴之星
日期:2016-07-26 06:20:00程序设计版块每日发帖之星
日期:2016-07-27 06:20:00每日论坛发贴之星
日期:2016-07-27 06:20:00程序设计版块每日发帖之星
日期:2016-07-28 06:20:00程序设计版块每日发帖之星
日期:2016-07-29 06:20:00程序设计版块每日发帖之星
日期:2016-08-02 06:20:00程序设计版块每日发帖之星
日期:2016-08-06 06:20:00程序设计版块每日发帖之星
日期:2016-08-08 06:20:00程序设计版块每日发帖之星
日期:2016-08-09 06:20:00
21 [报告]
发表于 2017-12-07 10:02 |只看该作者
本帖最后由 bmne 于 2017-12-07 10:23 编辑

回复 20# rubyish


谢谢大牛

不但给鱼,还给鱼网,同时教授织鱼网的方法。真英雄!真能人!

因水平有限,我先拿着鱼先吃着。因为,如同新手上路,同时看红绿灯、顺向行车道、人行横道、两边车流,眼神看不过来,犯迷糊,顾东顾不了西。


回答大牛两个问题:

一、

根据你的指导,经过调整,已经能够完美正确运行  karnataka.c   karnatakaB.c   orapa.c  并确认输出结果都一样正确

我的小样:

aaaaaaaa
bbbbbbbb
cccccccc
asd3afah
a3ara6at
eayaha4a
aat6yaak
aaaqwaaa
aa8yukde
aabacdef
aabhefga
asd3afsh
abf56fba
aekeahkh
a762ay39
6234vtys
82a34k56
92345678
a22hyrtf
88njrx34
0abcdefg
1abcdefg
oabcdefg
54a67b23
23abcd45
76a4h9td
ab94cdef
76a4hytd
abcdefgh
abcdaefg
2a3bceyu

输出结果:(这个结果是我想要的,正确)

ab94cdef
76a4hytd
abcdefgh
abcdaefg
2a3bceyu


二、
给出运行超大文件的效率

文档数据99.9GB  输出结果41.4GB

1、  karnataka.c  

real    43m9.465s
user    35m24.998s
sys     0m44.475s


2、  karnatakaB.c

real    31m24.011s
user    19m24.125s
sys     0m48.110s

3、 orapa.c 我不测试了,意义不大。


结论:已经很明显了。

谢谢大牛追求技术完美!


忘了补充说明了:你的下面的这个,我没改动。因为我相信大牛你的经验
----------------------------------------------
# define SIZE 64

keyi xiugai 64 => 80, 100 or 120 or ...
---------------------------------------------







论坛徽章:
31
程序设计版块每日发帖之星
日期:2016-02-06 06:20:00程序设计版块每日发帖之星
日期:2016-07-20 06:20:00程序设计版块每日发帖之星
日期:2016-07-26 06:20:00每日论坛发贴之星
日期:2016-07-26 06:20:00程序设计版块每日发帖之星
日期:2016-07-27 06:20:00每日论坛发贴之星
日期:2016-07-27 06:20:00程序设计版块每日发帖之星
日期:2016-07-28 06:20:00程序设计版块每日发帖之星
日期:2016-07-29 06:20:00程序设计版块每日发帖之星
日期:2016-08-02 06:20:00程序设计版块每日发帖之星
日期:2016-08-06 06:20:00程序设计版块每日发帖之星
日期:2016-08-08 06:20:00程序设计版块每日发帖之星
日期:2016-08-09 06:20:00
22 [报告]
发表于 2017-12-08 20:02 |只看该作者
本帖最后由 bmne 于 2017-12-12 07:10 编辑

回复 11# rubyish



大牛

不好意思。问一下

我说的简单一点,估计你能看明白

我想运行  karnatakaB.c  得到输出结果

但,我想在里面再增加6条删除内容(请注意,每一条都是独立的,人工控制决定每一条是否增加还是减少)

1、删除纯数字开头的行
2、删除纯数字结尾的行
3、删除纯字母 a 开头的行
4、删除纯字母 a 结尾的行
5、删除纯字母 a  或  b  开头的行           //增加这样一条,学习变化
6、删除纯字母 a  或  b  结尾的行

我的问题: 在 kagoshima.pl  怎样修改添加?

即 类似 $h{$i} = 1 if /110+11/; 这样的,再怎样添加进去上面6项要求?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP