免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: lifeistrue
打印 上一主题 下一主题

特殊格式的大文本文件处理 [复制链接]

论坛徽章:
0
41 [报告]
发表于 2009-02-10 11:51 |只看该作者
原帖由 cindymusic 于 2009-2-10 01:59 发表
_do部分根据性能要求,可以使用数据库,bsddb重写
class logParser:
    def __init__(self,filename):
        self._filename=filename


    def _do_init_db(self):
        if not hasattr(self,'_d ...


不懂 python

但是从代码长度看  还是perl 简单些

论坛徽章:
3
戌狗
日期:2014-09-10 17:07:162015年辞旧岁徽章
日期:2015-03-03 16:54:15wusuopu
日期:2016-06-17 17:43:45
42 [报告]
发表于 2009-02-10 11:58 |只看该作者
原帖由 hitsubunnu 于 2009-2-10 11:51 发表


不懂 python

但是从代码长度看  还是perl 简单些

对这段代码有同感

论坛徽章:
0
43 [报告]
发表于 2009-02-10 12:02 |只看该作者

回复 #41 hitsubunnu 的帖子

想减长度还不简单,就怕谁也看不懂。君不见有一行的python的p2p服务器代码。就是可读性太差。这方面本身比较没什么意思。做程序,可读性第一位,性能第二位,长度吗,无所谓拉

论坛徽章:
0
44 [报告]
发表于 2009-02-10 12:13 |只看该作者
原帖由 cindymusic 于 2009-2-10 12:02 发表
想减长度还不简单,就怕谁也看不懂。君不见有一行的python的p2p服务器代码。就是可读性太差。这方面本身比较没什么意思。做程序,可读性第一位,性能第二位,长度吗,无所谓拉


你是来挑衅的

鉴定完毕

论坛徽章:
95
程序设计版块每日发帖之星
日期:2015-09-05 06:20:00程序设计版块每日发帖之星
日期:2015-09-17 06:20:00程序设计版块每日发帖之星
日期:2015-09-18 06:20:002015亚冠之阿尔艾因
日期:2015-09-18 10:35:08月度论坛发贴之星
日期:2015-09-30 22:25:002015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39程序设计版块每日发帖之星
日期:2015-10-05 06:20:00每日论坛发贴之星
日期:2015-10-05 06:20:002015年亚冠纪念徽章
日期:2015-10-06 10:06:482015亚冠之塔什干棉农
日期:2015-10-19 19:43:35程序设计版块每日发帖之星
日期:2015-10-21 06:20:00每日论坛发贴之星
日期:2015-09-14 06:20:00
45 [报告]
发表于 2009-02-10 12:14 |只看该作者
原帖由 cindymusic 于 2009-2-10 12:02 发表
想减长度还不简单,就怕谁也看不懂。君不见有一行的python的p2p服务器代码。就是可读性太差。这方面本身比较没什么意思。做程序,可读性第一位,性能第二位,长度吗,无所谓拉

长度当然有所谓了,长度越长,整个理解越困难,可能的 bug 越多。

论坛徽章:
0
46 [报告]
发表于 2009-02-10 12:31 |只看该作者
原帖由 cindymusic 于 2009-2-10 01:59 发表
_do部分根据性能要求,可以使用数据库,bsddb重写
class logParser:
    def __init__(self,filename):
        self._filename=filename


    def _do_init_db(self):
        if not hasattr(self,'_d ...



策略模式?

论坛徽章:
0
47 [报告]
发表于 2009-02-10 12:46 |只看该作者
原帖由 cindymusic 于 2009-2-10 12:02 发表
想减长度还不简单,就怕谁也看不懂。君不见有一行的python的p2p服务器代码。就是可读性太差。这方面本身比较没什么意思。做程序,可读性第一位,性能第二位,长度吗,无所谓拉


这里指的是正常情况下的代码长度,
你说的那种情况不在讨论范围内

论坛徽章:
0
48 [报告]
发表于 2009-02-10 21:58 |只看该作者
哈哈,原来是perl的地,闪人

其实什么语言都是一样的,无论是C,perl,python,java等
关键是算法,思路

本题关键是遍历,即然是巨文件,就要保证只遍历一次
由于是固定格式,思路应该是
(1)数据提取:将有用的数据取出来,这部分相对固定
(2)数据处理:对提取数据进行处理,无论是用程序、数据库、文件均可处理。根据所处情况而定。

哈哈,走人

论坛徽章:
0
49 [报告]
发表于 2009-02-11 09:52 |只看该作者
原帖由 cindymusic 于 2009-2-10 21:58 发表
哈哈,原来是perl的地,闪人

其实什么语言都是一样的,无论是C,perl,python,java等
关键是算法,思路

本题关键是遍历,即然是巨文件,就要保证只遍历一次
由于是固定格式,思路应该是
(1)数据提取: ...



论坛徽章:
3
戌狗
日期:2014-09-10 17:07:162015年辞旧岁徽章
日期:2015-03-03 16:54:15wusuopu
日期:2016-06-17 17:43:45
50 [报告]
发表于 2009-02-11 10:05 |只看该作者
原帖由 cindymusic 于 2009-2-10 21:58 发表
哈哈,原来是perl的地,闪人

其实什么语言都是一样的,无论是C,perl,python,java等
关键是算法,思路


本题关键是遍历,即然是巨文件,就要保证只遍历一次
由于是固定格式,思路应该是
(1)数据提取: ...

有道理
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP