免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2903 | 回复: 3
打印 上一主题 下一主题

用perl做大规模数据(千万级)高效处理的孔雀翎  关闭 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2007-03-17 16:26 |只看该作者 |倒序浏览
呵呵,以前记得孔雀翎是可以让一个不会武功的人能迅速PK掉武功高手的武器。
同样在IT世界,perl+mysql就能成为一个高效的孔雀翎。学perl是因为导入mysql数据时候需要一些正则处理,比如去掉不要的,或是做一些变更替换啥的,当然用php,c,java也能做,但是perl比较适合懒惰的人。
哈哈,接下来就是对付千万级的数据分析了,本来应该要学会了算法,cache,多线程才能做的来的事情,现在统统让mysql来处理,我们只要把数据导入到mysql就算大功告成。

于是,一切就变得简单了,当然如果你肯花功夫学一些mysql的性能优化,可以让你产生10多倍的功效。
另外提一下,不要把数据库当作多么高深的东东,其实他就是一个高效算法集一身的文件处理系统。嘎嘎

论坛徽章:
0
2 [报告]
发表于 2007-03-17 16:28 |只看该作者
MySQL storage engines
One of the big advantages of MySQL is its concept of "pluggable storage engines". This means you can choose the most optimal storage engine for your needs. This also has a disadvantage: You have to know what you are doing...

MySQL provides the following storage engines:

mysql> SHOW ENGINES;

+------------+----------+-------------------------------------------------------+
| Engine     | Support  | Comment                                               |
+------------+----------+-------------------------------------------------------+
| MyISAM     | DEFAULT  | Default engine with great performance                 |
| MEMORY     | YES      | Hash based in memory tables                           |
| InnoDB     | YES      | Transactional storage engine with row-level locking   |
| Falcon     | YES      | Falcon storage engine                                 |
| BerkeleyDB | NO       | Transactional storage engine with page-level locking  |
| BLACKHOLE  | YES      | /dev/null storage engine for replication transmission |
| EXAMPLE    | YES      | Example storage engine                                |
| ARCHIVE    | YES      | Archive storage engine                                |
| CSV        | YES      | CSV storage engine                                    |
| ndbcluster | DISABLED | Clustered, fault-tolerant, memory-based tables        |
| FEDERATED  | YES      | Federated MySQL storage engine (like database links)  |
| MRG_MYISAM | YES      | Collection of identical MyISAM tables (MERGE)         |
| ISAM       | NO       | Obsolete storage engine                               |
+------------+----------+-------------------------------------------------------+



There are also some independent storage engine providers:

solidDB
PrimeBase XT
OpenOLAP
Thinking Networks Storage Engine
RitmarkFS
FS map to mysql
Sphinx Search
mdbtools storage engine
Distributed Data Engine
MemCacheD Storage Engine (by Brian Aker)
RRD Storage engine (insider information, unofficial name, not yet available). A work around you can find here: Round-Robin Database Storage Engine (RRD)
VEMySQL Velocity Storage Engine
NitroEDB
InfoBrigth
FIFO storage engine (Domas)
Amazon S3 storage engine
ScaleDB

论坛徽章:
0
3 [报告]
发表于 2007-03-17 16:31 |只看该作者
有了上述这些能力,就能让你面对千万级别的数据可以快速PK掉那些对算法,对缓冲,对线程有几年功力的IT高手!

论坛徽章:
0
4 [报告]
发表于 2007-03-17 16:38 |只看该作者
本帖与Perl有任何关系么?去数据库版炫吧。锁之。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP