免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12345下一页
最近访问板块 发新帖
查看: 25735 | 回复: 49

[转贴]已经过了两年了,不知道结论还正确吗? [复制链接]

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
发表于 2003-01-29 10:44 |显示全部楼层
转贴自http://www.linuxforum.net/forum/showflat.php?Cat=&Board=db&Number=379325&page=0&view=collapsed&sb=5&o=31&fpart=

在网络上看过很多关于mysql和postgresql的争论,这篇比较有意思,不过看到最后也就得到了每次这种讨论的最后结论,都是一样的,这种结论也许就是真实的。有一些具体事例搀杂其中,注意这是两年前的帖子,如果有兴趣的话,不妨按照他的测试方法使用现在最新的版本再测试一下,那些老版本里的8k限制现在已经在新版本里没有了。

**************************************************
MySQL和PostgreSQL的比较

2001/01/20 13:34  

我使用哪个数据库:PostgreSQL 或 MySQL?

这个老生常谈的问题已经困惑了开发者至少两年了。我全面地接触了这两个数据库系统(MYSQL有一年,而Postgres有二年了),而且对MySQL网站提出的关于两者之间的差异非常好奇。

1999年9月,当我们正开始对SoureForge架设基础的时候,我对这两个数据库作了性能测试。当时,尽管我已经习惯于使用Postgres完成所有工作,但两者的性能差异是如此之明显以至与我们不得不采用MySQL。其他的惯用MySQL的开发者也拥护这个决定。

在当时,这个性能测试要胜于平时任何人为的测试。我想看看这两个数据库在网站某一具体的网页上应用的情况。所提及的这个网页是SourForge讨论区。它包括3个表的简单相关结合。每个表有20-30,000行数据。以及递归的实现和嵌套的信息,所以数据库在此页上的应用确实是一个瓶颈。

开始实行,我从库中卸下了真实的数据。编辑了SQL表,并且将其导入MySQL 3.22.30和PostgreSQL7.0.2,运行在拥有1G RAM 的VA Linux quad-xeon 4100 server上的Red Hat Linux 6.2上。

使我陷入的第一个问题是,在Postgres中,有一个不可思议的问题:每行数据最多只能有8K。在信息公告板上,你时常会超过每行8K的限制。所以Postgres在导入数据时阻塞。为了能继续使用,我只得将数据的"body"抛弃,并且重新导入数据。Postgres 开发小组已经意识到了这个限制,并且在7.1的版本中修改了,而且他们告诉你,你可通过重新编译Postgres使得它支持32K/每行,尽管这样做会使整个系统的性能受到影响。

在这一点上,我又陷入了Postgres另一个小问题上,它的"serial"数据类型(等价于MYSQL的auto_increment)会造成一个"sequence":当它的双亲表被抛弃时,它本身不被抛弃。因此,当你想重新创建这个表时,会引起一个名字冲突。有许多新的用户被这个问题所困惑,所以这些问题使Postgres在测试中失去一些优势。相反,MySQL聪明到它可以在你导入数据的时候对auto_increment进行自动增量,然而Postgres的sequence 不可以在你导入数据时重置,从而引起新插入操作的失败。

方法

为了尽可能地真实,我从网站上选择了实际的网页,并且使它轻巧地交叉于MySQL和Postgres之间。这基本上意味着所有mysql_query()调用将被pg_exec()替换。这个页包括许多选取与连接操作,与典型的网站做的差不多。

一旦这个测试页运行和调试,我便使用"AB",就是"Apache Benchmarking"应用集,从我的工作站通过我的100M局域网到达quad-xeon服务器。为了在负载的数量上得到一个概念,我使用AB进行各种并发连接的测试,从10-120,当离开了这些页后,这个数稳定在了1000上。

为了更加地接近实际应用,我在脚本中安置了一个随机数生成器,它插入页面的10%的数据到数据库中。在PHPBuilder中所有讨论区页面有10%是作为发送新信息的。

进一步地,就以上所说,我都使用从现成的数据中提取的数据,你得不出比此更真实的情况了。

我觉得测试结果中最有意思的事情是观察没有出错情况下已经装入运行的Postgres能负载多少。实际上,Postgres在没有错误的情况下负载好像要比MySQL高3倍。MySQL在负有40-50个并发连接时开始失常,而在没有其它影响的情况下,Postgres能使120个并发连接运行自如。我的猜测是:如果有足够的内存与够快的CPU,Postgres能够正常负载的远远不止120个并发连接。

表面上看,这显然是Postgres的一个巨大的胜利,但是如果你仔细观察一下更多细节的测试结果,可以发现Postgres生成每页的时间要长2-3倍,所以它需要扩展负载至少2-3倍则刚好能与MySQL打成平手。所以按照不出错误的情况下,两者并发生成尽可能多的页,则他们之间几乎没有什么差别。按照某一时刻生成一页的情况看,MySQL确实快2-3倍。

另外一个有趣的事情是:在以上叙述的"10%插入运算"的测试中,MySQL在分解运算方面快一些。研究表明,当插入运算操作发生时,MySQL锁定整个表,而Postgres有一个美妙的"better than row-level locking"的机制。这个不同很快引起了MySQL并发连接的堆积,从而导致崩溃。同样的,如果你正在从数据库中进行大量的选中操作,而另外的进程正在对表进行插入操作。Postgres可以完全地不受干扰,而MySQL会堆积连接直到像纸牌做的房子一样崩溃。

你会发现在PHP中的稳定的连接并不有助于MySQL多少,相反却明显地有助于Postgres。实际上,其于稳定的连接的Postgres测试要快30%。这就告诉我们,Postgres在开放性连接与确认进程上需要占用大量的系统开销。其中有一些是Linux的错误和它的和僵硬的进程安排。尽管如此,MySQL并不再乎你如何看待它。

MySQL

MySQL的优缺点已经为许多人所知道:它是一个快速的、轻量级的数据库,但是基本上可以为大多数的网站服务得很好。

无论如何,如果你计划在一个高流量的站点(说明,每天生成多于500,000页)上,那么忘了MySQL吧。因为它往往会崩溃或者在装入运行后死机。任何曾经访问过Slashdot的人都可以证明它的弱点。(mod_perl and MySQL) 话说回来,MySQL证明了可使极大多数网站的页生成速度最高在每秒15页。如果你经常地运行在每秒15页之上,那么你将会非常高兴地支付更大的服务器或者Oracle license的费用。

优势

明显地,MySQL胜过Postgres的优势就在于性能。而且在它的发行版中,还具有一些强有力的管理工具。(其中一些工具允许你察看进程并且可以在程度运行时进行动态调试。)比如热备份,文件毁坏恢复工具等。

我也非常热衷于MySQL的命令行工具。你可以使用描述和察看命令来观察数据库与表的结构。而Postgres的命令则明显地少(/d可以显示一张示范表) 局限性

从数据库行家听说的第一件事就是MySQL缺乏transactions,rollbacks, 和subselects的功能。如果你计划
使用MySQL写一个关于银行、会计的应用程序,或者计划维护一些随时需要线性递增的不同类的计数器,你将缺乏transactions功能。在现有的发布版本的MySQL下,请不要有任何的这些想法。(请注意,MySQL的测试版3.23.x系列现在已经支持transactions了)。

在非常必要的情况下,MySQL的局限性可以通过一部分开发者的努力得到克服。在MySQL中你失去的主要功能是subselect语句,而这正是其它的所有数据库都具有的。换而言之,这个失去的功能是一个痛苦,但是它可以被克服。

稳定性

MySQL在长期使用的稳定性上失了分。比如,MySQL在运行了30-60天左右的时间后,没有理由地就放弃了随机ghost。许多开发者使用"statically"来编译MySQL就是为了这个原因,而且这个方法帮助了许多人。这个问题也可以通过设置一个好的调度程序让MySQL每月被杀死并重起一次来克服。这并不是一个完全可取的方法,但至少也是一个办法。

MySQL在守护进程的健壮性上也失了分,但这个缺点被MySQL从来不会出现不可靠的数据文件而弥补。最后
一件让人担心的事就是你重要的数据文件会不期地出错,而MySQL却很好地解决了这一点。在一整年的运行MySQL之后,这从未见过数据文件或索引文件轻易地出错。而在同样的时间内,我已经为一些Postgres数据库做了2-3次的恢复了。(记住,备份永远是你最好的朋友,这点可以从PHPBUILDER数据的崩溃看出)

PostgresSQL

Postgres的测试结果可能会使许多人感到惊奇,尽管Postgres在一些网站开发者中声誉并不怎么好(最初的Postgres的发布版本中除了对落后的性能以外,而对其他部分大肆散布谣言)。但根据我的经验和测试,这些不良声誉并不完全有理由。实际上,PostgresSQL可以承受3倍于MySQL的负载而且没有任何错误,当然在相同的硬件和系统环境下。

Postgres一般运行在 10页/每秒的速度之上,足够为 400,000页/每日的流量服务,假定一个规则的流量曲线峰值2倍于最小值。这是一个可怕的数量,它远远地超过了大多数人要在他们的网站上看到的数量。此外,网站的大多数页没有这次测试中的那么复杂。正如MySQL的情况一样,如果你可以超过这个最高限度,你将会非常乐意地花钱添置硬件。由于Postgres的结构,如果你增加处理器和内存,那么它的性能可以继续增长。

优势

Postgres有一些非常高级的功能。而其中的大多数功能我并不使用,它们被真正的数据库高手所采用。许多开发者不利用这些功能,从而无法实现他们的想法。

例如,如果你正需要做多次的更新/插入/删除操作,你可以利用transaction。比如,你要在你的用户列表中插入一个新的用户,同时在另一个表中,要插入一行,而且也要更新别处的一个标志。假如这样,如果第一次插入成功,而第二次失败,你怎么办?在Postgres中,你可以回退全部操作,而观察出错的缘由。

而在MySQL中,出错时你会非常紧张,除非你安排了一些逻辑可以控制这个局面。在实际应用中,第一个问题不会出错,除非你是一个糟糕的程序员。而如果第二个问题出错,那么这个结果并不非常严重。(除非这是一个不允许出错的而冒险的程序,比如会计、银行业、评论界的应用程序。)

无论如何,在Postgres7.0+中现在已经支持了外部关键字,那就意味着当你插入一行,数据库会做一些公正而合理的校验检察。同样,如果你要删除当前表一行,而有另一个表依赖于当前表,数据库则不会让你操作。我喜欢这个想法并且能预见如何利用这个功能重写整个网站。

Triggers 和Views是能够在Postgres中,而不是在MySQL中使用的有趣而有用的工具。尽管我都没有使用过,但我可以想象如果我重新设计SourceForge时将如何地频繁利用views。

局限性

Postgres的主要局限性并不是它的性能(因为大多数网站将永远不会陷入这个问题)。但是由于编码硬化的限制,像每行8k的限制(日期会回到以前的时期)。当我使用Postgres设计Geocrawler.com,我不得不将大的e-mail分成每8k一块以绕过这个僵硬的限制。在默认情况下,Postgres被编译成只支持32个连接,这是不足以用来作高流量网站应用的,特别是考虑到Postgres生成每页的速度要比MySQL慢。

另一个限制可警惕许多PHP的用户:Postgres没有与MySQL的mysql_insertid()等价的函数调用。如果在MySQL的数据库中插入一行数据,MySQL将返回这行主关键字的ID。而在Postgres中完成这样一个操作需要绕许多圈子,这是一件非常头痛的事,而且如果用的多可能会降低效率。

稳定性

Postgres在长时间运行的情况下运行流畅而不出错。我的Postgres 6.5.3装在又老又累的PowerMac 8500上,无错运行已经有90天了;而且每天生成50-100,000页。当Postgres装入运行,不会退出,而在压力下不需要ghost。

Postgres有一个问题是当你确实发生问题时,一般它就真坏了。在一些旧的Postgres6.4.x中,我还发现了更加严重的问题:许多重复而相同的数值被插入到同一个主关键字中(这是不允许在任何情况下出现的) Postgres还有另一问题就是会出现令人紧张的不完整的索引和表,你不能略过或摆脱它。我在Postgres7中没有再发现过它,但我没有对其全面使用,所以无法知道更多。

结论

这次测试几乎证实了我所知道的:两个数据库系统都可以为大多数网站非常好地服务。它们与桌面数据库,像FileMaker和MS Access相比,非常明显地快。Postgres 和 MySQL都是自由而免费的,而且有积极的开发团体所支持。

如果要在两者间选择一个,你首先需要明白你面临的限制并且知道你是否需要Postgres的transaction的支持或者MySQL的large-text-area支持。你可能都要,这种情况下,你只有等到将来的某一天,两者推出新的稳定发布版。

需要提出的一件非常有趣的事是:这两个数据库似乎会在某处重合,就是当MySQL具有transaction的支持并且慢慢加入一些新的功能如:subselect,而Postgres在执行性能和稳定性上有所改进时。

最后,作为数据库高手选择,Postgres应当非常灵活。外部关键字,views,subselects,和transactions都非常地棒--如果你需要并且应用它们。如果你不需要或不使用这些功能,你最好使用MySQL,而利用它优越的性能。

论坛徽章:
0
发表于 2003-01-30 23:39 |显示全部楼层

[转贴]已经过了两年了,不知道结论还正确吗?

“外部关键字”我估计是(Foreign key),应该翻译成“外键约束”。
PostgreSQL并没有按SQL标准实现外建约束,而是通过其特有的规则系统来实现的。

论坛徽章:
1
水瓶座
日期:2014-03-20 18:21:14
发表于 2003-02-08 01:06 |显示全部楼层

[转贴]已经过了两年了,不知道结论还正确吗?

7.2以后好像支持外键了?

论坛徽章:
0
发表于 2003-02-09 21:06 |显示全部楼层

[转贴]已经过了两年了,不知道结论还正确吗?

一句老话:尺有所短,寸有所长~

论坛徽章:
0
发表于 2003-03-04 16:58 |显示全部楼层

[转贴]已经过了两年了,不知道结论还正确吗?

当创建一个引用关系时候,会在引用表上自动创建一个触发器,当向这个引用表插入修改数据时候,由这个触发器去查询被引用表。以此来知道是否违反了约束。

/*-------------------------------------------------------------------------
*
* trigger.c
*        PostgreSQL TRIGGERs support code.
*
* Portions Copyright (c) 1996-2002, PostgreSQL Global Development Group
* Portions Copyright (c) 1994, Regents of the University of California
*
* IDENTIFICATION
*        $Header: /cvsroot/pgsql-server/src/backend/commands/trigger.c,v 1.136 2002/10/21 19:55:49 tgl Exp $
*
*-------------------------------------------------------------------------
*/
#include "postgres.h"

#include "access/genam.h"
#include "access/heapam.h"
#include "catalog/catalog.h"
#include "catalog/catname.h"
#include "catalog/dependency.h"
#include "catalog/indexing.h"
#include "catalog/namespace.h"
#include "catalog/pg_language.h"
#include "catalog/pg_proc.h"
#include "catalog/pg_trigger.h"
#include "catalog/pg_type.h"
#include "commands/defrem.h"
#include "commands/trigger.h"
#include "executor/executor.h"
#include "miscadmin.h"
#include "nodes/makefuncs.h"
#include "parser/parse_func.h"
#include "utils/acl.h"
#include "utils/builtins.h"
#include "utils/fmgroids.h"
#include "utils/inval.h"
#include "utils/lsyscache.h"
#include "utils/syscache.h"


static void InsertTrigger(TriggerDesc *trigdesc, Trigger *trigger, int indx);
static HeapTuple GetTupleForTrigger(EState *estate,
                                   ResultRelInfo *relinfo,
                                   ItemPointer tid,
                                   TupleTableSlot **newSlot);
static HeapTuple ExecCallTriggerFunc(TriggerData *trigdata,
                                        FmgrInfo *finfo,
                                        MemoryContext per_tuple_context);
static void DeferredTriggerSaveEvent(ResultRelInfo *relinfo, int event,
                                                 HeapTuple oldtup, HeapTuple newtup);
static void DeferredTriggerExecute(DeferredTriggerEvent event, int itemno,
                                           Relation rel, TriggerDesc *trigdesc, FmgrInfo *finfo,
                                           MemoryContext per_tuple_context);


/*
* Create a trigger.  Returns the OID of the created trigger.
*
* forConstraint, if true, says that this trigger is being created to
* implement a constraint.      The caller will then be expected to make
* a pg_depend entry linking the trigger to that constraint (and thereby
* to the owning relation(s)).
*/

/* 创建触发器
    第一个参数是语法树结构
   第二个是是否是约束触发器
*/


Oid
CreateTrigger(CreateTrigStmt *stmt, bool forConstraint)
{
        int16           tgtype;
        int16           tgattr[FUNC_MAX_ARGS];
        Datum           values[Natts_pg_trigger];
        char            nulls[Natts_pg_trigger];
        Relation        rel;
        AclResult       aclresult;
        Relation        tgrel;
        SysScanDesc tgscan;
        ScanKeyData key;
        Relation        pgrel;
        HeapTuple       tuple;
        Oid                     fargtypes[FUNC_MAX_ARGS];
        Oid                     funcoid;
        Oid                     funcrettype;
        Oid                     trigoid;
        int                     found = 0;
        int                     i;
        char            constrtrigname[NAMEDATALEN];
        char       *trigname;
        char       *constrname;
        Oid                     constrrelid = InvalidOid;
        ObjectAddress myself,
                                referenced;

        rel = heap_openrv(stmt->;relation, AccessExclusiveLock);

        if (stmt->;constrrel != NULL)
                constrrelid = RangeVarGetRelid(stmt->;constrrel, false);


        /*判断是否一个约束触发器 */
        
else if (stmt->;isconstraint)
        {
                /*
                 * If this trigger is a constraint (and a foreign key one)
                 * then we really need a constrrelid.  Since we don't have one,
                 * we'll try to generate one from the argument information.
                 *
                 * This is really just a workaround for a long-ago pg_dump bug
                 * that omitted the FROM clause in dumped CREATE CONSTRAINT TRIGGER
                 * commands.  We don't want to bomb out completely here if we can't
                 * determine the correct relation, because that would prevent loading
                 * the dump file.  Instead, NOTICE here and ERROR in the trigger.
                 */
                bool    needconstrrelid = false;
                void   *elem = NULL;

               /* 那么起一个特定规则的名字 */
                if (strncmp(strVal(llast(stmt->;funcname)), "RI_FKey_check_", 14) == 0)
                {
                        /* A trigger on FK table. */
                        needconstrrelid = true;
                        if (length(stmt->;args) >; RI_PK_RELNAME_ARGNO)
                                elem = nth(RI_PK_RELNAME_ARGNO, stmt->;args);
                }
                else if (strncmp(strVal(llast(stmt->;funcname)), "RI_FKey_", == 0)
                {
                        /* A trigger on PK table. */
                        needconstrrelid = true;
                        if (length(stmt->;args) >; RI_FK_RELNAME_ARGNO)
                                elem = nth(RI_FK_RELNAME_ARGNO, stmt->;args);
                }
                if (elem != NULL)
                {
                        RangeVar   *rel = makeRangeVar(NULL, strVal(elem));

                        constrrelid = RangeVarGetRelid(rel, true);
                }
                if (needconstrrelid && constrrelid == InvalidOid)
                        elog(NOTICE, "Unable to find table for constraint \"%s\"",
                                 stmt->;trigname);
        }

        if (rel->;rd_rel->;relkind != RELKIND_RELATION)
                elog(ERROR, "CreateTrigger: relation \"%s\" is not a table",
                         stmt->;relation->;relname);

        if (!allowSystemTableMods && IsSystemRelation(rel))
                elog(ERROR, "CreateTrigger: can't create trigger for system relation %s",
                         stmt->;relation->;relname);

        /* permission checks */

        if (stmt->;isconstraint)
        {
                /* foreign key constraint trigger */
                 /* 进行权限检查 */

                aclresult = pg_class_aclcheck(RelationGetRelid(rel), GetUserId(), ACL_REFERENCES);
                if (aclresult != ACLCHECK_OK)
                        aclcheck_error(aclresult, RelationGetRelationName(rel));
                if (constrrelid != InvalidOid)
                {
                        aclresult = pg_class_aclcheck(constrrelid, GetUserId(), ACL_REFERENCES);
                        if (aclresult != ACLCHECK_OK)
                                aclcheck_error(aclresult, get_rel_name(constrrelid));
                }
        }
        else
        {
                /* real trigger */
                aclresult = pg_class_aclcheck(RelationGetRelid(rel), GetUserId(), ACL_TRIGGER);
                if (aclresult != ACLCHECK_OK)
                        aclcheck_error(aclresult, RelationGetRelationName(rel));
        }

论坛徽章:
0
发表于 2003-03-08 14:13 |显示全部楼层

[转贴]已经过了两年了,不知道结论还正确吗?

这遍文章没意义。
PostgreSQL vs Mysql不是一个档次上的东西。比什么。。
如同Oracle 与 Mysql对比。。
PostgreSQL 是关系型数据库的鼻祖。是Infomix前身。它与Ms sql server,sybase,infomix 是一个档次。
mysql与access ,foxbase一个档次。。
为什么这么说。
mysql 与 foxbase的功能差不多。。只提供数据的读,存。如:视图,触发器,过程,序列。subselect 。外键。。。。它都不支持。
只支持select ,update,insert,drop,delete....... 这些功能Access都有。且Access还支持外键,视图。比 mysql功能多。

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
发表于 2003-03-08 15:02 |显示全部楼层

[转贴]已经过了两年了,不知道结论还正确吗?

虽然我很高兴听到有人这么说(窃喜),不过因为这两个东西的比较是很多初学者感兴趣的,所以干脆就收一篇放在这里。

论坛徽章:
0
发表于 2003-03-11 02:47 |显示全部楼层

[转贴]已经过了两年了,不知道结论还正确吗?

原帖由 "netkiller" 发表:
这遍文章没意义。
PostgreSQL vs Mysql不是一个档次上的东西。比什么。。
如同Oracle 与 Mysql对比。。
PostgreSQL 是关系型数据库的鼻祖。是Infomix前身。它与Ms sql server,sybase,infomix 是一个档次。
mysq..........


谢谢,你的回复使我对PostgreSQL vs Mysql有点感觉了,谢谢.

论坛徽章:
0
发表于 2003-03-13 00:46 |显示全部楼层

[转贴]已经过了两年了,不知道结论还正确吗?

这不是档次的问题,是定位的问题。

好比微软的word和记事本,word的功能很强,不过大多数情况我们还是在用记事本,why?简单的web应用,我去用视图,触发器,过程干吗?

要知道:当我们在获得了应用要求的功能后,速度和易用性才是第一位的。

PostgreSQL支持的太全了,我只会在复杂,并且同步性要求很高的的BS结构的项目里用它,或者只是在几个特定的模块中。

论坛徽章:
0
发表于 2003-03-18 08:13 |显示全部楼层

[转贴]已经过了两年了,不知道结论还正确吗?

原帖由 "redfox" 发表:
这不是档次的问题,是定位的问题。

好比微软的word和记事本,word的功能很强,不过大多数情况我们还是在用记事本,why?简单的web应用,我去用视图,触发器,过程干吗?

要知道:当我们在获得了应用要求的功?.........


很有道理的说~~
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP