- 论坛徽章:
- 0
|
这篇文档来自PostgreSQL,中文也翻译得非常地道。
常见问题
1.1)PostgreSQL 是什么?该怎么发音?
1.2)谁控制和管理PostgreSQL ?
1.3)PostgreSQL的版权是什么?
1.4)PostgreSQL可以运行在哪些操作系统平台上?
1.5)我从哪里能得到PostgreSQL?
1.6)最新版的PostgreSQL 是什么?
1.7)我从哪里能得到对PostgreSQL 的支持?
1. 我如何提交一个BUG报告?
1.9)我如何了解已知的 BUG 或暂缺的功能?
1.10)能够获取的最新文档有哪些?
1.11)我应该怎样学习 SQL ?
1.12)如何提交补丁或是加入开发队伍?
1.13)PostgreSQL 和其他数据库系统比起来如何?
1.14)PostgreSQL 可以处理最近各个国家夏时制的变化吗?
用户客户端问题
2.1)我们可以用什么语言和PostgreSQL 打交道?
2.2)有什么工具可以把PostgreSQL 用于 Web 页面?
2.3)PostgreSQL 拥有图形用户界面吗?
系统管理问题
3.1)我怎样才能把PostgreSQL 装在 /usr/local/pgsql 以外的地方?
3.2)我如何控制来自其他电脑的连接?
3.3)我怎样调整数据库服务器以获得更好的性能?
3.4)PostgreSQL 里可以获得什么样的调试特性?
3.5)为什么在试图连接登录时收到“Sorry, too many clients” 消息?
3.6)PostgreSQL的升级过程有哪些内容?
3.7)(使用PostgreSQL)我需要使用什么计算机硬件 ?
操作问题
4.1) 如何只选择一个查询结果的头几行?或是随机的一行?
4.2) 如何查看表、索引、数据库以及用户的定义?如何查看psql里用到的查询指令并显示它们?
4.3) 如何更改一个字段的数据类型?
4.4) 单条记录,单个表,一个数据库的最大限制是多少?
4.5) 存储一个典型的文本文件里的数据需要多少磁盘空间?
4.6) 为什么我的查询很慢?为什么这些查询没有利用索引?
4.7) 我如何才能看到查询优化器是怎样评估处理我的查询的?
4. 我怎样做正则表达式搜索和大小写无关的正则表达式查找?怎样利用索引进行大小写无关查找?
4.9) 在一个查询里,我怎样检测一个字段是否为 NULL?我如何才能准确排序而不论某字段是否含NULL值?
4.10) 各种字符类型之间有什么不同?
4.11.1) 我怎样创建一个序列号型或是自动递增的字段?
4.11.2) 我如何获得一个插入的序列号的值?
4.11.3) 同时使用 currval() 会导致和其他用户的冲突情况吗?
4.11.4) 为什么不在事务异常中止后重用序列号呢?为什么在序列号字段的取值中存在间断呢?
4.12) 什么是 OID?什么是 CTID ?
4.13) 为什么我收到错误信息“ERROR: Memory exhausted in AllocSetAlloc()”?
4.14) 我如何才能知道所运行的 PostgreSQL 的版本?
4.15) 我如何创建一个缺省值是当前时间的字段?
4.16) 如何执行外连接(outer join)查询?
4.17) 如何执行涉及多个数据库的查询?
4.1 如何让函数返回多行或多列数据?
4.19) 为什么我在使用PL/PgSQL函数存取临时表时会收到错误信息“relation with OID ##### does not exist”?
4.20) 目前有哪些数据复制方案可用?
4.21) 为何查询结果显示的表名或列名与我的查询语句中的不同?为何大写状态不能保留?
--------------------------------------------------------------------------------
常见问题
1.1)PostgreSQL 是什么?该怎么发音?
PostgreSQL 读作 Post-Gres-Q-L,有时候也简称为Postgres 。想听一下其发音的人员可从这里下载声音文件: MP3 格式 。
PostgreSQL 是面向目标的关系数据库系统,它具有传统商业数据库系统的所有功能,同时又含有将在下一代 DBMS 系统的使用的增强特性。PostgreSQL 是自由免费的,并且所有源代码都可以获得。
PostgreSQL 的开发队伍主要为志愿者,他们遍布世界各地并通过互联网进行联系,这是一个社区开发项目,它不被任何公司控制。 如想加入开发队伍,请参见开发人员常见问题(FAQ) http://www.postgresql.org/files/documentation/faqs/FAQ_DEV.html
1.2) 谁控制PostgreSQL ?
如果你在寻找PostgreSQL的掌门人,或是什么中央委员会,或是什么所属公司,你只能放弃了---因为一个也不存在,但我们的确有一个 核心委员会和CVS管理组,但这些工作组的设立主要是为了进行管理工作而不是对PostgreSQL进行独占式控制,PostgreSQL项目是由任何人均 可参加的开发人员社区和所有用户控制的,你所需要做的就是订阅邮件列表,参与讨论即可(要参与PostgreSQL的开发详见 开发人员常问题 (Developer's FAQ) 获取信息)。
1.3)PostgreSQL的版权是什么?
PostgreSQL的发布遵从经典的BSD版权。它允许用户不限目的地使用PostgreSQL,甚至你可以销售PostgreSQL而不含源代码也可以,唯一的限制就是你不能因软件自身问题而向我们追诉法律责任,另外就是要求所有的软件拷贝中须包括以下版权声明。下面就是我们所使用的BSD版权声明内容:
PostgreSQL数据库管理系统
部分版权(c)1996-2005,PostgreSQL 全球开发小组,部分版权(c)1994-1996 加州大学董事
(Portions copyright (c) 1996-2005,PostgreSQL Global Development Group Portions Copyright (c) 1994-6 Regents of the University of California)
允许为任何目的使用,拷贝,修改和分发这个软件和它的文档而不收取任何费用, 并且无须签署因此而产生的证明,前提是上面的版权声明和本段以及下面两段文字出现在所有拷贝中。
(Permission to use, copy, modify, and distribute this software and its documentation for any purpose, without fee, and without a written agreement is hereby granted, provided that the above copyright notice and this paragraph and the following two paragraphs appear in all copies.)
在任何情况下,加州大学都不承担因使用此软件及其文档而导致的对任何当事人的直接的, 间接的,特殊的,附加的或者相伴而生的损坏,包括利益损失的责任,即使加州大学已经建议了这些损失的可能性时也是如此。
(IN NO EVENT SHALL THE UNIVERSITY OF CALIFORNIA BE LIABLE TO ANY PARTY FOR DIRECT, INDIRECT, SPECIAL, INCIDENTAL, OR CONSEQUENTIAL DAMAGES, INCLUDING LOST PROFITS, ARISING OUT OF THE USE OF THIS SOFTWARE AND ITS DOCUMENTATION, EVEN IF THE UNIVERSITY OF CALIFORNIA HAS BEEN ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.)
加州大学明确放弃任何保证,包括但不局限于某一特定用途的商业和利益的隐含保证。 这里提供的这份软件是基于“当作是”的基础的,因而加州大学没有责任提供维护,支持,更新,增强或者修改的服务。
(THE UNIVERSITY OF CALIFORNIA SPECIFICALLY DISCLAIMS ANY WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE. THE SOFTWARE PROVIDED HEREUNDER IS ON AN "AS IS" BASIS, AND THE UNIVERSITY OF CALIFORNIA HAS NO OBLIGATIONS TO PROVIDE MAINTENANCE, SUPPORT, UPDATES, ENHANCEMENTS, OR MODIFICATIONS.)
1.4)PostgreSQL 可以运行在哪些操作系统平台上?
一般说来,任何现在对 UNIX 兼容的操作系统之上都能运行PostgreSQL 。在安装指南里列出了发布时经过明确测试的平台。
PostgreSQl也可以直接运行在基于微软Windows-NT的操作系统,如Win2000 SP4,WinXP 和 Win2003,已制作完成的安装包可从 http://pgfoundry.org/projects/pginstaller下载,基于MSDOS的Windows操作系统 (Win95,Win98,WinMe)需要通过Cygwin模拟环境运行PostgreSQL。
同时也有一个为Novell Netware 6开发的版本可从 http://forge.novell.com获取,为OS/2(eComStation)开发的版本可从 http://hobbes.nmsu.edu/cgi-bin/h ... rt=type&dir=%2F 下载。
1.5) 我从哪里能得到PostgreSQL?
通过浏览器可从http://www.postgresql.org/ftp/下载,也可通过FTP,从 ftp://ftp.PostgreSQL.org/pub/站点下载。
1.6) 最新版的PostgreSQL是什么?
PostgreSQL 最新的版本是版本 8.2.1 。
我们计划每年发布一个主要升级版本,每几个月发布一个小版本。
1.7) 我从哪里能得到对PostgreSQL的支持?
PostgreSQL社区通过邮件列表为其大多数用户提供帮助,订阅邮件列表的主站点是 http://www.postgresql.org/community/lists/,一般情况下,先加入General 或 Bug邮件列表是一个较好的开始。
主要的IRC频道是在FreeNode(irc.freenode.net)的#postgresql,为了连上此频道,可以使用UNIX程序irc,其指令格式: irc -c '#postgresql' "$USER" irc.freenode.net ,或者使用其他IRC客户端程序。在此网络中还存在一个PostgreSQL的西班牙频道(#postgersql-es)和法语频道 (#postgresql-fr)。同样地,在EFNET上也有一个PostgreSQL的交流频道。
可提供商业支持的公司列表可在http://techdocs.postgresql.org/companies.php浏览。
1. 我如何提交一个BUG报告?
可访问 http://www.postgresql.org/support/submitbug,填写Bug上报表格即可,同样也可访问ftp站点ftp://ftp.PostgreSQL.org/pub/ 检查有无更新的PostgreSQL版本或补丁。
通过使用Bug提交表格或是发往PostgreSQL邮件列表的Bug通常会有以下之一回复:
所提交内容不是一个Bug及其不是Bug的原因。
所提交内容是一个已知的Bug并且已经加入TODO待处理任务列表。
所提交的Bug已在当前版本中被修正。
所提交的Bug已修正但尚未将补丁加入现在的发布软件包。
请求提交者提供更详细的信息:
操作系统
PostgreSQL版本
可重现Bug的测试案例
调试信息
调试跟踪输出
所提交内容是一个新Bug,将执行以下工作:
创建一个新补丁并将其加入下一个主要版本或是小的改进版本中。
此Bug暂时不能修正,将被加至TODO待处理任务列表。
1.9) 我如何了解已知的 BUG 或暂缺的功能?
PostgreSQL 支持一个扩展的 SQL:2003 的子集。参阅我们的TODO 列表,了解已知Bug列表、暂缺的功能和将来的开发计划。
要求增加新功能的申请通常会收到以下之一的回复:
该功能已加入TODO待处理任务列表。
该功能不是必须的,因为:
它是现有的且符合SQL标准的某功能的重复。
该功能性会大大增加代码的复杂程序,而带来的好处是微不足道的。
该功能是不安全或是不可靠的。
该功能将被加入TODO待处理任务列表。
PostgreSQL不使用Bug跟踪系统,因为我们发现在邮件列表中直接回复以及保证TODO任务列表总是处于最新状态的方式工作效率会更高一些。事实上,Bug不会在我们的软件中存在很长时间, 对影响很多用户的Bug也总是很快会被修正。唯一能找到所有改进、提高和修正的地方是CVS的日志信息,即使是在软件新版本的发布信息中也不会列出每一处的软件更新。
1.10) 能够获取的最新文档有哪些?
PostgreSQL包含大量的文档,主要有详细的参考手册,手册页和一些的测试例子。参见 /doc 目录(译注:应为 $PGHOME/doc)。 你还可以在线浏览PostgreSQL的手册,其网址是:http://www.PostgreSQL.org/docs。
有两本关于PostgreSQL的书在线提供,在 http://www.PostgreSQL.org/docs/awbook.html 和 http://www.commandprompt.com/ppbook/ 。 也有大量的PostgreSQL书籍可供购买,其中最为流行的一本是由Korry Douglas编写的。在 http://techdocs.PostgreSQL.org/techdocs/bookreviews.php上 上有大量有关PostgreSQL书籍的简介。 在 http://techdocs.PostgreSQL.org/上收集了有关PostgreSQL的大量技术文章。
客户端的命令行程序psql有一些以 \d 开头的命令,可显示关于类型,操作符,函数,聚合等信息,使用 \? 可以显示所有可用的命令。
我们的 web 站点包含更多的文档。
1.11) 我应该怎样学习 SQL ?
首先考虑上述提到的与PostgreSQL相关的书籍,另外一本是Teach Yourself SQL in 21 Days, Second Edition,其详细介绍的网址是 http://members.tripod.com/er4ebus/sql/index.htm, 我们的许多用户喜欢The Practical SQL Handbook, Bowman, Judith S. 编写,Addison-Wesley公司出版,其他的则喜欢 The Complete Reference SQL, Groff 编写,McGraw-Hill公司出版。
在下列网址上也有很好的教程,他们是
http://www.intermedia.net/support/sql/sqltut.shtm
http://sqlcourse.com.
http://www.w3schools.com/sql/default.asp
http://mysite.verizon.net/Graeme_Birchall/id1.html
1.12)如何提交补丁或是加入开发队伍?
详见 开发人员常见问题 (Developer's FAQ) 。
1.13)PostgreSQL和其他数据库系统比起来如何?
评价软件有好几种方法:功能,性能,可靠性,支持和价格。
功能
PostgreSQL 拥有大型商用数据库最多的功能,例如:事务,子查询,触发器,视图,外键参考完整性和复杂的锁定等。 我们还有一些它们没有的特性,如用户定义类型,继承,规则和多版本并行控制以减少锁的争用等。
性能
PostgreSQL和其他商用和开源的数据库具有类似的性能。对某些处理它比较快,对其他一些处理它比较慢。 与其他数据库相比,我们的性能优劣通常在 +/- 10%之间。
可靠性
我们都知道数据库必须是可靠的,否则它就一点用都没有。我们努力做到发布经过认真测试的,缺陷最少的稳定代码。每个版本至少有一个月的 beta 测试时间,并且我们的发布历史显示我们可以提供稳定的,牢固的,可用于生产使用的版本。我们相信在这方面我们与其他的数据库软件是相当的。
支持
我们的邮件列表提供一个非常大的开发人员和用户的组以帮助解决所碰到的任何问题。我们不能保证总是能解决问题,相比之下,商用数据库软件也并不是总能够提供解决方法。 直接与开发人员,用户群,手册和源程序接触使PostgreSQL的支持比其他数据库还要好。还有一些商业性的全面技术支持,可以给提供给那些需要的人。(参阅1.7 小节)
价格
我们对任何用途都免费,包括商用和非商用目的。 你可以不加限制地向你的产品里加入我们的代码,除了那些我们在上面的版权声明里声明的 BSD版权之外的内容。
1.14) PostgreSQL可以处理最近各个国家夏时制的变化吗?
PostgreSQL 8.0之前的版本是使用操作系统中的时区数据库来处理夏时制的信息,自8.0版及以后的版本PostgreSQL会自身含有最新的时区信息。
--------------------------------------------------------------------------------
用户客户端问题
2.1) 我们可以用什么语言和PostgreSQL打交道?
PostgreSQL(缺省情况)只安装有C和内嵌式C的接口,其他的接口都是独立的项目,能够分别下载,这些接口项目独立的好处 是他们可以有各自的发布计划和各自独立的开发组。
一些编程语言如PHP都有访问PostgreSQL的接口,Perl、TCL、Python以及很多其他语言的接口在 http://gborg.postgresql.org网站上的Drivers/Interfaces小节可找到, 并且通过Internet很容易搜索到。
2.2) 有什么工具可以把PostgreSQL用于 Web 页面?
一个介绍以数据库为后台的挺不错的站点是:http://www.webreview.com。
对于 Web 集成,PHP 是一个极好的接口。它在http://www.php.net/。
对于复杂的任务,很多人采用 Perl 接口和 使用CGI.pm的DBD: g 或 mod_perl 。
2.3)PostgreSQL拥有图形用户界面吗?
商业用户或是开源开发人员能找到很多的有关PostgreSQL的GUI图形工具软件,在 PostgreSQL社区文档有一个详细的列表。
--------------------------------------------------------------------------------
系统管理问题
3.1)我怎样能把PostgreSQL装在 /usr/local/pgsql 以外的地方?
在运行 configure 时加上 --prefix 选项。
3.2) 我如何控制来自其他电脑的连接?
缺省情况下,PostgreSQL只允许来自本机且通过 unix 域套接字或TCP/IP方式的连接。 你只有在修改了配置文件postgresql.conf中的listen_addresses,且也在配置文件$PGDATA/pg_hba.conf中打开了 基于远程电脑( host-based )的身份认证,并重新启动PostgreSQL,否则其他电脑是不能与你的PostgreSQL服务器进行连接的。
3.3) 我怎样调整数据库引擎以获得更好的性能?
有三个主要方面可以提升PostgreSQL的潜能。
查询方式的变化
这主要涉及修改查询方式以获取更好的性能:
创建索引,包括表达式和部分索引;
使用COPY语句代替多个Insert语句;
将多个SQL语句组成一个事务以减少提交事务的开销;
从一个索引中提取多条记录时使用CLUSTER;
从一个查询结果中取出部分记录时使用LIMIT;
使用预编译式查询(Prepared Query);
使用ANALYZE以保持精确的优化统计;
定期使用 VACUUM 或 pg_autovacuum
进行大量数据更改时先删除索引(然后重建索引)
服务器的配置
配置文件postgres.conf中的很多设置都会影响性能,所有参数的列表可见: 管理员指南/数据库服务器运行环境/数据库服务器运行配置, 有关参数的解释可见:http://www.varlena.com/varlena/G ... notated_conf_e.html 和 http://www.varlena.com/varlena/GeneralBits/Tidbits/perf.html。
硬件的选择
计算机硬件对性能的影响可浏览 http://candle.pha.pa.us/main/wri ... formance/index.html 和 http://www.powerpostgresql.com/PerfList/。
3.4)PostgreSQL里可以获得什么样的调试特性?
PostgreSQL 有很多类似 log_* 的服务器配置变量可用于查询的打印和进程统计,而这些工作对调试和性能测试很有帮助。
3.5) 为什么在试图连接时收到“Sorry, too many clients(已有太多用户连接)”消息?
这表示你已达到缺省100个并发后台进程数的限制,你需要通过修改postgresql.conf文件中的max_connections值来 增加postmaster的后台并发处理数,修改后需重新启动postmaster。
3.6)PostgreSQL的升级过程有哪些内容 ?
PostgreSQL 开发组对每次小版本的升级主要只做了一些Bug修正工作,因此从 7.4.8 升级到 7.4.9 不需要 dump 和 restore,仅需要停止数据库服务器,安装更新后的软件包,然后重启服务器即可。
所有PostgreSQL的用户应该在最接近(你所使用的主版本)的小改进版本发布尽快升级。尽管每次升级可能都有一点风险,PostgreSQL的小改进版仅仅是设计用来修正一些Bug的,代码改动较少,所以风险还是很小的。PostgreSQL社区认为一般情况下不升级的风险还是多于升级的。
主版本的升级(例如从 7.3 到 7.4)通常会修改系统表和数据表的内部格式。 这些改变一般比较复杂,因此我们不维持数据文件的向后兼容性。因此从老版本中进行数据导出(dump)/然后在新版本中进行数据导入(reload)对主版本的升级是必须的。
3.7)(使用PostgreSQL)我需要使用什么计算机硬件 ?
由于计算机硬件大多数是兼容的,人们总是倾向于相信所有计算机硬件质量也是相同的。事实上不是, ECC RAM(带奇偶校验的内存),SCSI (硬盘)和优质的主板比一些便宜货要更加可靠且具有更好的性能。PostgreSQL几乎可以运行在任何硬件上, 但如果可靠性和性能对你的系统很重要,你就需要全面的研究一下你的硬件配置了。在我们的邮件列表上也有关于 硬件配置和性价比的讨论。
--------------------------------------------------------------------------------
操作问题
4.1) 如何只选择一个查询结果的头几行?或是随机的一行?
如果你只是要提取几行数据,并且你在执行查询中知道确切的行数,你可以使用LIMIT功能。 如果有一个索引与 ORDER BY中的条件匹配,PostgreSQL 可能就只处理要求的头几条记录, (否则将对整个查询进行处理直到生成需要的行)。如果在执行查询功能时不知道确切的记录数, 可使用游标(cursor)和FETCH功能。
可使用以下方法提取一行随机记录的:
SELECT cols
FROM tab
ORDER BY random()
LIMIT 1 ;
4.2) 如何查看表、索引、数据库以及用户的定义?如何查看psql里用到的查询指令并显示它们?
在psql中使用 \dt 命令来显示数据表的定义,要了解psql中的完整命令列表可使用\? ,另外,你也可以阅读 psql 的源代码 文件pgsql/src/bin/psql/describe.c,它包括为生成psql反斜杠命令的输出的所有 SQL 命令。你还可以带 -E 选项启动 psql, 这样它将打印出你在psql中所给出的命令执行时的内部实际使用的SQL查询语句。PostgreSQL也提供了一个兼容SQL的INFORMATION SCHEMA接口, 你可以从这里获取关于数据库的信息。
在系统中也有一些以pg_ 打头的系统表也描述了表的定义。
使用 psql -l 指令可以列出所有的数据库。
也可以浏览一下 pgsql/src/tutorial/syscat.source文件,它列举了很多可从数据库系统表中获取信息的SELECT语法。
4.3) 如何更改一个字段的数据类型?
在8.0版本里更改一个字段的数据类型很容易,可使用 ALTER TABLE ALTER COLUMN TYPE 。
在以前的版本中,可以这样做:
BEGIN;
ALTER TABLE tab ADD COLUMN new_col new_data_type;
UPDATE tab SET new_col = CAST(old_col AS new_data_type);
ALTER TABLE tab DROP COLUMN old_col;
COMMIT;
你然后可以使用VACUUM FULL tab 指令来使系统收回无效数据所占用的空间。
4.4) 单条记录,单个表,单个数据库的最大限制是多少?
下面是一些限制:
单个数据库最大尺寸? 无限制(已存在有 32TB 的数据库)
单个表的最大尺寸? 32 TB
一行记录的最大尺寸? 1.6 TB
一个字段的最大尺寸? 1 GB
一个表里最大行数? 无限制
一个表里最大列数? 250-1600 (与列类型有关)
一个表里的最大索引数量? 无限制
当然,实际上没有真正的无限制,还是要受可用磁盘空间、可用内存/交换区的制约。 事实上,当上述这些数值变得异常地大时,系统性能也会受很大影响。
单表的最大大小 32 TB 不需要操作系统对单个文件也需这么大的支持。大表用多个 1 GB 的文件存储,因此文件系统大小的限制是不重要的。
如果缺省的块大小增长到 32K ,最大的单表大小和最大列数还可以增加到四倍。
有一个限制就是不能对大小多于2000字节的列创建索引。幸运地是这样的索引很少用到。通过对多字节列的内容进行MD5哈稀运算结果进行函数索引可对列的唯一性得到保证, 并且全文检索允许对列中的单词进行搜索。
4.5) 存储一个典型的文本文件里的数据需要多少磁盘空间?
一个 Postgres 数据库(存储一个文本文件)所占用的空间最多可能需要相当于这个文本文件自身大小5倍的磁盘空间。
例如,假设有一个 100,000 行的文件,每行有一个整数和一个文本描述。 假设文本串的平均长度为20字节。文本文件占用 2.8 MB。存放这些数据的PostgreSQL数据库文件大约是 6.4 MB:
28 字节: 每行的头(大约值)
24 字节: 一个整数型字段和一个文本型字段
+ 4 字节: 页面内指向元组的指针
----------------------------------------
56 字节每行
PostgreSQL 数据页的大小是 8192 字节 (8 KB),则:
8192 字节每页
------------------- = 146 行/数据页(向下取整)
56 字节每行
100000 数据行
-------------------- = 685 数据页(向上取整)
146 行/数据页
685 数据页 * 8192 字节/页 = 5,611,520 字节(5.6 MB)
索引不需要这么多的额外消耗,但也确实包括被索引的数据,因此它们也可能很大。
空值NULL存放在位图中,因此占用很少的空间。 |
|