常规方法
数据量较小或者请求量不大的情况下,可以直接通过db.coll.ensureIndex({})建立,相关的参数可以 参考文档.
数据量较大时的通用方法
在数据量较大或请求量较大,直接建立索引对性能有显著影响时,可以利用复制集(数据量较大时一般为线上环境,使用复制集为必然选择.)中部分机器宕机不影响复制集工作的特性,轮转建立索引.
在复制集中,首先停掉一台从节点,去掉--replSet启动参数,更换启动端口--port,将节点以单机模式启动,此时对复制集而言,此节点不存活,请求也不会发往此节点.之后在需要建立索引的集合中直接建立索引.
上一步骤完成后,将启动文件恢复,正常启动节点,等待数据同步,数据同步完成后,对另一从节点执行相同的操作.
在所有从节点操作完成后,停掉主节点,执行相同操作.
对于集群,可以在多个分片之间并行操作.
本来是想做类似Mysql在线建立索引的方式,实际操作遇到问题,Mysql可以在A表做触发器,保存A表独有的操作日志,而MongoDB的oplog为实例共有,在进行B集合的写入时,oplog同样在新增,会造成oplog写入过快,很可能在B完成对A的初始拷贝之前就已经走完一圈,导致A的操作记录不能被完整保存.
结论
综上所述,对数据量较大的MongoDB集合,利用复制集的特性,离线轮转建立索引是合适的解决办法.
跟mysql一样,先在从库建索引,再切换到主库 |