PostgreSQL 最佳实践
对于数据与元数据分离存储的分布式文件系统,元数据的读写性能直接影响整个系统的工作效率,元数据的安全也直接关系着整个系统的数据安全。
在生产环境中,建议您优先选择云计算平台提供的托管型云数据库,并搭配恰当的高可用性架构。
不论自行搭建,还是采用云数据库,使用 JuiceFS 应该始终关注元数据的完整和安全。
通信安全
默认情况下,JuiceFS 客户端会采用 SSL 加密协议连接 PostgreSQL,如果数据库未启用 SSL 加密,则需要在元数据 URL 中需要附加 sslmode=disable
参数。
建议配置并始终开启数据库服务端 SSL 加密。
通过环境变量传递数据库信息
虽然直接在元数据 URL 中设置数据库密码简单方便,但日志或程序输出中可能会泄漏 密码,为了保证数据安全,应该始终通过环境变量传递数据库密码。
环境变量名称可以自由定义,例如:
export $PG_PASSWD=mypassword
在元数据 URL 中通过环境变量传递数据库密码:
juicefs mount -d "postgres://user:$PG_PASSWD@192.168.1.6:5432/juicefs" /mnt/jfs
定期备份
请参考官方手册 Chapter 26. Backup and Restore 了解如何备份和恢复数据库。
建议制定数据库备份计划,并遵照计划定期备份 PostgreSQL 数据库,与此同时,还应该在实验环境中尝试恢复数据,确认备份是有效的。
使用连接池
连接池是客户端与数据库之间的中间层,由它作为中介提升连接效率,降低短连接的损耗。常用的连接池有 PgBouncer 和 Pgpool-II 。
高可用
PostgreSQL 官方文档 High Availability, Load Balancing, and Replication 对比了几种常用的数据库高可用方案,请根据实际业务需要选择恰当的高可用方案。
JuiceFS 使用事务保证元数据操作的原子性。由于 PostgreSQL 尚不支持 Multi-Shard (Distributed) 分布式事务,因此请勿将多服务器分布式架构用于 JuiceFS 元数据存储。