在Debian或Ubuntu上使用Patroni部署PostgreSQL实现高可用性¶
本指南提供了如何在Debian或Ubuntu上使用Patroni建立一个高可用的PostgreSQL集群的说明。
先决条件¶
对于这个设置,我们将使用运行在Ubuntu 20.04上的节点作为基本操作系统,并具有以下IP地址:
| 节点名称 | 公网IP地址 | 内部IP地址 |
|---|---|---|
| node1 | 157.230.42.174 | 10.104.0.7 |
| node2 | 68.183.177.183 | 10.104.0.2 |
| node3 | 165.22.62.167 | 10.104.0.8 |
| HAProxy-demo | 134.209.111.138 | 10.104.0.6 |
请注意
在生产(甚至非生产)设置中,PostgreSQL节点将在一个私有子网中,没有任何到Internet的公共连接,而HAProxy将在另一个子网中,只允许客户端流量来自选定的IP范围。为了简单起见,我们在DigitalOcean VPS环境中实现了这种架构,每个节点都可以通过其内部私有IP访问其他节点。
中设置主机名设置文件¶
为了使节点能够相互感知并允许它们无缝通信,需要将它们的主机名解析为它们的公共IP地址。修改设置各节点文件如下:
| 节点1 | 节点2 | 节点3 |
|---|---|---|
127.0.0.1 localhost node1 |
127.0.0.1 localhost node2 |
127.0.0.1 localhost node3 |
的设置HAProxy-demo节点的文件如下所示:
127.0.1.1 HAProxy-demo HAProxy-demo 127.0.0.1 localhost 10.104.0.6 HAProxy-demo 10.104.0.7 node1 10.104.0.2 node2 10.104.0.8 node3
为Postgre雷竞技下载官网SQL安装Percona发行版¶
遵循安装说明为PostgreSQL雷竞技下载官网安装Percona发行版
node1,node2和node3。删除数据目录。Patroni需要一个干净的环境来初始化一个新的集群。使用如下命令停止PostgreSQL服务,然后删除数据目录:
美元sudosystemctl停止postgresql美元sudorm射频/var/lib/postgresql/14/main
配置ETCD分布式存储¶
分布式配置存储有助于在故障转移期间在节点之间建立共识,并将管理三个PostgreSQL实例的配置。尽管Patroni可以与其他分布式共识商店(即Zookeeper, Consul等)一起工作,但最常用的是etcd。
的etcd集群首先在一个节点中启动,然后使用添加命令。配置保存在/etc/default/etcd文件。
安装
etcd在每个PostgreSQL节点上执行以下命令:美元sudo恰当的安装etcd修改
/etc/default/etcd每个节点上的配置文件。- 在
node1的IP地址node1到ETCD_INITIAL_CLUSTER参数。配置文件如下所示:
ETCD_NAME=node1 etcd_initial_cluster_cluster ="node1=http://10.104.0.7:2380" ETCD_INITIAL_CLUSTER_TOKEN="devops_token" ETCD_INITIAL_CLUSTER_STATE="new" etcd_initial_advertise_peer_url ="http://10.104.0.7:2380" ETCD_DATA_DIR="/var/lib/etcd/postgresql" etcd_listen_peer_url ="http://10.104.0.7:2380" etcd_listen_client_url ="http://10.104.0.7:2379,http://localhost:2379" etcd_advertise_client_url ="http://10.104.0.7:2379"…- 在
node2,添加两者的IP地址node1和node2到ETCD_INITIAL_CLUSTER参数:
ETCD_NAME=node2 ETCD_INITIAL_CLUSTER="node1=http://10.104.0.7:2380,node2=http://10.104.0.2:2380" ETCD_INITIAL_CLUSTER_TOKEN="devops_token" ETCD_INITIAL_CLUSTER_STATE="existing" etcd_initial_advertise_peer_url ="http://10.104.0.2:2380" ETCD_DATA_DIR="/var/lib/etcd/postgresql" etcd_listen_peer_url ="http://10.104.0.2:2380" etcd_listen_client_url ="http://10.104.0.2:2379,http://localhost:2379" etcd_advertise_client_url ="http://10.104.0.2:2379"…- 在
node3,ETCD_INITIAL_CLUSTER参数中包含三个节点的IP地址:
ETCD_NAME = node3 ETCD_INITIAL_CLUSTER = " node1 = http://10.104.0.7:2380, node2 = http://10.104.0.2:2380, node3 = http://10.104.0.8:2380”ETCD_INITIAL_CLUSTER_TOKEN =“devops_token ETCD_INITIAL_CLUSTER_STATE”=“现有”ETCD_INITIAL_ADVERTISE_PEER_URLS = " http://10.104.0.8:2380 " ETCD_DATA_DIR = " / var / lib / etcd / postgresql”ETCD_LISTEN_PEER_URLS = " http://10.104.0.8:2380 " ETCD_LISTEN_CLIENT_URLS = " http://10.104.0.8:2379, http://localhost: 2379 " ETCD_ADVERTISE_CLIENT_URLS = " http://10.104.0.8:2379 "……- 在
在
node1,添加node2和node3属性设置到集群添加命令:美元sudoetcdctl成员添加node2http://10.104.0.2:2380美元sudoetcdctl成员添加node3http://10.104.0.8:2380重新启动
etcd服务node2和node3:美元sudosystemctl重新启动etcd查看etcd集群成员。
美元sudoetcdctl成员列表输出如下所示:
21d50d7f768f153a: name=node1 peerURLs=http://10.104.0.7:2380 clientURLs=http://10.104.0.7:2379 isLeader=true af4661d829a39112: name=node2 peerURLs=http://10.104.0.2:2380 clientURLs=http://10.104.0.2:2379 isLeader=false e3f3c0c1d12e9097: name=node3 peerURLs=http://10.104.0.8:2380 clientURLs=http://10.104.0.8:2379 isLeader=false
设置看门狗服务¶
Linux内核使用名为监管机构防止系统反应迟钝。看门狗监视系统中不可恢复的raybet雷竞技竞猜在线官网应用程序错误、耗尽的系统资源等,并启动重新启动以安全返回系统到工作状态。看门狗功能对于那些打算在没有人为干预的情况下长时间运行的服务器非常有用。看门狗功能可以帮助维护服务,而不是用户发现一个挂起的服务器。
在本例中,我们将进行配置加密狗- Ubuntu 20.04附带的看门狗标准软件实现。
在所有三个PostgreSQL节点上完成以下步骤加载和配置Softdog。
加载软件狗:
美元sudo上海- c“echo "softdog" >> /etc/modules”Patroni将与看门狗服务交互。因为守护神是由
postgres用户,该用户必须具有访问Softdog的权限。的所有权要实现这一点,请更改watchdog.rules文件到postgres用户:美元sudo上海- c'echo "KERNEL==\"watchdog\", OWNER=\"postgres\", GROUP=\"postgres\"" >> /etc/udev/rules.d/61-watchdog.rules'将“Softdog”移出黑名单。
- 找出软狗被列入黑名单的文件:
美元grep黑名单/lib/modprobe.d/*/etc/modprobe.d/*|grep加密狗在我们的例子中,
modprobe将Softdog列入黑名单:/lib/modprobe.d/blacklist_linux_5.4.0 - 73 generic.conf:黑名单加密狗- 删除
黑名单软件狗从/lib/modprobe.d/blacklist_linux_5.4.0 - 73 generic.conf文件。 - 重新启动服务
美元sudomodprobe加密狗- 验证
modprobe运行lsmod命令:
美元sudolsmod|grep加密狗如果正在运行,输出将显示一个进程标识符。
软狗16384 0检查Softdog文件是否在
/dev/文件夹属于postgres用户:
美元ls- l/dev/watchdog* crw-rw——1postgrespostgres10,1309月1112: 53/dev/watchdog crw——1根根245,09月1112: 53/dev/watchdog0
提示
如果因任何原因未变更,可执行以下命令手动修改。
美元sudo乔恩postgres: postgres/dev/watchdog*
配置Patroni¶
在每个PostgreSQL节点上安装Patroni:
美元sudo恰当的安装雷竞技下载官网percona-patroni创建
patroni.yml配置文件。/etc/patroni目录中。该文件包含PostgreSQL集群的默认配置值,并将反映当前集群设置。添加以下配置
node1:范围:stampede1名字:node1restapi:听:0.0.0.0:8008connect_address:node1:8008etcd:宿主:node1:2379引导:#初始化新集群后,此节将被写入Etcd:/<命名空间>/<作用域>/configdcs:ttl:30.loop_wait:10retry_timeout:10maximum_lag_on_failover:1048576# primary_start_timeout: 300# synchronous_mode: falsepostgresql:use_pg_rewind:真正的use_slots:真正的参数:wal_level:副本hot_standby:“上”logging_collector:“上”max_wal_senders:5max_replication_slots:5wal_log_hints:“上”# archive_mode:“对”# archive_timeout: 600#archive_command: "cp -f %p /home/ postgresql / archived_% f"# recovery_conf:#restore_command: cp /home/postgres/archived/%f %p .使用实例# initdb的一些选项initdb:#注意:它需要是一个列表(一些选项需要值,其他是开关)-编码:use UTF8-data-checksumspg_hba:#运行'initdb'后在pg_hba.conf中添加以下行-主机所有所有10.104.0.7/32 md5-主机复制复制器127.0.0.1/32 trust-主机所有所有10.104.0.2/32 md5-主机所有所有10.104.0.8/32 md5-Host all all 10.104.0.6/32 trust# - hostssl all all 0.0.0.0/0 md5#在初始集群创建后启动的附加脚本(将连接URL作为参数传递)# post_init: /usr/local/bin/setup_cluster.sh#一些额外的用户初始化新集群后需要创建的用户用户:管理:密码:管理选项:-createrole-createdb复制因子:密码:密码选项:-复制postgresql:听:0.0.0.0:5432connect_address:node1:5432data_dir:" / var / lib / postgresql / 14 /主”bin_dir:“/ usr / lib / postgresql / 14 / bin”# config_dir:pgpass:/ tmp / pgpass0身份验证:复制:用户名:复制因子密码:密码超级用户:用户名:postgres密码:密码参数:unix_socket_directories:/ var /运行/ postgresql的监管机构:模式:要求#允许的值:关闭,自动,必需设备:/dev/watchdogsafety_margin:5标签:nofailover:假noloadbalance:假clonefrom:假nosync:假Patroni配置文件
让我们花点时间来理解
patroni.yml文件。第一部分提供第一个节点的详细信息(
node1)及其连接端口。在那之后,我们有etcd服务及其端口详细信息。在这些之后,有一个
引导部分,其中包含PostgreSQL配置和数据库初始化后运行的步骤。的pg_hba.conf条目指定可以连接到该节点的所有其他节点及其身份验证机制。为创建配置文件
node2和node3。将引用替换为node1与node2和node3,分别。在每个节点上启用并重新启动patroni服务。使用以下命令:
美元sudosystemctl启用patroni美元sudosystemctl重新启动patroni
当Patroni启动时,它根据配置文件的引导部分中的指令初始化PostgreSQL(因为服务当前没有运行并且数据目录是空的)。
故障排除Patroni
为了确保Patroni已经正常启动,请使用以下命令检查日志:
美元sudojournalctl- upatroni.service- nOne hundred.- f
输出不应该显示任何错误:
…Sep 23 12:50:21 node01 systemd[1]:已启动PostgreSQL高可用性管理器。Sep 23 12:50:22 node01 patroni[10119]: 2021-09-23 12:50:22,022 INFO: Selected new etcd server http://10.104.0.2:2379 Sep 23 12:50:22 node01 patroni[10119]: 2021-09-23 12:50:22,029 INFO: No PostgreSQL configuration items changed, nothing to reload。Sep 23 12:50:22 node01 patroni[10119]: 2021-09-23 12:50:22,168 INFO:锁的所有者:无;I am node1 Sep 23 12:50:22 node01 patroni[10119]: 2021-09-23 12:50:22,177 INFO: trying to bootstrap a new cluster Sep 23 12:50:22 node01 patroni[10140]:属于该数据库系统的文件将由用户"postgres"拥有。Sep 23 12:50:22 node01 patroni[10140]:该用户还必须拥有服务器进程。Sep 23 12:50:22 node01 patroni[10140]:数据库集群将初始化区域设置为“C.UTF-8”。Sep 23 12:50:22 node01 patroni[10140]:默认的文本搜索配置将被设置为“english”。Sep 23 12:50:22 node01 patroni[10140]:启用数据页校验和。Sep 23 12:50:22 node01 patroni[10140]: creating directory /var/lib/postgresql/12/main…ok Sep 23 12:50:22 node01 patroni[10140]: creating subdirectories… ok Sep 23 12:50:22 node01 patroni[10140]: selecting dynamic shared memory implementation ... posix Sep 23 12:50:22 node01 patroni[10140]: selecting default max_connections ... 100 Sep 23 12:50:22 node01 patroni[10140]: selecting default shared_buffers ... 128MB Sep 23 12:50:22 node01 patroni[10140]: selecting default time zone ... Etc/UTC Sep 23 12:50:22 node01 patroni[10140]: creating configuration files ... ok Sep 23 12:50:22 node01 patroni[10140]: running bootstrap script ... ok Sep 23 12:50:23 node01 patroni[10140]: performing post-bootstrap initialization ... ok Sep 23 12:50:23 node01 patroni[10140]: syncing data to disk ... ok Sep 23 12:50:23 node01 patroni[10140]: initdb: warning: enabling "trust" authentication for local connections Sep 23 12:50:23 node01 patroni[10140]: You can change this by editing pg_hba.conf or using the option -A, or Sep 23 12:50:23 node01 patroni[10140]: --auth-local and --auth-host, the next time you run initdb. Sep 23 12:50:23 node01 patroni[10140]: Success. You can now start the database server using: Sep 23 12:50:23 node01 patroni[10140]: /usr/lib/postgresql/14/bin/pg_ctl -D /var/lib/postgresql/14/main -l logfile start Sep 23 12:50:23 node01 patroni[10156]: 2021-09-23 12:50:23.672 UTC [10156] LOG: redirecting log output to logging collector process Sep 23 12:50:23 node01 patroni[10156]: 2021-09-23 12:50:23.672 UTC [10156] HINT: Future log output will appear in directory "log". Sep 23 12:50:23 node01 patroni[10119]: 2021-09-23 12:50:23,694 INFO: postprimary pid=10156 Sep 23 12:50:23 node01 patroni[10165]: localhost:5432 - accepting connections Sep 23 12:50:23 node01 patroni[10167]: localhost:5432 - accepting connections Sep 23 12:50:23 node01 patroni[10119]: 2021-09-23 12:50:23,743 INFO: establishing a new patroni connection to the postgres cluster Sep 23 12:50:23 node01 patroni[10119]: 2021-09-23 12:50:23,757 INFO: running post_bootstrap Sep 23 12:50:23 node01 patroni[10119]: 2021-09-23 12:50:23,767 INFO: Software Watchdog activated with 25 second timeout, timing slack 15 seconds Sep 23 12:50:23 node01 patroni[10119]: 2021-09-23 12:50:23,793 INFO: initialized a new cluster Sep 23 12:50:33 node01 patroni[10119]: 2021-09-23 12:50:33,810 INFO: no action. I am (node1) the leader with the lock Sep 23 12:50:33 node01 patroni[10119]: 2021-09-23 12:50:33,899 INFO: no action. I am (node1) the leader with the lock Sep 23 12:50:43 node01 patroni[10119]: 2021-09-23 12:50:43,898 INFO: no action. I am (node1) the leader with the lock Sep 23 12:50:53 node01 patroni[10119]: 2021-09-23 12:50:53,894 INFO: no action. I am (node1) the leader with the
一个常见的错误是Patroni抱怨pg_hba.conf文件中缺少适当的条目。如果看到此类错误,必须手动添加或修复该文件中的条目,然后重新启动服务。
改变守护神。yml文件和重新启动服务在这里不会有任何影响,因为bootstrap部分指定了在节点中首次启动PostgreSQL时应用的配置。即使修改了Patroni配置文件并重新启动了服务,它也不会重复该过程。
如果Patroni已经正常启动,您应该能够使用以下命令本地连接到PostgreSQL节点:
美元sudopsql- upostgres
回显信息如下:
psql(14.1)输入“help”来获取帮助。postgres = #
HAProxy配置¶
HAProxy节点将接受客户端连接请求,并将其路由到PostgreSQL集群的主节点。这样,客户机应用程序就不必知道底层集群中的哪个节点是当前的主节点。它所需要做的就是访问一个HAProxy URL并在那里发送读/写请求。在幕后,HAProxy将连接路由到健康节点(只要至少有一个健康节点可用),并确保客户端应用程序请求永远不会被拒绝。
HAProxy能够以轮询方式将写请求路由到主节点,将读请求路由到辅助节点,这样就不会不必要地加载辅助实例。为了实现这一点,在HAProxy配置文件中提供不同的端口。在此部署中,写操作路由到端口5000,读操作路由到端口5001。
上安装HAProxy
HAProxy-demo节点:美元sudo恰当的安装雷竞技下载官网percona-haproxyHAProxy的配置文件路径为:
/etc/haproxy/haproxy.cfg。在此文件中指定以下配置。100年全球maxconn默认日志全球模式tcp重试2客户机超时30 m超时连接4 s超时服务器30 m超时检查5 s听统计模式http绑定*:7000年统计数据支持数据uri /听主要结合*:5000选项httpchk /一级http-check期待地位200默认的服务器国米3 s下降3上升2 on-marked-down shutdown-sessions服务器node1 node1:5432 maxconn 100检查端口8008服务器node2 node2:5432 maxconn 100检查端口8008服务器node3 node3:5432 maxconn 100检查端口8008Listen standby balance roundrobin bind *:5001 option HTTPCHK /replica http-check expect status 200 default-server inter 3s fall 3 rise 2 on-标记-down shutdown-sessions server node1 node1:5432 maxconn 100 check port 8008 server node2 node2:5432 maxconn 100 check port 8008 server node3 node3:5432 maxconn 100 check port 8008HAProxy将使用Patroni托管的REST api来检查每个PostgreSQL节点的健康状态,并适当地路由请求。
HAProxy重启:
美元sudosystemctl重新启动haproxy检查HAProxy日志,看看是否有任何错误:
美元sudojournalctl- uhaproxy.service- nOne hundred.- f
测试¶
看到测试PostgreSQL集群关于如何测试您的PostgreSQL集群的复制,故障,切换的指导方针。
创建:2021年12月15日