PostgreSQL Replication을 이용한 다중화 구성

 

PostgreSQL Replication을 이용한 다중화 구성

PostgreSQL은 자체적으로 미러링을 해서 Slave를 만드는 다중화 구성 기능이 있습니다. Wal 파일을 이용해 실시간 스트리밍으로 Slave 노드에 데이터를 쌓아, 운영중인 Master 노드와 동일한 데이터를 보유하고, 장애시 Slave를 바로 Master로 승급시키면서 서비스 장애 시간을 최소화 시키는 기능입니다. VIP를 이용해 Master-Slave간의 접속을 유동적으로 구축하고, Slave가 Master로 승격되어도 같은 IP로 서비스를 유지할 수 있게 합니다. PostgreSQL의 다중화 구성은 Master-Slave-Slave 삼중화 구성을 권장하고 있습니다. 2대의 노드로 이중화 구성시 하나의 Slave가 Master로 승격이 되면 기존의 Master는 사용할 수 없고, Slave로 재구축을 해야하며, 재구축하는 동안 Slave가 없는 상태로 존재하기 때문입니다.

 

Master 노드에서 설정 해야 하는 것 들

postgresql.conf

wal_level = replica
max_wal_senders = 10
wal_keep_segments = 8
archive_mode = on
archive_command = 'true'

위 5개의 파라미터는 반드시 설정 되어야 하는 값 입니다. 주요 파라미터가 같는 의미를 알아보고 추가적으로 Replication 동작에 연관이 있는 파라미터를 알아보록 합시다.

 

wal_level

WAL (Write Ahead Log)에 기록되는 정보의 양을 결정한다. 9.4이하 버전에서는 archive 이상, 9.6이상 버전에서는 replica 이상으로 설정한다.

  • minimal: 기본값은 충돌 또는 즉시 셧다운으로부터 복구하기 위해 필요한 정보만 기록한다.
  • archive: Wal 아카이브에 필요한 로깅만 추가한다. (9.6 버전부터는 hot_standby와 archive 모두 replica로 대체 되었다.)
  • replica: 9.4버전까지는 hot_standby였다. 9.6 버전부터는 replica라는 값으로 대체 되었고, Slave 노드에서 읽기 전용 쿼리에 필요한 정보를 좀 더 추가 한다.
  • logical: 논리적 디코딩을 지원하는데 필요한 정보를 추가한다.

wal_level을 logical 까지 올리면 replica에서 사용하는 정보 뿐만 아니라 WAL로부터 논리적 변경세트를 사용하는데 필요한 정보도 로깅 되기 때문에, WAL의 볼륨이 증가한다.

max_wal_sanders

스트리밍 기반의 백업 클라이언트로부터의 동시 연결 최대 수를 지정한다. 기본값은 복제를 하지않는 0이며, WAL Sender 프로세서는 max_connections 보다 큰 값을 설정 할 수 없다. 스트리밍 클라이언트의 연결이 갑작스럽게 끊어지면 타임아웃이 될때까지 orphan slot이 생기기 때문에, 예상 되는 클라이언트의 최대 수 보다 약간 크게 설정해야 한다. 그래서 일반적으로 slave의 수+1 로 많이 설정을 한다.

wal_keep_segments

Slave노드가 스트리밍 복제를 위해 예전 로그파일을 가져와야 하는 경우 pg_xlog 디렉토리에 저장되는 과거 로그 파일 세그먼트의 최소 수를 지정한다. 각 wal segment의 사이즈는 16MB이다. wal segment가 너무 빨리 갱신 되어 빠른 속도로 사라지게 되고, slave 노드에 기록되는 wal segment가 master노드의 wal의 갱신 속도를 따라가지 못한다면, replication이 중단되며, Downstream 연결 역시 실패 한다. Maximum 수가 지정 되어 있지 않기 때문에서 서버의 디스크 공간, 그리고 DB 트랜잭션에 따른 wal의 갱신 속도를 고려해서 설정값을 찾아야 한다.

archive_mode

아카이브 모드가 사용되는것으로 설정되면, wal segment가 archive_command설정에 의해   아카이브 저장소로 전달 된다. 쉽게 생각하면 pg_xlog에 생성되는 wal segment를 다른 archive 디렉토리를 만들어서 그 곳으로 전달한다고 보면 된다. pg_xlog에 생성되는 wal segment들은 wal_keep_segments에 의해 지정된 숫자를 넘기면 삭제되기 때문에, 지나간 wal segment를 아카이브로 저장하는 것이다. wal_level이 minimal인 경우는 아카이브 모드를 사용할 수 없다.

archive_command

완료된 wal segment를 아카이브 하기위해 실행하는 로컬 쉘 명령. %p는 아카이브할 파일의 경로명으로 대체 되고, %f는 파일명으로 대체된다 (%문자를 명령에 포함하려면 %%으로 사용).

  • ex) archive_command = ‘cp %p /var/lib/edb/as9.6/archive/%f’ 이렇게 설정하면 pg_xlog에 있는 wal segment를 var/lib/edb/as9.6/archive/밑에 파일로 복사하라는 것이 된다.
  • archive_command = ‘true’로 설정하면 wal segment는 계속 만들어지지만, 아카이빙은 되지 않기 때문에 복구의 필요한 WAL 파일의 체인이 단절되는 현상이 발생한다.  지나간 WAL파일을 사용할 수 없다는 이야기다.

 

pg_hba.conf

# replication privilege.
local   replication     all                                     trust
host    replication     all             127.0.0.1/32            trust
host    replication     all             ::1/128                 trust
host    replication     replica_user    192.168.10.0/24         trust

replication privilege 부분을 설정해 줘야 합니다.

pg_hba.conf는 DB의 접속 제한을 관리 하는데, 이곳에 repliaction 용도로 사용할 유저, 호스트, ip 등을 설정해 줘야 해당 slave노드의 클라이언트가 Master노드로 접속 할 수 있습니다. 클라이언트 서버의 PostgreSQL Master 노드로의 인증 방식에 대한 설정은 pg_hba.conf 포스팅을 참고하면 됩니다.

 

User 생성

일반적으로 superuser인 postgres 계정을 사용해되 되나, 보안에 치명적인 문제가 있기 때문에, replication 전용 유저를 생성해주는 편이 좋습니다.

postgres=# CREATE USER replica_user WITH PASSWORD 'secret_password' replication;

해당 유저로는 replication을 위한 접속만 가능하며, 다른 기능엔 제한이 있습니다.

 

Slave 노드에서 설정해야 하는 것들

postgersql.conf

hot_standby = on

hot_standby

DB가 Standby 상태로 스트리밍 복제가 이루어지는 Slave노드에는 반드시 on으로 설정되어 있어야 한다.

 

recover.conf

recovery_target_timeline = 'latest'
standby_mode = on
primary_conninfo = 'host=Master IP port=5432 user=replica_user'
trigger_file =
restore_command = 'cp /var/lib/edb/as9.6/archive/%f %p'

primary_conninfo

마스터 노드의 정보를 입력한다. md5 인증을 쓴다면 password를 설정해줘야하고, repliacation에 사용 할 유저정보를 입력한다.

recovery_target_timeline

복구할 특정 타임라인의 번호를 지정하는것인데, ‘latest’로 설정을 해야 가장 마지막 내용까지 복제를 한다.

standby_mode

스탠바이 모드를 on으로 해야 PostgreSQL DB가 구동 될 때, Standby 모드로 올라온다.

trigger_file

9.2 이상 버전에서는 사용하지는 않는다고 하는데, 9.6에서도 사용은 가능하다. trigger로 지정한 파일이 없으면 standby 모드로 유지하고, 해당 파일이 생성되면 DB가 마스터로 승격된다. pg_basebackup등으로 복원할때 트리거 파일이 존재 하면, Standby 모드로 올라오긴 하는데 wal receiver 프로세서가 구동되질 않는다.

restore_command

아카이브를 가지고 DB를 복원할때 사용한다.

 

추가적인 PostgreSQL Replication 관련 파라미터

위와 같은 설정을 해놓고 pg_ctl 등의 구동 명령으로 DB를 구동하면, slave에는 wal receiver, Master에는 wal sander 프로세스가 활성화 되면서 replication이 이루어집니다. (ps -ef | grep wal) 위에 나열한 파라미터 값은 replication을 위한 최소 파라미터 설정입니다. 그 밖에 replication에 사용할 수 있는 파라미터 값을 알아봅시다.

 

max_replication_slots

서버가 지원 할 수 있는 복제 슬롯의 최대 수를 지정한다. 기본값은 0. 현재 존재하는 복제 슬롯 수보다 작은 값으로 설정하면 서버가 시작 되지 않는다.

wal_sander_timeout

지정된 밀리초 이상 작동되지 않은 복제 연결을 중단한다. 이 파라미터는 Master 노드가 slave노드와 충돌 했는지, 네트워크가 중단되었는지 검출할떄 유용하다. 기본값은 60초이고, 0은 타임아웃 매커니즘을 비활성화 한다.

synchronous_standby_names

스트리밍 복제 standby 서버를 쉼표로 구분된 목록으로 저장한다. slave의 wal receiver의 이름을 지정하는것이라고 생각하면 쉽니다.  만약 이 파라미터가 설정되어 있는데, 해당 이름을 가진 slave가 없다면, 다른 서버에서 복제 스트리밍을 정상적으로 요청해도 복제 작업이 이루어지지 않는다.

vacuum_defer_cleanup_age

VACUUM 및 Hot 업데이트가 dead row 버전 클린업을 연기하는 트랜잭션 수를 지정한다. 기본값은 0개의 트랜잭션.  마스터의 wal segment 트랜잭션이 standby에 기록되기 전이라 클린업의 조건에 도달하여도 wal segment가 사라지는 것을 막고, 유예기간을 줘서 slave에서 트랜잭션이 완료하기까지의 시간을 대기한다. 이 것은 master노드의 트랜잭션을 기준으로 삼고 동작을 하기 때문에 Standby 노드에서 트랜잭션 기록이 얼마나 걸리는지, 유예 시간이 얼마인지 예측이 어렵다. 따라서 마스터에서 이 파라미터를 설정하기 보다는 standby에서 hot_standby_feedback을 설정하는 편이 좋다.

max_standby_archive_deley

핫 스탠파이가 작동중이면, 적용직전의 WAL 항목과 충돌하는 standby 노드의 쿼리가 취소되기전에 standby노드가 기다려야 하는 시간을 결정한다. WAL데이터를 아카이브에서 읽어오는 경우 max_standby_archive_deley가 적용된다. 기본값은 30초. 지정 되지않으면 단위는 밀리초이다. -1 값은 쿼리 충돌이 완료 될때까지 Standby노드가 무한정 대기한다.

max_standby_streaming_deley

핫 스탠파이가 작동중이면, 적용직전의 WAL 항목과 충돌하는 standby 노드의 쿼리가 취소되기전에 standby노드가 기다려야 하는 시간을 결정한다. WAL 데이터를 스트리밍 복제를 통해 수신하는 경우 max_standby_streaming_deley가 적용된다. 기본값은 30초. 지정 되지않으면 단위는 밀리초이다. -1 값은 쿼리 충돌이 완료 될때까지 Standby노드가 무한정 대기한다.

wal_receiver_status_interval

Standby 노드의 wal receiver 프로세스가 sander 프로세스에 대한 정보를 운영서버 또는 업스트림 standby로 전송하는 최소 빈도를 지정한다. 이 것은 pg_stat_replication 뷰를 사용하여 볼수 있다. Standby 노드는 작성된 마지막 트랜잭션 로그의 위치 및 디스크에 기록한 마지막 위치, 적용된 마지막 위치를 알려준다.

hot_standby_feedback

핫 스탠바이가 standby 노드에서 현재 실행 중인 퀄리에 대해 Master노드 혹은 업스트림 Standby로 피드백을 전송할 것인지를 지정한다. 클린업 레코드에 의해 야기된 쿼리 취소를 없애는데 사용할 수 있지만, 일부 작업의 경우 부하가 생겨 Master 노드의 DB 팽창을 초래할수 있다.

wal_receiver_timeout

지정된 밀리초 이상 작동되지 않은 replication을 중지시킨다. 이 것은 Standby 노드가 운영 서버 충돌 또는 네트워크 중단을 검출할떄 유용하다. 0은 시스템 타임아웃 메커니즘을 비활성한다.

 

Replication 순서

1. Master 노드의 replication 설정 : postgresql.conf, pg_hba.conf, replication 유저 설정.

  • how archive_mode; -> on 이어야 Replication 가능
  • show archive_command; -> archive 경로 or true
  • show wal_level; -> replica 여야 Replication 가능
  • show max_wal_senders; -> 2이상이어야 Replication 가능
  • show hot_standby; -> on 이어야 Replication 가능

2. pg_basebackup tool 등을 가지고 streaming 복제를 한다.

pg_basebackup -h <MasterIP> -U replica_user -D $PGDATA --xlogdir /var/lib/edb/as9.6/xlog -X stream -P -T MasterTBS경로=/var/lib/edb/as9.6/data/tbs/NEW_TBS1
  • -h : Master 노드의 IP
  • -U : replication에 사용할 유저 계정
  • -D : $PGDATA, Master 노드의 init 명령을 클러스터가 생성된 위치
  • –xlog : pg_xlog의 경로를 지정
  • -X : replication 옵션을 지정. stream은 시실간 스트리밍 복제
  • -P : 복제시간동안 변경된부분을 반영한다.
  • -T : 테이블 스페이스를 지정한다. 이 옵션을 이용해 테이블 스페이스의 위치를 옮길수도 있다.

3. Slave 노드의 설정 : postgresql.conf, recovery.conf 설정

  • slave의 $PGDATA, tablespace, pg_xlog영역은 아무런 파일도 존재함 없이 비어있어야 한다.
  • recovery.conf에는 master ip와 replication 유저 정보가 정확히 기입 되어 있아야 한다.
  • pg_basebackup은 $PGDATA내의 내용을 있는 그대로 복사하기 때문에 트리거 파일이 해당 경로에 존재할 경우 삭제해줘야 한다.

4. Standby 노드의 DB를 구동

  • pg_ctl start -D $PGDATA -w
  • ps -ef | grep wal 을 리눅스 shell 프롬프트에서 입력했을때, master 노드 wal sander, slave 노드 wal receiver 프로세서가 떠있으면 성공

 

PostgreSQL의 다중화 작업이 완료되면, Failover 구성을 할 수 있는데, Community 버전인 PostgreSQL은 pg_pool을 이용하고, 상용버전인 EDB는 EFM모듈을 이용하여 구성합니다. EFM모듈을 통해 Failover를 구성하면 witness라는 감시 노드가 추가 됩니다. 어느 노드가 현재 마스터인지를 파악하고, 장애시 slave를 master로 승격하는 기능을 합니다. witness 노드는 efm 모듈만 올라가고 DB는 설치되지 않습니다.

 

Replication 동작 확인 Query

Sender Node

postgres=# select pid, usesysid, usename, application_name, client_addr, backend_start, state, sent_lsn, write_lsn, flush_lsn, replay_lsn, sync_state from pg_stat_replication;
 pid  | usesysid |   usename    | application_name |  client_addr   |         backend_start         |   state   | sent_lsn  | write_lsn | flush_lsn | replay_lsn | sync_state 
------+----------+--------------+------------------+----------------+-------------------------------+-----------+-----------+-----------+-----------+------------+------------
 9174 |    16384 | replica_user | walreceiver      | 192.168.10.242 | 2019-06-19 22:39:31.018265+09 | streaming | 0/50001B0 | 0/50001B0 | 0/50001B0 | 0/50001B0  | async
 9178 |    16384 | replica_user | walreceiver      | 192.168.10.243 | 2019-06-19 22:40:17.431336+09 | streaming | 0/50001B0 | 0/50001B0 | 0/50001B0 | 0/50001B0  | async
(2 rows)

Receiver Node

postgres=# select pid, sender_host, status, receive_start_lsn, received_lsn, last_msg_send_time, last_msg_receipt_time, latest_end_lsn, latest_end_time from pg_stat_wal_receiver;
 pid  |  sender_host   |  status   | receive_start_lsn | received_lsn |      last_msg_send_time      |     last_msg_receipt_time     | latest_end_lsn |        latest_end_time        
------+----------------+-----------+-------------------+--------------+------------------------------+-------------------------------+----------------+-------------------------------
 9147 | 192.168.10.241 | streaming | 0/4000000         | 0/50001B0    | 2019-06-19 22:51:01.77302+09 | 2019-06-19 22:51:01.773807+09 | 0/50001B0      | 2019-06-19 22:44:01.009053+09
(1 row)

recovery stat 조회

Sender Node

postgres=# select pg_is_in_recovery();   
 pg_is_in_recovery 
-------------------
 f
(1 row)

Receiver Node

postgres=# select pg_is_in_recovery();   
 pg_is_in_recovery 
-------------------
 t
(1 row)

일반적인 노드에서 pg_is_in_recovery(); 펑션을 조회 하면 f 값이 나오지만, 스탠바이 노드에서는 t가 출력 됩니다.

 

소셜 미디어로 공유하기

You may also like...

2 Responses

  1. Louis Kim 댓글:

    언제 이렇게 다 테스트를 하셨데요 ㅎㅎ

  1. 2019년 6월 20일

    […] 포스팅에서 streaming replication을 이용해 3 node Act-Std-Std 구성을 했기 때문에 […]

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.