Как исправить приставку PostgreSQL 9.3, которая не может справиться с мастером?

У нас есть конфигурация репликации master-slave, как показано ниже.

postgresql.conf имеет репликацию, сконфигурированную следующим образом (строка комментария выведена для краткости):

Тот же postgresql.conf как на главном. recovery.conf выглядит следующим образом:

Когда это было первоначально установлено, мы выполнили несколько простых тестов и подтвердили, что репликация работает. Однако, когда мы выполнили начальную загрузку данных, только некоторые данные сделали ее ведомому.

Теперь ведомый журнал заполняется сообщениями, которые выглядят следующим образом:

После некоторого анализа и помощи на IRP-канале #postgresql я пришел к выводу, что подчиненный не может идти в ногу с мастером. Мое предложенное решение выглядит следующим образом.

Я что-то пропустил? Есть ли лучший способ обновить ведомый без необходимости перезагрузки всех данных?

Ответы

Ответ 1

Два важных варианта работы с WAL для потоковая репликация:

wal_keep_segments должен быть установлен достаточно высоким, чтобы позволить подчиненному устройству догнать его после разумного запаздывания (например, высокий уровень обновления, подчиненный в автономном режиме и т.д.).
archive_mode позволяет архивировать WAL, которое может использоваться для восстановления файлов старше wal_keep_segments. Для ведомых серверов просто нужен метод для извлечения сегментов WAL. NFS - это самый простой способ, но все, что угодно: от scp до http до лент будет работать до тех пор, пока оно может быть написано сценарием.
```
# on master
archive_mode = on
archive_command = 'cp %p /path_to/archive/%f' 

# on slave
restore_command = 'cp /path_to/archive/%f "%p"'
```
Когда ведомое устройство не может вытащить сегмент WAL непосредственно из ведущего устройства, оно попытается использовать restore_command для его загрузки. Вы можете настроить ведомое устройство для автоматического удаления сегментов с помощью параметра archive_cleanup_command.

Если подчиненное устройство переходит в ситуацию, когда следующий сегмент WAL, который ему нужен, отсутствует как у ведущего, так и у архива, не будет никакого способа последовательно восстанавливать базу данных. Единственный разумный вариант - очистить сервер и начать с нового pg_basebackup.

Ответ 2

Как сказал Бен Гримм в комментариях, речь идет о том, чтобы установить сегменты на максимально возможное значение, чтобы позволить подчиненному устройству догнать.