Как проверить успешность резервного копирования postgresql?

у нас есть база данных postgresql, которая резервируется каждую ночь из задания cron со следующей командой:

su postgres -c "pg_dump our_database | gzip > /home/smb/shared/database_backup.bak.gz"

недавно у нас был сбой диска, который начался с нескольких плохих секторов, и за это время pg_dump вышел со следующими ошибками

pg_dump: SQL command failed
pg_dump: Error message from server: ERROR: catalog is missing 17 attribute(s) from relid 20158
pd_dump: The command was: LOCK TABLE public.obvez IN ACCESS SHARE MODE

теперь, так как это было в работе cron, никто не заметил сообщения об ошибках, резервное копирование было прервано, но оно не было нулевого размера, все казалось в порядке, и ошибка осталась незамеченной до окончательного сбоя диска, когда мы понял, что у нас нет подкрепления.

нам удалось восстановить данные из старой резервной копии, но теперь я хотел бы знать, как правильно проверить, успешно ли pg_dump закончил свою работу или нет?

1 ответов


Я записываю результат в файл журнала, и в конце задания я отправляю содержимое файла журнала на свой адрес электронной почты. Так я буду знать, когда что-то пойдет не так.

su postgres "pg_dump our_database 2>> $LOG_FILE | gzip > /home/smb/shared/database_backup.bak.gz"
cat $LOG_FILE | mailx $MAINTAINERS -s "Postgresql backup"

дополнительное соглашение: если вы хотите отправить электронное письмо, только если что-то пошло не так, вы можете проверить код возврата pg_dump:

LOG_FILE=/tmp/pgdump.err

if ! pg_dump -U backupuser "our_database" 2> $LOG_FILE 
then 
    cat $LOG_FILE | mailx 'youremailaddress' -s "Postgresql backup failure!"
fi