Ответ 1
Начиная с марта 2017 года, вы можете отметить отсутствующие данные как приемлемые. Это приведет к тому, что будильник не будет отмечен как НЕДОСТАТОЧНО.
У меня установлены аварийные сигналы, чтобы рассказать мне, когда мои балансировочные балансы бросают 5xxs, используя метку HTTPCode_Backend_5XX
со статистикой sum
. Проблема заключается в том, что sum
регистрирует 0 как никакие точки данных, поэтому, когда не выбрасывается 5xxs, сигнал тревоги считается недостаточным. Это особенно неприятно, потому что у меня есть настройка SNS, чтобы уведомлять меня, когда мы получаем слишком много 5xx (состояние тревоги), и когда все возвращается к нормальной жизни. Раздражательно, 0 5xxs означает, что мы находимся в состоянии INSUFFICIENT DATA
, но 1 5xx означает, что мы находимся в состоянии OK
, поэтому 1 5xx запускает всех, получающих уведомление, что все в порядке. Есть ли способ обойти это? В идеале, я бы хотел, чтобы всего лишь 0 из ничего отображалось как нулевая точка данных вместо данных вообще (недостаточные данные).
Начиная с марта 2017 года, вы можете отметить отсутствующие данные как приемлемые. Это приведет к тому, что будильник не будет отмечен как НЕДОСТАТОЧНО.
Я просил об этом на форумах AWS два года назад:-( https://forums.aws.amazon.com/thread.jspa?threadID=153753&tstart=0
К сожалению, вы не можете создавать уведомления на основе определенных изменений состояния (в вашем случае вам требуется уведомление, когда состояние изменяется с ALARM на OK, но не тогда, когда состояние изменяется с INSUFFICIENT на OK). Я могу только предположить, что вы также попросите об этом и, надеюсь, в конечном итоге это будет добавлено.
Для показателей, которые часто находятся в состоянии INSUFFICIENT, я вообще просто создаю уведомления для ALARMS, и у меня нет уведомлений на OK для этих показателей. Если я хочу подтвердить, что все в порядке, я использую мобильное приложение AWS для проверки вещи и посмотреть, разрешены ли они.
У нас была аналогичная проблема для некоторых наших сигналов тревоги. Вы действительно можете избежать этого поведения с некоторой работой, если вы действительно хотите справиться с накладными расходами.
То, что мы сделали, вместо отправки SNS-уведомлений непосредственно на электронные письма, мы создали функцию лямбда и вызвали ее, как только у нас есть уведомление в теме SNS.
Таким образом, вы будете иметь больше контроля над действиями, которые вы можете предпринять, когда срабатывают тревоги. Поскольку контекст предоставит вам и старую государственную ценность.
Хорошей новостью является то, что для начала есть шаблон лямбда. https://aws.amazon.com/blogs/aws/new-slack-integration-blueprints-for-aws-lambda/
Просто выберите ту, которая предназначена для отправки аварийных сигналов в облачном режиме. Затем вы можете изменить код по своему усмотрению, либо отпустить слабую часть, либо просто использовать электронную почту, либо сохранить ее в слабом состоянии. (это то, что мы сделали, и оно работает как шарм)