Alerting
Alerting — это правила уведомлений о критических отклонениях в работе систем.
Что это
Термин используется в контексте быстрого реагирования на падения сервисов, рост ошибок и исчерпание ресурсов. На практике он помогает стандартизировать процессы, упростить сопровождение и сделать систему более предсказуемой.
Когда применять
Подход особенно полезен для быстрого реагирования на падения сервисов, рост ошибок и исчерпание ресурсов. Если в проекте есть рост нагрузки, несколько окружений или требования к надёжности, эта тема почти всегда становится частью архитектуры.
Базовый пример
if error_rate > 5% for 10m then notify on-call
Практическая заметка
Для wiki удобно описывать не только определение, но и ограничения: где технология действительно нужна, какие есть риски внедрения и как она сочетается с остальным стеком.