Sage — это платформа наблюдаемости, разработанная инженерами Т-Банка
Мы пользуемся ей сами и продаем другим компаниям. Это ключевой элемент в архитектуре надежности нашей экосистемы.
Для чего мы используем Sage:
Сбор телеметрии
Логи, метрики и трейсы всех сервисов Т-Банка собираются и хранятся в Sage. Это 12 ГБ/с в потоке и 9+ ПБ на дисках.
Аналитика в реальном времени
Ежедневно в Т-Банке около 8 тыс человек от клиентского саппорта до топов открывают Sage, чтобы выполнить запросы или посмотреть на дашборды.
Интеграции
Sage используют не только как самостоятельный продукт, но и как источник данных для других платформ и продуктов.
Алертинг
Sage запускает тысячи триггеров каждую минуту. Сложность запросов внутри триггеров ограничена только возможностями поискового движка.
Ключевые особенности Sage:
Отказоустойчивая, масштабируемая архитектура, распределенная по нескольким кластерам в нескольких датацентрах.
Надежность
Обработка больших потоков данных в реальном времени.
Пропускная способность
Фичи уровня enterprise
Квотирование, SSO авторизация, интеграция с AD.
Поисковый движок Mage
Разработан с нуля вместе с MageQL, простым и понятным языком запросов с поддержкой фильтрации, преобразований и статистики. Умеет компилировать в QueryDSL (нативные запросы в Elasticsearch), поддерживает PromQL/MetricsQL для запросов к метрикам.
Подробнее про архитектуру и возможности Sage
Это сильная команда инженеров, которая делится экспертизой с сообществом. Наши доклады занимают топовые места в рейтингах конференций HighLoad++ и DevOpsConf. Мы продвигаем тему надежности и наблюдаемости, организовали конференцию T-Observability Day, проводим митапы. Если хотите пообщаться с нами на тему наблюдаемости, надежности, SRE, присоединяйтесь к Sage Community, нашему сообществу в telegram
Sage — не просто продукт.
Полезные материалы: почитать
    Полезные материалы: посмотреть
    Почему для SRE важно уметь читать код
    Kafka. Деградировавший кластер, или 168 часов траблшутинга
    Пайплайны записи своими руками: думали — велосипед, оказалось — паттерны
    Когда нужно делать свою базу данных
    7 петабайт логов в Elastic. Как мы это сделали?
    Обзорный доклад о наблюдаемости, надежности и качестве
    Время просмотра: 29 мин
    Время просмотра: 42 мин
    Время просмотра: 54 мин
    Время просмотра: 50 мин
    Время просмотра: 41 мин
    Время просмотра: 42 мин
    Время просмотра: 1 час 46 мин
    Интервью: Sage. Observability своими руками
    Время просмотра: 10 мин
    Техтолк: Иван Липкин про использование Sage в НСПК
    Используют Sage для наблюдаемости
    C помощью Sage наблюдаются