Заметки о данных, ИИ, ИТ
и безопасности
Без маркетингового тумана. Так, как я думаю о задачах в реальной работе с собственниками и руководителями.
Карта критичных данных: какие наборы реально держат операционную компанию
Руководству нужны не все данные, а список информационных опор бизнеса. Как найти эти опоры и что с ними делать.
От логов к метрикам и обратно: как построить наблюдаемость без шума
Не все события одинаково полезны. Как проектировать наблюдаемость систем так, чтобы она давала сигнал, а не создавала дополнительный поток мусора.
Почти real-time: когда бизнесу нужен поток, а когда хватает каждые 15 минут
Не всякая онлайн-аналитика имеет экономический смысл. Разбор того, когда поток данных оправдан, а когда это дорогостоящая иллюзия скорости.
Amazon Redshift и новая экономика DWH: аналитику больше не обязаны строить годами
Облачное MPP-хранилище меняет не только стек, но и психологию пилота. Почему правильный вопрос теперь не 'можем ли мы себе это позволить', а 'с чего начать'.
Data lake до data lake: когда оправдан сырьевой слой и как не превратить его в болото
Складывать всё в одно место - не стратегия. Нужны каталоги, владельцы и метаданные, иначе получается не озеро, а трясина.
Колоночные хранилища и новый темп аналитики: почему месяцами строить DWH уже странно
Когда аналитика запускается за дни, а не за месяцы, меняются и ожидания бизнеса, и то, как стоит проектировать хранилища данных.
Хранить всё подряд больше нельзя: экономика архивов, логов и исторических слоёв
Дешёвый диск снижает стоимость записи, но не стоимость поиска, сопровождения и понимания того, что лежит внутри.
Предиктивное обслуживание без хайпа: начните с частоты отказов, а не с нейросетей
История ремонтов и цена простоя важнее модных алгоритмов. Почему данные об отказах - это первый шаг.
Excel как теневая ИТ-система: запрещать бессмысленно, нужно переосмыслить процессы
Почему таблицы живут там, где корпоративные системы слишком медленные или неудобные, и что с этим делать.
Data lineage: откуда взялась цифра в отчёте и кто за неё отвечает
Трассировка показателей как основа доверия к аналитике - не технический каприз, а управленческая необходимость.
Текстовая аналитика без серебряной пули: где реальная ценность в отзывах и заявках
Почему обработка текста начинается не с понимания языка, а с маршрутизации и типизации причин.
Архитектура телеметрии: как собирать показания так, чтобы они пригодились через три года
Почему данные с датчиков нужно проектировать как долгосрочный актив, а не запускать как разовый пилот, который потом нельзя переиспользовать.