Заметки о данных, ИИ, ИТ
и безопасности
Без маркетингового тумана. Так, как я думаю о задачах в реальной работе с собственниками и руководителями.
Три месяца удалёнки вскрыли проблемы с данными
Переход на удалённую работу показал, где в компаниях данные живут в головах людей, а не в системах. Как читать эти сигналы и что с ними делать.
Стек данных в кризис: что резать, что держать
Когда команды сокращаются и проекты замораживаются, данные всё равно нужны - как расставить приоритеты в инфраструктуре данных в нестабильный период.
Контракты между производителями и потребителями данных: непоказательное исправление, которое работает
Почему пайплайны данных чаще всего ломаются на границах команд - и как формализация контракта между производителями и потребителями предотвращает большинство этих поломок.
Данные о клиентах в кризис: как компании теряют сигнал
О том, почему аналитика поведения клиентов перестаёт работать в период резкого изменения контекста - и что с этим делать.
Триаж бэклога по данным, когда команда только перешла на удалёнку
Как в первые недели распределённого спринта решить, какую работу с данными продолжать, приостановить и отменить - без формального процесса, на который можно опереться.
Единственный источник правды в отчётности: почему его так трудно создать
О том, почему цифры расходятся в разных отчётах одной компании и что с этим реально делать.
Событийная архитектура и контракты данных: почему данные больше не побочный продукт
Переход от синхронных интеграций к событийной архитектуре меняет отношение к данным. Контракты данных становятся первоклассным инженерным артефактом.
Данные как продукт: почему ответственность за данные нельзя вешать на одну команду
Когда аналитика перестаёт работать, проблема часто не в инструментах. Разбираю, как распределять ответственность за данные между командами.
Почему ML-команды переписывают одно и то же снова и снова
Feature store и управление признаками в машинном обучении: откуда берётся дублирование и как от него избавиться.
Потоковая обработка данных - это операционный вопрос, а не архитектурный
Почему решение о переходе на стриминг должно начинаться с понимания операционной нагрузки, а не с выбора технологии.
Озеро данных без управления - это болото, а не актив
Почему data lake без политики доступа и управления превращается в неуправляемое хранилище, из которого никто не может получить достоверные данные.
Владение данными важнее платформы для данных
Почему компании покупают дорогие data-платформы и получают те же проблемы - и что надо решить до выбора инструмента.