m@ksim.pro
Блог

Заметки о данных, ИИ, ИТ и безопасности

Без маркетингового тумана. Так, как я думаю о задачах в реальной работе с собственниками и руководителями.

Данные

Три месяца удалёнки вскрыли проблемы с данными

Переход на удалённую работу показал, где в компаниях данные живут в головах людей, а не в системах. Как читать эти сигналы и что с ними делать.

Читать
Данные

Стек данных в кризис: что резать, что держать

Когда команды сокращаются и проекты замораживаются, данные всё равно нужны - как расставить приоритеты в инфраструктуре данных в нестабильный период.

Читать
Данные

Контракты между производителями и потребителями данных: непоказательное исправление, которое работает

Почему пайплайны данных чаще всего ломаются на границах команд - и как формализация контракта между производителями и потребителями предотвращает большинство этих поломок.

Читать
Данные

Данные о клиентах в кризис: как компании теряют сигнал

О том, почему аналитика поведения клиентов перестаёт работать в период резкого изменения контекста - и что с этим делать.

Читать
Данные

Триаж бэклога по данным, когда команда только перешла на удалёнку

Как в первые недели распределённого спринта решить, какую работу с данными продолжать, приостановить и отменить - без формального процесса, на который можно опереться.

Читать
Данные

Единственный источник правды в отчётности: почему его так трудно создать

О том, почему цифры расходятся в разных отчётах одной компании и что с этим реально делать.

Читать
Данные

Событийная архитектура и контракты данных: почему данные больше не побочный продукт

Переход от синхронных интеграций к событийной архитектуре меняет отношение к данным. Контракты данных становятся первоклассным инженерным артефактом.

Читать
Данные

Данные как продукт: почему ответственность за данные нельзя вешать на одну команду

Когда аналитика перестаёт работать, проблема часто не в инструментах. Разбираю, как распределять ответственность за данные между командами.

Читать
Данные

Почему ML-команды переписывают одно и то же снова и снова

Feature store и управление признаками в машинном обучении: откуда берётся дублирование и как от него избавиться.

Читать
Данные

Потоковая обработка данных - это операционный вопрос, а не архитектурный

Почему решение о переходе на стриминг должно начинаться с понимания операционной нагрузки, а не с выбора технологии.

Читать
Данные

Озеро данных без управления - это болото, а не актив

Почему data lake без политики доступа и управления превращается в неуправляемое хранилище, из которого никто не может получить достоверные данные.

Читать
Данные

Владение данными важнее платформы для данных

Почему компании покупают дорогие data-платформы и получают те же проблемы - и что надо решить до выбора инструмента.

Читать