Заметки о данных, ИИ, ИТ
и безопасности
Без маркетингового тумана. Так, как я думаю о задачах в реальной работе с собственниками и руководителями.
Хранилище данных без команды аналитиков
Как небольшая компания может выстроить управляемое хранилище данных, не нанимая отдел BI и не покупая дорогую платформу.
Достаточен ли MapReduce: где пакетная модель начинает тормозить бизнес
Некоторые бизнес-сценарии уже требуют другого темпа вычисления. Не потому что пакетная модель плоха, а потому что задержка стала слишком дорогой.
Spark, Hadoop или MPP: выбирать нужно тип нагрузки, а не бренд
Под разные задачи нужны разные режимы вычисления и хранения. Ошибка в выборе платформы стоит дороже, чем кажется на старте.
Технический долг в data pipeline: почему \"потом перепишем\" почти никогда не случается
Пайплайны данных стареют быстрее, чем кажется, особенно если никто не владеет схемой. Откладывание рефакторинга имеет конкретную цену.
KPI, за которые стоит драться: как отличить сигнал от декорации
KPI имеет смысл только если он способен изменить решение. Всё остальное - украшение дашборда.
Лог как источник истины: почему событийная модель начинает побеждать точечные интеграции
Как переход от двусторонних вызовов к единому журналу событий упрощает связность систем и убирает хрупкость двойных записей.
Эксперименты и A/B-подход: чему учат цифровые продукты
Не все решения требуют годового проекта. Часть из них стоит проверять быстрыми опытами - даже в промышленной среде.
Data scientist, аналитик, инженер: роли пора разводить
Почему специалист по данным - уже недостаточно точная роль, и как размытые ожидания топят команды до начала работы.
ODS, витрины, DWH: почему аналитический ландшафт нельзя строить одной аббревиатурой
Каждый слой аналитической архитектуры решает свою задачу, работает с разной скоростью и требует своего владельца. Смешение слоёв - источник большинства аналитических проблем.
Поток против пачки: когда streaming оправдан, а когда ночной batch честнее
Прежде чем выбирать архитектуру обработки данных, стоит честно посчитать стоимость задержки - и понять, платит ли за неё бизнес.
Продажи, сервис, логистика: где предиктивная аналитика даёт прибыль
Точная модель - это только начало. Прибыль появляется там, где есть сценарий действия и порог, при котором оно запускается.
Скорость обработки как аргумент: что меняет быстрые вычисления над данными
Инженерия данных получает новый баланс между пакетной и более быстрой обработкой - и это меняет то, какие задачи вообще становятся решаемыми.