m@ksim.pro
Блог

Заметки о данных, ИИ, ИТ и безопасности

Без маркетингового тумана. Так, как я думаю о задачах в реальной работе с собственниками и руководителями.

Данные

Хранилище данных без команды аналитиков

Как небольшая компания может выстроить управляемое хранилище данных, не нанимая отдел BI и не покупая дорогую платформу.

Читать
Данные

Достаточен ли MapReduce: где пакетная модель начинает тормозить бизнес

Некоторые бизнес-сценарии уже требуют другого темпа вычисления. Не потому что пакетная модель плоха, а потому что задержка стала слишком дорогой.

Читать
Данные

Spark, Hadoop или MPP: выбирать нужно тип нагрузки, а не бренд

Под разные задачи нужны разные режимы вычисления и хранения. Ошибка в выборе платформы стоит дороже, чем кажется на старте.

Читать
Данные

Технический долг в data pipeline: почему \"потом перепишем\" почти никогда не случается

Пайплайны данных стареют быстрее, чем кажется, особенно если никто не владеет схемой. Откладывание рефакторинга имеет конкретную цену.

Читать
Данные

KPI, за которые стоит драться: как отличить сигнал от декорации

KPI имеет смысл только если он способен изменить решение. Всё остальное - украшение дашборда.

Читать
Данные

Лог как источник истины: почему событийная модель начинает побеждать точечные интеграции

Как переход от двусторонних вызовов к единому журналу событий упрощает связность систем и убирает хрупкость двойных записей.

Читать
Данные

Эксперименты и A/B-подход: чему учат цифровые продукты

Не все решения требуют годового проекта. Часть из них стоит проверять быстрыми опытами - даже в промышленной среде.

Читать
Данные

Data scientist, аналитик, инженер: роли пора разводить

Почему специалист по данным - уже недостаточно точная роль, и как размытые ожидания топят команды до начала работы.

Читать
Данные

ODS, витрины, DWH: почему аналитический ландшафт нельзя строить одной аббревиатурой

Каждый слой аналитической архитектуры решает свою задачу, работает с разной скоростью и требует своего владельца. Смешение слоёв - источник большинства аналитических проблем.

Читать
Данные

Поток против пачки: когда streaming оправдан, а когда ночной batch честнее

Прежде чем выбирать архитектуру обработки данных, стоит честно посчитать стоимость задержки - и понять, платит ли за неё бизнес.

Читать
Данные

Продажи, сервис, логистика: где предиктивная аналитика даёт прибыль

Точная модель - это только начало. Прибыль появляется там, где есть сценарий действия и порог, при котором оно запускается.

Читать
Данные

Скорость обработки как аргумент: что меняет быстрые вычисления над данными

Инженерия данных получает новый баланс между пакетной и более быстрой обработкой - и это меняет то, какие задачи вообще становятся решаемыми.

Читать