Блог - ksim.pro - страница 8

Данные 8 января 2014

Хранилище данных без команды аналитиков

Как небольшая компания может выстроить управляемое хранилище данных, не нанимая отдел BI и не покупая дорогую платформу.

Читать

Данные 1 ноября 2013

Достаточен ли MapReduce: где пакетная модель начинает тормозить бизнес

Некоторые бизнес-сценарии уже требуют другого темпа вычисления. Не потому что пакетная модель плоха, а потому что задержка стала слишком дорогой.

Читать

Данные 27 сентября 2013

Spark, Hadoop или MPP: выбирать нужно тип нагрузки, а не бренд

Под разные задачи нужны разные режимы вычисления и хранения. Ошибка в выборе платформы стоит дороже, чем кажется на старте.

Читать

Данные 20 сентября 2013

Технический долг в data pipeline: почему \"потом перепишем\" почти никогда не случается

Пайплайны данных стареют быстрее, чем кажется, особенно если никто не владеет схемой. Откладывание рефакторинга имеет конкретную цену.

Читать

Данные 6 сентября 2013

KPI, за которые стоит драться: как отличить сигнал от декорации

KPI имеет смысл только если он способен изменить решение. Всё остальное - украшение дашборда.

Читать

Данные 2 августа 2013

Лог как источник истины: почему событийная модель начинает побеждать точечные интеграции

Как переход от двусторонних вызовов к единому журналу событий упрощает связность систем и убирает хрупкость двойных записей.

Читать

Данные 31 мая 2013

Эксперименты и A/B-подход: чему учат цифровые продукты

Не все решения требуют годового проекта. Часть из них стоит проверять быстрыми опытами - даже в промышленной среде.

Читать

Данные 24 мая 2013

Data scientist, аналитик, инженер: роли пора разводить

Почему специалист по данным - уже недостаточно точная роль, и как размытые ожидания топят команды до начала работы.

Читать

Данные 10 мая 2013

ODS, витрины, DWH: почему аналитический ландшафт нельзя строить одной аббревиатурой

Каждый слой аналитической архитектуры решает свою задачу, работает с разной скоростью и требует своего владельца. Смешение слоёв - источник большинства аналитических проблем.

Читать

Данные 26 апреля 2013

Поток против пачки: когда streaming оправдан, а когда ночной batch честнее

Прежде чем выбирать архитектуру обработки данных, стоит честно посчитать стоимость задержки - и понять, платит ли за неё бизнес.

Читать

Данные 22 марта 2013

Продажи, сервис, логистика: где предиктивная аналитика даёт прибыль

Точная модель - это только начало. Прибыль появляется там, где есть сценарий действия и порог, при котором оно запускается.

Читать

Данные 1 марта 2013

Скорость обработки как аргумент: что меняет быстрые вычисления над данными

Инженерия данных получает новый баланс между пакетной и более быстрой обработкой - и это меняет то, какие задачи вообще становятся решаемыми.

Читать

Заметки о данных, ИИ, ИТ и безопасности

Хранилище данных без команды аналитиков

Достаточен ли MapReduce: где пакетная модель начинает тормозить бизнес

Spark, Hadoop или MPP: выбирать нужно тип нагрузки, а не бренд

Технический долг в data pipeline: почему \"потом перепишем\" почти никогда не случается

KPI, за которые стоит драться: как отличить сигнал от декорации

Лог как источник истины: почему событийная модель начинает побеждать точечные интеграции

Эксперименты и A/B-подход: чему учат цифровые продукты

Data scientist, аналитик, инженер: роли пора разводить

ODS, витрины, DWH: почему аналитический ландшафт нельзя строить одной аббревиатурой

Поток против пачки: когда streaming оправдан, а когда ночной batch честнее

Продажи, сервис, логистика: где предиктивная аналитика даёт прибыль

Скорость обработки как аргумент: что меняет быстрые вычисления над данными

Заметки о данных, ИИ, ИТ
и безопасности