m@ksim.pro
К списку статей
Данные 3 мин чтения

Владение данными важнее платформы для данных

Почему компании покупают дорогие data-платформы и получают те же проблемы - и что надо решить до выбора инструмента.

Разговор о "платформе для данных" в компании часто начинается с боли. Данные разбросаны по системам, аналитика медленная, каждый отчёт требует ручной работы. Логичное решение - купить или построить единую платформу, которая соберёт всё вместе.

Я видел достаточно таких проектов, чтобы замечать общий паттерн. Платформа появляется. Через год боль возвращается в новой упаковке. Данные всё ещё разбросаны, только теперь ещё и в платформе.

Причина почти всегда одна: технология была куплена, но вопрос владения данными не был решён.

Что такое владение данными

Владение данными - это не юридический термин и не роль в оргсхеме. Это ответ на практические вопросы.

Кто отвечает за то, что данные о заказах корректны? Кто замечает, если там появляется ошибка? Кто принимает решение об изменении структуры? Кто отвечает на вопрос "почему цифра именно такая"?

Если на каждый из этих вопросов есть конкретный человек или команда - у вас есть владение. Если ответ "это лежит в системе" или "наверное, аналитики знают" - владения нет.

Почему без этого платформа не работает

Платформа для данных - это инструмент. Она перемещает данные, хранит, трансформирует. Но она не принимает решений о том, что данные означают, откуда они берутся и кто несёт ответственность за их качество.

Если до платформы данные о продажах жили в трёх местах и никто не знал, какая версия правильная, - после платформы они будут жить в четырёх местах, и правильная версия всё так же не определена. Просто теперь у вас на одну систему больше.

Данные без владельца - это ничейная земля. Технология её не заберёт.

Как выглядит минимальная структура владения

Для каждого значимого домена данных должны быть определены несколько вещей.

Первое: кто производит эти данные? Какая система, какой процесс, какая команда является источником истины?

Второе: кто потребляет эти данные и для чего? Это помогает понять, насколько критичны ошибки и задержки.

Третье: кто владелец - человек, который отвечает за качество и доступность? Не "кто технически хранит", а кто принимает решения.

Четвёртое: что такое "корректные данные" для этого домена? Какие есть правила валидации, чего не должно быть в принципе?

Это можно зафиксировать в простой таблице. Не нужен каталог данных за миллион долларов - нужна ясность.

Когда думать о платформе

Платформа имеет смысл, когда владение определено и работает, но масштаб или сложность превышают возможности ручного управления. Тогда платформа автоматизирует то, что и без неё работает - и работает хорошо.

Если начать с платформы при неопределённом владении, платформа станет местом, куда складывают проблему, а не решают её.

Вопросы перед выбором инструмента

Если вы стоите перед решением о data-платформе:

  1. Для каждого ключевого домена данных - кто владелец?
  2. Есть ли сейчас понимание, что значит "корректные данные" в каждом домене?
  3. Как сейчас обнаруживаются ошибки в данных - и кто их исправляет?
  4. Является ли проблема технической - не хватает инструмента - или организационной - нет ясности, кто за что отвечает?
  5. Что конкретно изменится в работе с данными после внедрения платформы?

Если ответы неясны - начинать надо не с выбора платформы, а с ответов на эти вопросы. Платформа потом.

К списку статей
Контакт

Если эта статья отозвалась - напишите. Я отвечаю лично.

Telegram