Управление данными: это про владение, а не про комитет
Почему большинство инициатив по data governance буксуют и как перейти от формального комитета к реальной ответственности.
Data governance - управление данными - это одна из тех концепций, которые компании периодически "внедряют", не меняя ничего по сути. Создаётся комитет, разрабатывается политика, утверждается документ. Через год никто не помнит, когда этот комитет собирался в последний раз, а проблемы с качеством и доступностью данных остаются ровно теми же.
Я видел этот цикл достаточно часто, чтобы сформулировать, почему он повторяется. И почему реальное управление данными устроено иначе.
В чём проблема с комитетным подходом
Комитеты по управлению данными обычно создаются с правильными намерениями. Собираются представители бизнес-подразделений, ИТ-блока и, возможно, юристы. Договариваются о правилах. Назначают ответственных.
Проблема в том, что ответственность в этой модели - коллективная. А коллективная ответственность на практике означает, что никто не отвечает конкретно. Когда данные оказываются плохого качества - все смотрят на комитет. Когда комитет встречается раз в квартал - за это время накапливается много проблем, которые никто не решал.
Кроме того, комитет обычно занимается политиками и стандартами, но не операционной реальностью. Он описывает, как должно быть, но не имеет механизма заставить это работать каждый день.
Что такое реальное владение данными
Реальное управление данными начинается с простого вопроса: кто конкретный человек, который отвечает за то, что эти данные правильны, актуальны и доступны?
Не роль. Не подразделение. Конкретный человек с именем и фамилией, который знает, что если данные ломаются - к нему придут первым.
В зрелых командах это называется data owner или steward - в зависимости от уровня ответственности. Data owner - обычно кто-то на уровне руководителя направления, кто принимает бизнес-решения о том, как данные собираются и используются. Data steward - тот, кто занимается операционной стороной: следит за качеством, отвечает на вопросы потребителей.
Без этих ролей с реальными именами - любая политика остаётся бумагой.
Три вещи, без которых управление данными не работает
Первое - явные владельцы для каждого критического набора данных. Не просто список в документе, а люди, которые знают, что они владельцы, и понимают что это значит.
Второе - процессы реагирования на проблемы с данными. Куда идёт заявка, когда аналитик обнаружил расхождение? Кто принимает решение об исправлении? Как это фиксируется?
Третье - метрики качества, которые кто-то смотрит регулярно. Не раз в квартал на комитете, а еженедельно или ежедневно - в зависимости от критичности. Без измерения нет управления.
Как начать без большого проекта
Правильный первый шаг - не создавать комитет и не писать политику. Правильный первый шаг - взять два или три наиболее критических набора данных и для каждого ответить на вопросы:
- Кто прямо сейчас де-факто следит за качеством этих данных?
- Что происходит, когда они ломаются - кто это обнаруживает и кто чинит?
- Есть ли документация на структуру и семантику этих данных?
- Как потребители этих данных узнают об изменениях?
Если на эти вопросы есть ответы - у вас уже есть зародыш реального управления данными. Задача - сделать его явным и распространить на остальные критические наборы.
Если ответов нет - начинать нужно именно здесь, а не с написания политики.