Self-service BI: как не превратить свободу отчётов в фабрику противоречий
Самостоятельная аналитика работает только при общем словаре метрик и доверии к данным - иначе каждый отдел приходит на совещание с собственной правдой.
Идея self-service BI выглядит привлекательно: аналитики и менеджеры сами строят нужные им отчёты, IT не является узким местом, решения принимаются быстрее. На бумаге это выигрыш для всех.
На практике я видел, как это превращается в ситуацию, где у каждого отдела есть свои цифры, ни один набор цифр не совпадает с другим, а совещания тратятся на споры о данных, а не на решения. Это не новая проблема - в основе обычно лежат грязные мастер-данные и отсутствие общего справочного слоя, которые инструменты self-service сами по себе не устраняют.
Почему свобода без общего словаря разрушает аналитику
Когда каждый строит отчёты самостоятельно, неизбежно возникают расхождения в определениях. "Выручка" - это с НДС или без? "Активный клиент" - тот, кто купил в этом месяце, или за последние 90 дней? "Конверсия" считается от уникальных посетителей или от сессий?
Если эти вопросы не решены централизованно, каждый аналитик отвечает на них сам. В результате финансовый отдел показывает одну выручку, продажи - другую, и оба правы по своей логике. Но компания не может работать с двумя версиями правды.
Это не проблема инструментов. Это проблема отсутствия общего словаря.
Что такое общий словарь метрик
Словарь метрик - это документ или реестр, в котором для каждой ключевой метрики зафиксировано:
- точное определение (что входит, что не входит);
- формула расчёта;
- источник данных;
- владелец - тот, кто отвечает за корректность;
- дата последнего обновления определения.
Это не академическая работа. Это прагматичный инструмент, который позволяет двум людям из разных отделов сослаться на одно и то же определение и получить одно и то же число.
Без этого self-service BI производит не аналитику, а хаос с красивым интерфейсом.
Доверие к данным - не очевидная проблема
Даже если метрики определены, люди будут строить свои отчёты в обход общей системы, если они не доверяют данным в ней. Это происходит чаще, чем кажется.
Типичные признаки отсутствия доверия:
- "В системе написано одно, но мы все знаем, что на самом деле другое."
- "Эта цифра неправильная, Маша считает по-другому."
- "Данные за прошлый месяц ещё не обновились, поэтому я взял из своей таблицы."
Если такие фразы звучат регулярно, значит система отчётности не является источником правды. Она является одним из источников, наравне с личными таблицами.
Решение - не принудить всех пользоваться только системой. Решение - разобраться, почему данные в системе не вызывают доверия, и исправить это.
Как устроить self-service так, чтобы он работал
Несколько принципов, которые разделяют работающие реализации от нерабочих:
- Семантический слой. Вместо прямого доступа к таблицам - управляемый слой с готовыми метриками и измерениями. Аналитик выбирает из проверенных определений, а не создаёт своё.
- Сертифицированные отчёты. Часть отчётов проверена, версионирована и помечена как "официальная". Остальные - рабочие черновики, не для принятия решений.
- Процесс изменения метрик. Если определение метрики меняется, это делается через владельца, с уведомлением зависимых отчётов.
- Журнал происхождения данных. Аналитик должен мочь ответить на вопрос "откуда взялась эта цифра" за разумное время.
Self-service - это не "каждый сам себе аналитик". Это "каждый может самостоятельно задавать вопросы к общей, проверенной базе знаний".
Практическая проверка зрелости
Несколько вопросов, которые помогают оценить ситуацию в компании:
- Если два менеджера независимо считают "выручку за прошлый квартал", они получат одно число?
- Есть ли место, где записано официальное определение каждой ключевой метрики?
- Когда на совещании расходятся цифры, есть ли понятный процесс их сверки?
- Кто отвечает за корректность данных в BI-системе?
Если хотя бы на два из этих вопросов нет чёткого ответа, self-service BI пока производит больше вопросов, чем ответов.