Данные 30 марта 2012 3 мин чтения

Self-service BI: как не превратить свободу отчётов в фабрику противоречий

Самостоятельная аналитика работает только при общем словаре метрик и доверии к данным - иначе каждый отдел приходит на совещание с собственной правдой.

Идея self-service BI выглядит привлекательно: аналитики и менеджеры сами строят нужные им отчёты, IT не является узким местом, решения принимаются быстрее. На бумаге это выигрыш для всех.

На практике я видел, как это превращается в ситуацию, где у каждого отдела есть свои цифры, ни один набор цифр не совпадает с другим, а совещания тратятся на споры о данных, а не на решения. Это не новая проблема - в основе обычно лежат грязные мастер-данные и отсутствие общего справочного слоя, которые инструменты self-service сами по себе не устраняют.

Почему свобода без общего словаря разрушает аналитику

Когда каждый строит отчёты самостоятельно, неизбежно возникают расхождения в определениях. "Выручка" - это с НДС или без? "Активный клиент" - тот, кто купил в этом месяце, или за последние 90 дней? "Конверсия" считается от уникальных посетителей или от сессий?

Если эти вопросы не решены централизованно, каждый аналитик отвечает на них сам. В результате финансовый отдел показывает одну выручку, продажи - другую, и оба правы по своей логике. Но компания не может работать с двумя версиями правды.

Это не проблема инструментов. Это проблема отсутствия общего словаря.

Что такое общий словарь метрик

Словарь метрик - это документ или реестр, в котором для каждой ключевой метрики зафиксировано:

точное определение (что входит, что не входит);
формула расчёта;
источник данных;
владелец - тот, кто отвечает за корректность;
дата последнего обновления определения.

Это не академическая работа. Это прагматичный инструмент, который позволяет двум людям из разных отделов сослаться на одно и то же определение и получить одно и то же число.

Без этого self-service BI производит не аналитику, а хаос с красивым интерфейсом.

Доверие к данным - не очевидная проблема

Даже если метрики определены, люди будут строить свои отчёты в обход общей системы, если они не доверяют данным в ней. Это происходит чаще, чем кажется.

Типичные признаки отсутствия доверия:

"В системе написано одно, но мы все знаем, что на самом деле другое."
"Эта цифра неправильная, Маша считает по-другому."
"Данные за прошлый месяц ещё не обновились, поэтому я взял из своей таблицы."

Если такие фразы звучат регулярно, значит система отчётности не является источником правды. Она является одним из источников, наравне с личными таблицами.

Решение - не принудить всех пользоваться только системой. Решение - разобраться, почему данные в системе не вызывают доверия, и исправить это.

Как устроить self-service так, чтобы он работал

Несколько принципов, которые разделяют работающие реализации от нерабочих:

Семантический слой. Вместо прямого доступа к таблицам - управляемый слой с готовыми метриками и измерениями. Аналитик выбирает из проверенных определений, а не создаёт своё.
Сертифицированные отчёты. Часть отчётов проверена, версионирована и помечена как "официальная". Остальные - рабочие черновики, не для принятия решений.
Процесс изменения метрик. Если определение метрики меняется, это делается через владельца, с уведомлением зависимых отчётов.
Журнал происхождения данных. Аналитик должен мочь ответить на вопрос "откуда взялась эта цифра" за разумное время.

Self-service - это не "каждый сам себе аналитик". Это "каждый может самостоятельно задавать вопросы к общей, проверенной базе знаний".

Практическая проверка зрелости

Несколько вопросов, которые помогают оценить ситуацию в компании:

Если два менеджера независимо считают "выручку за прошлый квартал", они получат одно число?
Есть ли место, где записано официальное определение каждой ключевой метрики?
Когда на совещании расходятся цифры, есть ли понятный процесс их сверки?
Кто отвечает за корректность данных в BI-системе?

Если хотя бы на два из этих вопросов нет чёткого ответа, self-service BI пока производит больше вопросов, чем ответов.

К списку статей

Контакт

Если эта статья отозвалась - напишите. Я отвечаю лично.

Telegram TenChat MAX