Открытые данные: что это такое и зачем это бизнесу
Правительства и организации по всему миру открывают данные для свободного использования. Разбираем, какие практические возможности это создаёт.
В последние годы движение открытых данных набирает силу. Правительства нескольких десятков стран начали публиковать статистику, реестры, геоданные и другую информацию в открытом доступе. В России портал открытых данных data.gov.ru появился в 2013 году. В США и Великобритании такие порталы работают дольше, и объём доступных данных уже значителен.
Для бизнеса это не просто политическая инициатива. Это появление нового слоя информации, который можно использовать - бесплатно или за небольшие деньги - для аналитики, продуктов и сервисов.
Что такое открытые данные
Открытые данные - это данные, которые официально разрешено использовать, копировать, распространять и изменять без ограничений или с минимальными условиями (например, указание источника). Это принципиально отличает их от данных, которые просто "публично доступны" - то есть видны на сайте, но формально защищены авторским правом.
Типичные источники: государственная статистика (демография, экономика, отрасли), реестры предприятий, геопространственные данные, данные о транспорте и инфраструктуре, результаты исследований, финансируемых государством.
Качество и полнота сильно варьируются. Часть открытых данных хорошо структурирована и регулярно обновляется. Часть - устаревшие выгрузки в неудобных форматах. Это надо учитывать.
Где это практически применимо
Я вижу несколько сценариев, которые актуальны прямо сейчас для разных типов бизнеса.
Анализ рынка и территориального охвата. Демографическая статистика, данные о доходах населения, реестры предприятий - позволяют оценить потенциальный спрос в регионах без дорогостоящих исследований. Особенно полезно при выборе новых точек присутствия или оценке новых рынков.
Обогащение собственных данных. Если у вас есть база клиентов с адресами - привязка к геоданным, транспортным маршрутам, данным о плотности населения позволяет строить более точные модели. Это дешевле, чем покупать коммерческие геоданные.
Мониторинг конкурентной среды. Реестры юридических лиц, данные о закупках, отраслевая статистика - источники, из которых можно строить картину рынка без дорогих аналитических агентств.
Продуктовые сервисы. Ряд компаний строит продукты целиком на открытых данных - агрегаторы недвижимости, транспортные приложения, сервисы мониторинга государственных тендеров. Это прямой пример логики платформы, построенной на открытых данных и API.
Что стоит иметь в виду
Открытые данные не означает высококачественные данные. Качество данных должно предшествовать аналитике - и открытые источники не исключение. Прежде чем строить что-то на конкретном источнике, стоит разобраться: насколько регулярно он обновляется, кто за него отвечает, была ли изменена методология за последние годы.
Лицензионные условия могут различаться. Большинство открытых данных допускает коммерческое использование, но не все. Это нужно проверять для каждого конкретного источника.
Обработка требует усилий. Сырые открытые данные редко готовы к использованию "как есть". Приведение к единому формату, очистка, обогащение - реальная работа, которую нужно планировать.
Как начать
Если вы хотите понять, какие открытые данные релевантны для вашего бизнеса, начните с простого: выпишите три-пять вопросов, на которые вы хотели бы иметь ответ, но сейчас данных не хватает. Затем проверьте, существует ли открытый источник, который на них отвечает.
Часто оказывается, что нужная информация давно существует - просто никто не знал, что она доступна бесплатно.