m@ksim.pro
К списку статей
ИИ 3 мин чтения

TensorFlow в открытом доступе: что это меняет для не-исследователей

Google открыл TensorFlow в ноябре 2015-го. Разбираю, что это значит для компаний, которые не занимаются академическими исследованиями.

В ноябре 2015 года Google открыл исходный код TensorFlow - своего внутреннего фреймворка для обучения нейросетей. Новость прошла волной по техническим изданиям и дискуссионным площадкам. Но большинство материалов были написаны для инженеров-исследователей, а не для тех, кто принимает решения об ИТ-стратегии.

Я хочу посмотреть на это с другой стороны: что это событие означает для организаций, которые не пишут статьи на конференции NeurIPS и не держат в штате команду ML-исследователей.

Что именно произошло

Google использует TensorFlow внутри для задач распознавания речи, изображений, перевода и ранжирования поиска. Это не учебный инструмент - это система, которая работает в продакшне у одной из крупнейших технологических компаний мира.

Открытый код означает несколько вещей одновременно. Во-первых, инструмент доступен без лицензионных платежей. Во-вторых, вокруг него начнёт формироваться сообщество - учебники, примеры, решения типовых задач. В-третьих, он станет стандартом де-факто для части рынка - а значит, специалистов, знакомых с ним, будет больше.

Но сам инструмент - это не решение. Это материал.

Что это не значит

Это не значит, что машинное обучение стало доступным для любого бизнеса "из коробки". TensorFlow - это низкоуровневый фреймворк. Он требует понимания математики, хорошего знания Python, правильно подготовленных данных и среды для запуска обучения.

Для компании, у которой нет специалистов с опытом в ML и нет чистых данных с историей, открытый TensorFlow ничего немедленно не меняет. Барьер входа снизился - но он всё ещё есть.

Аналогия: открытый исходный код PostgreSQL не превратил каждую компанию в умелого пользователя реляционных баз данных. Инструмент доступен - навыки и процессы нужно выстраивать отдельно.

Где это реально помогает

Открытый TensorFlow полезен в первую очередь там, где уже есть техническая экспертиза, но не было доступа к production-grade инструментам без больших лицензионных расходов.

Это стартапы, работающие с данными. Это внутренние команды крупных компаний, которые хотели бы поэкспериментировать с нейросетями, но не могли обосновать покупку коммерческих платформ. Это университетские группы, которые теперь могут обучать студентов на том же инструменте, что используется в индустрии.

Для enterprise среднего размера ценность не в самом фреймворке, а в том, что рынок специалистов и готовых решений на его основе будет расти.

Как думать об этом в 2016 году

Если вы руководите компанией или ИТ-направлением, правильный вопрос не "надо ли нам начать использовать TensorFlow". Правильный вопрос - "есть ли у нас задачи, которые вообще могут решаться методами машинного обучения, и есть ли у нас данные для этого".

Несколько ориентиров:

  1. Есть ли у вас повторяющаяся задача классификации или прогнозирования, которая сейчас решается вручную?
  2. Есть ли у вас исторические данные по этой задаче - хотя бы несколько тысяч примеров с правильными ответами?
  3. Есть ли у вас или можете ли вы найти специалиста, который умеет работать с этими инструментами?
  4. Готовы ли вы инвестировать в подготовку данных, а не только в модель?

Если ответы положительные - открытые инструменты вроде TensorFlow снижают порог входа. Если нет - сначала нужно работать с предпосылками.

Технологические события вроде открытия TensorFlow меняют ландшафт, но не темп вашей собственной готовности.

К списку статей
Контакт

Если эта статья отозвалась - напишите. Я отвечаю лично.

Telegram