GPT-3: что стоит думать об этом основателю
Летом 2020 года OpenAI выпустил GPT-3 - самую большую языковую модель на тот момент. Разбор того, что это реально означает для бизнеса прямо сейчас.
В конце июня 2020 года OpenAI открыл бета-доступ к GPT-3. В течение нескольких недель в профессиональном сообществе не было другой темы. Демонстрации были впечатляющими: модель пишет код, генерирует тексты, отвечает на вопросы, имитирует стиль. Один известный разработчик написал, что несколько дней не мог отличить - это человек или модель.
Реакция типична для любого крупного технологического события: часть людей объявляет конец эпохи, другая часть говорит "ничего нового". Для основателя и менеджера ни то, ни другое не полезно.
Я попробую сказать то, что кажется мне точным с практической точки зрения.
Что GPT-3 умеет делать реально
Модель хорошо справляется с задачами, где нужно преобразовать текст в текст по образцу. Перефразировать, дополнить, классифицировать, ответить на вопрос по контексту, написать черновик по структуре.
Это не тривиально. Раньше для каждой такой задачи нужна была отдельная обученная модель, размеченные данные и команда, умеющая с этим работать. Теперь многое получается с несколькими примерами в запросе.
Это меняет экономику прототипирования. Проверить идею, написать первый черновик функциональности - становится дешевле и быстрее.
Где граница
GPT-3 не рассуждает в строгом смысле слова. Он статистически правдоподобен - и это принципиально отличается от верности. Модель уверенно производит неверные факты. Она не знает, когда не знает.
Для задач, где ошибка дорого стоит - юридические документы, медицинские рекомендации, финансовые расчёты - это не инструмент для автономной работы. Человек в контуре обязателен.
Ещё одна граница: модель не знает вашего бизнеса. Она обучена на общедоступных текстах. У неё нет ваших данных, вашей специфики, ваших внутренних терминов и правил.
Что это значит для продуктовых решений
Если в вашем продукте или процессе есть задачи, которые сейчас делаются руками и похожи на "взять текст, преобразовать по правилу, отдать результат" - имеет смысл посмотреть, что GPT-3 умеет делать с такими задачами.
Это не значит "заменить всё". Это значит "найти несколько конкретных узких мест и проверить гипотезу".
Хороший признак подходящей задачи: вы можете объяснить правило словами, у вас есть примеры правильных результатов, и вы готовы проверять выход перед использованием.
Три вопроса перед тем, как начинать
- Есть ли у нас задача, где входные и выходные данные - это текст, и правило преобразования можно описать примерами?
- Кто будет проверять результат модели перед тем, как он попадёт к клиенту или в процесс?
- Что произойдёт, если модель ошибётся - насколько это критично?
Если на первые два есть ответы, а третий не пугает - это хорошая отправная точка для эксперимента.
GPT-3 - это не магия и не угроза. Это инструмент с понятными сильными и слабыми сторонами. Обращаться с ним стоит как с инструментом.