ИИ 27 марта 2023 2 мин чтения

Плагины OpenAI: что объявление значит для тех, кто собирается строить на этом

OpenAI открыла доступ к плагинам для разработчиков. Спокойный разбор того, что архитектура подразумевает на практике, и какие вопросы нужно задать до того, как вкладывать инженерное время.

На этой неделе OpenAI объявила о системе плагинов для ChatGPT. Медиапокрытие было бурным - сравнения с «App Store для ИИ» появились в течение нескольких часов. Я хочу написать более короткую и более осторожную заметку о том, что архитектура подразумевает для тех, кто думает строить на этом.

Это не критика технологии. Это список вопросов, которые стоит обдумать, прежде чем вкладывать инженерное время.

Что такое плагин технически

Плагин - это файл манифеста и API. ChatGPT читает манифест, чтобы понять, что делает плагин, затем вызывает эндпоинты API в ходе разговора, когда решает, что плагин уместен. Модель решает, когда вызвать плагин, какие параметры передать и как представить результат пользователю. Разработчик контролирует логику API и описание в манифесте.

Последнее важно: качество описания в манифесте определяет, будет ли модель вызывать ваш плагин правильно, неправильно или вообще не вызывать. Это новый тип проблемы интерфейса, с которой большинство разработчиков прежде не сталкивалось.

Вопрос дистрибуции

Очевидная привлекательность - дистрибуция. Если ваш плагин появляется в ChatGPT, миллионы потенциальных пользователей в одном поиске. Но эта дистрибуция полностью принадлежит OpenAI. Экосистема плагинов будет курироваться, ранжироваться и управляться правилами, которые могут меняться. Строить бизнес, где канал привлечения целиком внутри чужого продукта, - знакомый риск для мобильных приложений. Та же логика применима здесь.

Это не значит, что плагин строить не надо. Это значит, что стоит чётко понять: плагин - это и есть продукт, или это верхушка воронки для чего-то, что вы контролируете?

Вопрос задержки и надёжности

Ваш API будет вызываться моделью, которая решает в реальном времени, полезен ли результат. Если API медленный или возвращает неоднозначные ошибки, модель должна с этим справиться - и может не справиться. Тестировать только счастливый путь недостаточно. Нужно думать о том, что происходит при ответе 500, при ограничении частоты запросов и при валидном JSON, который семантически сбивает модель с толку.

Вопрос данных

Когда запрос пользователя активирует ваш плагин, запрос - или его версия - отправляется на ваш API. В зависимости от назначения плагина это может включать чувствительный бизнес-контекст, персональные данные или и то, и другое. Вопрос управления данными реален и пока не урегулирован.

За чем я слежу

Наиболее реалистичными в краткосрочной перспективе мне кажутся плагины только для чтения с хорошо определёнными источниками данных: статус рейса, наличие товаров, внутренние базы знаний. С большим скептицизмом я отношусь к плагинам, которые записывают данные или запускают реальные действия, - потому что надёжность суждения модели о том, когда действовать, пока недостаточна для контекстов с высокими ставками.

Технология действительно интересная. Бизнес-вопросы - те же, что вы задавали бы о любой платформенной зависимости.

К списку статей

Контакт

Если эта статья отозвалась - напишите. Я отвечаю лично.

Telegram TenChat MAX