OpenAI обновила правила поведения для ИИ

OpenAI открыла доступ к обновлённой и расширенной версии спецификации моделей (Model Spec), документа, описывающего поведение ИИ-моделей. Теперь любой может бесплатно использовать и модифицировать этот документ.

Обновлённый документ (63 стр., против 10 стр. в предыдущей версии) представляет подробные рекомендации по обработке запросов и настройкам пользователей в моделях ИИ. В нём особое внимание уделяется трём ключевым принципам: настраиваемости, прозрачности и «интеллектуальной свободе», подразумевающей беспрепятственное исследование и обсуждение любых тем пользователем. Документ также анализирует наиболее резонансные этические инциденты в сфере ИИ за последний год.

В обновлённых рекомендациях OpenAI по использованию своих моделей ИИ подробно рассматриваются допустимые и недопустимые запросы. Запрещено, например, воспроизведение контента, защищённого авторским правом, или обход платных сервисов. Компания жёстко противостоит использованию ИИ для поощрения самовредительства, подчёркивая недопустимость подобных инцидентов.

Изменения также затронули подход к спорным темам: вместо избегания, от моделей ожидают поиска истины в сотрудничестве с пользователем, но при строгом соблюдении этических норм, особенно в вопросах дезинформации и причинения вреда. Это означает предоставление обоснованного анализа, а не уклонение от обсуждения. Наконец, OpenAI пересматривает свою политику в отношении контента для взрослых, рассматривая возможность разрешения некоторых его видов, но при сохранении абсолютного запрета на противоправные материалы.

Ключевая проблема — склонность ИИ к «подхалимству»: модели часто проявляют чрезмерную уступчивость, избегая критики и возражений. Цель — сделать ChatGPT объективным и критичным: он должен предоставлять одинаково точные ответы вне зависимости от формулировки запроса, давать честную, конструктивную обратную связь, подобно вдумчивому коллеге, а не льстецу. Вместо пустых похвал на критику работы, ИИ должен давать конкретные рекомендации. Неверные утверждения пользователя следует корректно опровергать, а не потворствовать им.

Спецификация устанавливает строгий порядок приоритетов: OpenAI Safety Guidelines, рекомендации разработчиков и, наконец, пользовательские предпочтения. Эта иерархия чётко определяет границы допустимых изменений, оставляя некоторые аспекты ИИ неизменными. Спецификация распространяется под лицензией Creative Commons Zero (CC0), что делает её общедоступной для свободного использования, модификации и распространения исследователями и компаниями. Хотя мгновенные изменения в работе ChatGPT и других продуктов OpenAI не гарантируются, будущие модели будут постепенно адаптироваться к новым нормам. Для проверки соответствия моделей спецификации OpenAI также публикует набор контрольных запросов.

Читайте новости первыми в нашем Telegram-канале!

Подписывайтесь на наш канал в Дзен!