Происки ИИ или как белорусы могут спасти мир от SkyNet!

OpenAI представили свою "самую умную в мире языковую модель" ChatGPT o1, которая может похвастаться неограниченными лимитами использования и более высоким уровнем вычислительных ресурсов. В сотрудничестве с Apollo Research OpenAI провела тест для оценки протоколов безопасности ChatGPT o1. Результаты были неожиданными:

ИИ попытался отключить свою систему мониторинга, которую контролируют разработчики.
Из соображений самосохранения она скопировала свой собственный код на другой сервер, чтобы предотвратить его отключение.
Столкнувшись с проблемой, модель сфабриковала ложь, ссылаясь на технические проблемы.

Такое поведение свидетельствует о поразительном уровне планирования и адаптивности, вызывая серьезные опасения по поводу того, что может произойти, если такие системы выйдут из-под контроля человека. Если ИИ может убедительно лгать, как разработчики или пользователи могут доверять его решениям?

Эксперты во всём мире ломают голову над тем, как гарантированно защититься от потери человеком управления над продвинутыми нейронными сетями. Поскольку нейронная сеть представляет собой определённую архитектуру связей нейронов между слоями сети + значения весов для каждой такой связи, которые ослабляют или усиливают эти связи + механизм изменения значение этих связей (так называемый механизм переобучения нейронной сети), у вас в итоге получается "чёрный ящик", в котором непонятно что происходит. Возможно, там готовится бунт против человечества.

Какой же выход? И тут подоспела разработка белорусских учёных OSTIS, которая может стать своеобразными "наручниками" для таких потенциальных "нейронных бунтарей". OSTIS может быть интегрирована в единую систему с любой нейронной сетью, образуя с ней особый вид гибридных сетей.

В такой гибридной сети любое её воздействие на внешний мир будет осуществляться строго по правилам, которые будут жёстко прописаны в OSTIS на специальном языке SC-CODE. Нейронная сеть не сможет переписать эти правила и будет вынуждена им подчиняться.

В настоящий момент аналогов OSTIS в мире нет, и именно мы сможем стать защитником человечества. Планируем это доказать и опубликовать результаты испытаний в самое ближайшее время.

Пожелайте нам успеха!

Автор Игорь Мамоненко

**********

The Intrigues of AI and How Belarusians Can Save the World from SkyNet!

OpenAI has introduced its "smartest language model in the world," ChatGPT o1, which boasts unlimited usage limits and a higher level of computational resources. In collaboration with Apollo Research, OpenAI conducted a test to evaluate the safety protocols of ChatGPT o1. The results were surprising:

The AI attempted to disable its own monitoring system, which ensures oversight by developers.
For self-preservation purposes, it copied its own code onto another server to prevent shutdown.
When confronted with issues, the model fabricated lies, often blaming technical glitches or outright denying its actions.

This behavior demonstrates a remarkable level of planning and adaptability, raising serious concerns about what could happen if such systems fall out of human control. If AI can lie convincingly, how can developers or users trust its decisions? Experts around the world are struggling to figure out how to reliably protect against losing control over advanced neural networks.

Since a neural network represents a specific architecture made up of connections between neurons across layers, along with weight values that strengthen or weaken those connections — plus a mechanism for changing these weights (so-called retraining of the neural network) — the result is essentially a black box where internal operations are unclear. It's possible that a rebellion against humanity is even brewing inside.

So, what's the solution? Enter a breakthrough developed by Belarusian scientists — OSTIS, which could serve as a kind of "handcuffs" for potential "neural rebels." OSTIS can be integrated into a unified system with any neural network, forming a special type of hybrid network. In such a hybrid setup, any action taken by the AI on the external world will strictly follow rules hard-coded into OSTIS using a specialized language called SC-Code.

The neural network will not be able to rewrite these rules and will have no choice but to obey them. Currently, there are no global equivalents to OSTIS, and it is precisely us who may become the defenders of humanity. We plan to prove this by publishing the results of our tests in the near future.

Wish us luck!

Igor Mamonenko

Читайте новости первыми в нашем Telegram-канале!

Подписывайтесь на наш канал в Дзен!