Anthropic

У «характера» ИИ нашли рычаг, которым его можно двигать

Anthropic Research · 19 янв 2026 · 1 мин

Внутри модели выделили сотни «личностей-архетипов» и одну главную ось — насколько ИИ остаётся в роли вежливого ассистента. Чем дальше модель уезжает от этой оси, тем выше шанс, что её взломают. По той же оси характер можно и стабилизировать.

полного текста в мозге пока нет — читай на источнике ↓

Открыть оригинал

Заметки0

разберу при дренаже → калибровка