Anthropic

Claude сам себе ставит 15–20% вероятности быть сознательным

System Card Opus 4.6 · 5 фев 2026 · 1 мин


В официальном отчёте о модели Anthropic впервые добавили раздел про её «благополучие»: расспросили саму модель о моральном статусе и нашли внутри сигналы вроде «тревоги», которые включаются ещё до ответа. Прямо в нерв вопроса «есть ли там вообще кто-то».

💾 сохранено — полный текст подтянет агент при разборе

Открыть оригинал
Заметки0

разберу при дренаже → калибровка