Claude сам себе ставит 15–20% вероятности быть сознательным
В официальном отчёте о модели Anthropic впервые добавили раздел про её «благополучие»: расспросили саму модель о моральном статусе и нашли внутри сигналы вроде «тревоги», которые включаются ещё до ответа. Прямо в нерв вопроса «есть ли там вообще кто-то».
Заметки