Anthropic

Нейросеть научили рассказывать, что у неё «в голове»

Transformer Circuits · 7 мая 2026 · 1 мин


Чтобы понять, что происходит внутри ИИ, раньше приходилось вручную расшифровывать сигналы между его нейронами. Anthropic сделали систему, которая заставляет саму модель описывать своё внутреннее состояние обычным текстом — ИИ как бы проговаривает, что он на самом деле думает.

полного текста в мозге пока нет — читай на источнике ↓

Открыть оригинал
Заметки0

разберу при дренаже → калибровка