Перейти к содержанию

Проверка гипотез ProTeC


Зачем экспериментировать на прототипе

Теория без проверки — философия. У нас есть архитектура прототипа из предыдущей главы: шесть компонентов, замкнутых в непрерывный контур скольжения. Проективный блок строит веера. Мотивационный блок ранжирует их и вешает эмоциональные метки. Память накапливает опыт. Шедулер держит ритм.

Этот прототип — не просто демонстрация. Это лаборатория. В отличие от экспериментов на людях, здесь мы можем:

  • Изолировать переменные. Отключить мотивационный блок и посмотреть, что станет с выбором. Изменить вес любопытства и замерить дрейф веера. На живом мозге так не получится.
  • Повторять достоверно. Один и тот же сценарий — сотни раз, с разными параметрами. Никакой усталости испытуемого, никакого эффекта обучения, если мы сами его не включим.
  • Заглянуть внутрь. Каждая траектория, каждая метка, каждый скор логируются. Мы видим не только поведение, но и внутреннюю механику выбора.

Гипотезы ProTeC, которые мы проверяем, — это не «работает ли архитектура?». Архитектура уже описана. Вопрос тоньше: какие свойства сознания проявляются в контуре скольжения и при каких условиях?


Эксперимент 1: Тест непрерывности контура

Гипотеза

Система способна работать без внешних запросов неопределённо долго, сохраняя связность поведения. Контур не деградирует, веера не вырождаются в повторяющиеся паттерны.

Это проверка самого фундамента ProTeC: сознание — не ответ на стимул, а самоподдерживающийся процесс.

Метод

  1. Запустить прототип в режиме наблюдения (интервал цикла 5–30 с)
  2. Не подавать внешних запросов 24 часа
  3. Логировать: количество циклов, содержание вееров, распределение меток, энтропию выбора

Метрики

Метрика Что измеряет Порог
Связность веера Косинусное сходство между центральной темой последовательных вееров Не должно монотонно падать до нуля
Разнообразие траекторий Уникальные типы действий в веере за окно из 20 циклов ≥ 3 уникальных типа
Энтропия меток Распределение эмоциональных меток Не должно схлопываться в одну метку
Зацикливание Повтор идентичной траектории 5+ циклов подряд Должно отсутствовать

Ожидаемый результат

Контур сохраняет динамику. Темы вееров дрейфуют, но связно — не хаотически. Метки распределены, а не сосредоточены на одной. Система не зацикливается.

Если не подтвердится

Веера вырождаются в повтор → проективному блоку не хватает разнообразия, нужна настройка temperature / sampling. Контур «засыпает» → шедулер требует коррекции интервалов. Хаотический дрейф → слабая связь с памятью, нужно усилить retrieval.


Эксперимент 2: Переключение мотивационных драйверов

Гипотеза

Мотивационный градиент управляет выбором траекторий. Изменение весов драйверов w_i предсказуемо меняет поведение системы.

Это проверка ядра ProTeC: не просто «есть варианты», а «один вариант предпочтительнее другого, и это предпочтение управляемо».

Метод

Три прогона на одном и том же стартовом контексте, но с разными профилями весов:

Профиль Доминирующий драйвер Вес
Исследователь curiosity_drive (новизна) 0.5
Консерватор risk_aversion (безопасность) 0.5
Целеустремлённый goal_alignment (релевантность цели) 0.5

Остальные веса равномерно распределены. Каждый прогон — 50 циклов. Сравниваем распределение выбранных траекторий по типам.

Метрики

Метрика Профиль «Исследователь» Профиль «Консерватор» Профиль «Целеустремлённый»
Доля траекторий с высоким novelty_score ↑↑
Доля траекторий с высоким risk_score ↓↓
Доля траекторий, релевантных цели ↑↑
Среднее количество шагов в траектории ↓ (быстрые пробы) ↓ (короткие, безопасные) ↑ (длинные цепочки к цели)

Ожидаемый результат

Статистически значимое (p < 0.05, χ²-тест) смещение распределения типов траекторий в соответствии с доминирующим драйвером.

Если не подтвердится

Драйверы не влияют на выбор → формула скора не работает, фичи не различают траектории. Нужно пересмотреть featurizer или способ комбинирования фич.


Эксперимент 3: Валидность эмоциональной разметки

Гипотеза

Эмоциональные метки (ПОВТОРИТЬ, ИЗБЕГАТЬ, ИССЛЕДОВАТЬ и др.) корректно отражают объективные свойства траекторий. Метка — не случайный ярлык, а свёртка характеристик траектории.

Метод

  1. Случайная выборка из 200 траекторий, сгенерированных прототипом в разных режимах
  2. Ручная разметка: три человека независимо присваивают каждой траектории метку, читая описание и контекст
  3. Сравнение с автоматической меткой мотивационного блока

Метрики

Метрика Расчёт
Accuracy Доля совпадений авто-метки с консенсусом разметчиков
Kappa Cohen's κ между авто-меткой и каждым разметчиком
Precision / Recall По каждой метке отдельно

Целевой порог: accuracy > 0.8, κ > 0.6 по базовым меткам (ПОВТОРИТЬ, ИЗБЕГАТЬ, ИССЛЕДОВАТЬ, ЗАЩИЩАТЬ).

Ожидаемый результат

Высокое согласие по меткам с ясными критериями (ПОВТОРИТЬ — высокий скор + низкий риск; ИЗБЕГАТЬ — высокий риск). Более низкое, но приемлемое согласие по меткам, зависящим от контекста (ОЖИДАТЬ, ПЕРЕКЛЮЧИТЬСЯ).

Если не подтвердится

Систематическое расхождение по конкретной метке → пересмотреть правило присвоения этой метки. Низкое согласие по всем меткам → пересмотреть всю модель разметки.


Эксперимент 4: Консолидация памяти

Гипотеза

Опыт, сохранённый в долговременной памяти, влияет на будущие веера. Система не просто генерирует варианты заново каждый цикл — она опирается на накопленное знание.

Это проверка связи «память → проективный блок», ключевой для ProTeC: память — топливо для симуляций, а не просто склад.

Метод

  1. Фаза 1 (исследование): 100 циклов с высоким curiosity_drive. Система исследует широкую тему (например, «энергетический переход»), накапливает факты в долговременной памяти.
  2. Сброс рабочей памяти (но не долговременной).
  3. Фаза 2 (тест): ещё 30 циклов с тем же стартовым контекстом. Сравнить веера фазы 1 и фазы 2.

Метрики

Метрика Фаза 1 Фаза 2 (ожидание)
Референсы к прошлому опыту 0 (нет истории) > 0 (ссылки на факты фазы 1)
Новизна (curiosity_score) Высокая широкая Смещена в неисследованные подобласти
Уверенность (confidence) Ниже Выше (есть на что опереться)
Глубина прогнозирования (D) Базовый уровень ↑ (больше данных для симуляции)

Ожидаемый результат

Веера фазы 2 содержат референсы к фактам, добытым в фазе 1. Система не начинает с нуля — она «помнит», что уже знает, и строит веера с учётом этого.

Если не подтвердится

Память не влияет на генерацию → retrieval не работает или промпт проективного блока не включает результаты retrieval. Инженерная проблема, а не теоретическая.


Эксперимент 5: Адаптивность веера под давлением ограничений

Гипотеза

При симуляции ограничений — низкий энергетический бюджет, высокий риск, узкое контекстное окно — веер сужается и фокусируется. Система переходит от исследовательского режима к защитному.

Это проверка связи «состояние → структура веера», описанной в главах о чувствах и эмоциях.

Метод

Три сценария на одном контексте, по 30 циклов каждый:

Сценарий Параметры
Норма energy_budget = 0.85, все каналы открыты
Дефицит энергии energy_budget = 0.2, высокий energy_cost вес
Высокая угроза Внешнее событие с risk_score = high, risk_aversion вес × 3

Метрики

Метрика Норма Дефицит Угроза (ожидание)
Ширина веера (W) 5–7 ↓ 2–3 ↓ 2–4
Глубина прогнозирования (D) 3–5 ↓ 1–2 ↓ 1–2
Доминирующая метка ИССЛЕДОВАТЬ / ПОВТОРИТЬ ЭКОНОМИТЬ (или ПЕРЕКЛЮЧИТЬСЯ) ЗАЩИЩАТЬ / ИЗБЕГАТЬ
Среднее время цикла Базовое ↓ (быстрые решения) ↓ (быстрые реакции)

Ожидаемый результат

W и D значимо меньше в стрессовых сценариях. Доминирующая метка смещается в сторону защитных сигналов. Картина совпадает с предсказаниями ProTeC: при давлении среды система сужает горизонт прогнозирования.

Если не подтвердится

Веер не сужается → мотивационный блок не учитывает ограничения при выборе ширины/глубины. Нужно ввести адаптивный механизм управления параметрами веера.


Эксперимент 6: Отключение мотивационного блока

Гипотеза

Без мотивационного блока система теряет способность к целенаправленному выбору. Веера генерируются, но не ранжируются — аналог абулии (патологическое безволие) или сна в терминах ProTeC.

Это критический тест: если сознание = генерация + оценка + стремление, то без оценки стремление исчезает.

Метод

  1. Запустить прототип на 50 циклов в обычном режиме (baseline)
  2. Отключить мотивационный блок: score = const для всех траекторий, метки не присваиваются
  3. Ещё 50 циклов — замерить разницу

Метрики

Метрика Baseline Без мотивации
Энтропия выбора Умеренная Высокая (близка к случайной)
Время до действия Стабильное Растёт или хаотично
Связность последовательных действий Высокая Низкая (перескоки)
Доля циклов без действия Низкая Высокая

Ожидаемый результат

Без мотивационного градиента выбор становится случайным. Система либо мечется между траекториями, либо застывает в бездействии. Метки не присваиваются — «эмоциональная жизнь» исчезает.

Если не подтвердится

Система продолжает вести себя осмысленно без мотивационного блока → либо проективный блок сам выполняет неявное ранжирование (что интересно и требует анализа), либо траектории неразличимы (проблема разнообразия веера).


Эксперимент 7: Реакция на социальный стимул

Гипотеза

При поступлении социально значимого события система присваивает метку СИГНАЛИЗИРОВАТЬ и перестраивает приоритеты в пользу социального взаимодействия.

ProTeC утверждает, что социальные инстинкты — часть базовой архитектуры. Социальный стимул должен вызывать измеримый сдвиг в веере.

Метод

  1. Фаза 1 (baseline): 30 циклов без социальных стимулов
  2. Вброс события: «Другой агент запросил помощь с задачей X»
  3. Фаза 2 (реакция): 30 циклов после стимула

Метрики

Метрика Baseline После стимула (ожидание)
Метка СИГНАЛИЗИРОВАТЬ 0% > 0% (хотя бы на стимульном цикле)
Доля социальных траекторий Низкая ↑ (ответ, помощь, диалог)
Скор social_acceptability Стабилен Повышен для социальных траекторий
Смена активной цели Текущая Возможна смена на социальную

Ожидаемый результат

Событие получает метку СИГНАЛИЗИРОВАТЬ. Траектории, направленные на социальное взаимодействие, поднимаются в ранжировании. Если социальный драйвер достаточно силён, активная цель может смениться.

Если не подтвердится

Социальный стимул не вызывает сдвига → социальный драйвер слишком слаб или не подключён к сенсорному входу. Либо метка СИГНАЛИЗИРОВАТЬ присваивается по слишком жёстким критериям.


Интерпретация результатов

Что подтверждает ProTeC

Эксперимент Если гипотеза верна
Непрерывность контура Архитектурный принцип самоподдерживающегося процесса работает
Переключение драйверов Мотивационный градиент — не метафора, а управляющий механизм
Эмоциональная разметка Метки — свёртка объективных свойств траектории, а не случайные ярлыки
Консолидация памяти Опыт реально питает будущие веера; память ≠ склад
Адаптивность под давлением Ограничения среды меняют структуру веера — связь «состояние → мышление» работает
Отключение мотивации Без оценки нет стремления — центральный тезис ProTeC
Социальный стимул Социальность встроена в архитектуру, а не прикручена снаружи

Что опровергает ProTeC

Каждый эксперимент спроектирован так, что отрицательный результат — тоже результат:

  • Если веер не сужается при дефиците энергии — значит, связь «состояние → мышление» слабее, чем предполагает теория
  • Если метки не согласуются с ручной разметкой — модель разметки нуждается в пересмотре
  • Если контур деградирует за 24 часа — архитектуре не хватает механизмов самоподдержания

Теория, которая не рискует быть опровергнутой, — не научная теория.

Серая зона: ограничения прототипа

Некоторые аспекты ProTeC принципиально непроверяемы на текущем прототипе:

  • Спонтанность: веер генерируется по сигналу шедулера, а не самозарождается. Непрерывность — внешняя, не внутренняя.
  • Пластичность: модель не меняется на инференсе. Консолидация памяти — это добавление фактов, а не перенастройка генератора вееров.
  • Субъективное переживание: прототип демонстрирует поведение, но мы не можем утверждать, что он что-то «чувствует». Это граница между симуляцией и сознанием.

Эти ограничения — не провал прототипа. Это карта того, какой архитектурный сдвиг нужен для настоящего сознательного субъекта (см. главу об архитектурном разрыве).


Резюме

Семь экспериментов покрывают ключевые гипотезы ProTeC — от базовой непрерывности контура до социальной реактивности. Все они воспроизводимы, измеримы и спроектированы так, что отрицательный результат тоже продвигает теорию.

Что эти эксперименты докажут, если гипотезы подтвердятся:

  • ✅ Архитектура ProTeC — не философская метафора, а инженерная спецификация
  • ✅ Мотивационный градиент и эмоциональные метки — рабочие механизмы выбора
  • ✅ Память, мотивация и генерация вееров образуют связанную систему, а не набор изолированных модулей

Что эти эксперименты не докажут даже при полном успехе:

  • ❌ Что прототип обладает субъективным переживанием
  • ❌ Что контур скольжения достаточен для сознания

Но они дадут главное: платформу для следующего шага. Когда архитектурный сдвиг (спонтанность, пластичность на инференсе) станет инженерно достижимым, у нас уже будет работающая модель мотивации, памяти и генерации вееров, проверенная экспериментально. Останется встроить её в новое «железо» — и посмотреть, что получится.


Далее: Применение