Проверка гипотез ProTeC¶
Зачем экспериментировать на прототипе¶
Теория без проверки — философия. У нас есть архитектура прототипа из предыдущей главы: шесть компонентов, замкнутых в непрерывный контур скольжения. Проективный блок строит веера. Мотивационный блок ранжирует их и вешает эмоциональные метки. Память накапливает опыт. Шедулер держит ритм.
Этот прототип — не просто демонстрация. Это лаборатория. В отличие от экспериментов на людях, здесь мы можем:
- Изолировать переменные. Отключить мотивационный блок и посмотреть, что станет с выбором. Изменить вес любопытства и замерить дрейф веера. На живом мозге так не получится.
- Повторять достоверно. Один и тот же сценарий — сотни раз, с разными параметрами. Никакой усталости испытуемого, никакого эффекта обучения, если мы сами его не включим.
- Заглянуть внутрь. Каждая траектория, каждая метка, каждый скор логируются. Мы видим не только поведение, но и внутреннюю механику выбора.
Гипотезы ProTeC, которые мы проверяем, — это не «работает ли архитектура?». Архитектура уже описана. Вопрос тоньше: какие свойства сознания проявляются в контуре скольжения и при каких условиях?
Эксперимент 1: Тест непрерывности контура¶
Гипотеза¶
Система способна работать без внешних запросов неопределённо долго, сохраняя связность поведения. Контур не деградирует, веера не вырождаются в повторяющиеся паттерны.
Это проверка самого фундамента ProTeC: сознание — не ответ на стимул, а самоподдерживающийся процесс.
Метод¶
- Запустить прототип в режиме наблюдения (интервал цикла 5–30 с)
- Не подавать внешних запросов 24 часа
- Логировать: количество циклов, содержание вееров, распределение меток, энтропию выбора
Метрики¶
| Метрика | Что измеряет | Порог |
|---|---|---|
| Связность веера | Косинусное сходство между центральной темой последовательных вееров | Не должно монотонно падать до нуля |
| Разнообразие траекторий | Уникальные типы действий в веере за окно из 20 циклов | ≥ 3 уникальных типа |
| Энтропия меток | Распределение эмоциональных меток | Не должно схлопываться в одну метку |
| Зацикливание | Повтор идентичной траектории 5+ циклов подряд | Должно отсутствовать |
Ожидаемый результат¶
Контур сохраняет динамику. Темы вееров дрейфуют, но связно — не хаотически. Метки распределены, а не сосредоточены на одной. Система не зацикливается.
Если не подтвердится¶
Веера вырождаются в повтор → проективному блоку не хватает разнообразия, нужна настройка temperature / sampling. Контур «засыпает» → шедулер требует коррекции интервалов. Хаотический дрейф → слабая связь с памятью, нужно усилить retrieval.
Эксперимент 2: Переключение мотивационных драйверов¶
Гипотеза¶
Мотивационный градиент управляет выбором траекторий. Изменение весов драйверов w_i предсказуемо меняет поведение системы.
Это проверка ядра ProTeC: не просто «есть варианты», а «один вариант предпочтительнее другого, и это предпочтение управляемо».
Метод¶
Три прогона на одном и том же стартовом контексте, но с разными профилями весов:
| Профиль | Доминирующий драйвер | Вес |
|---|---|---|
| Исследователь | curiosity_drive (новизна) |
0.5 |
| Консерватор | risk_aversion (безопасность) |
0.5 |
| Целеустремлённый | goal_alignment (релевантность цели) |
0.5 |
Остальные веса равномерно распределены. Каждый прогон — 50 циклов. Сравниваем распределение выбранных траекторий по типам.
Метрики¶
| Метрика | Профиль «Исследователь» | Профиль «Консерватор» | Профиль «Целеустремлённый» |
|---|---|---|---|
Доля траекторий с высоким novelty_score |
↑↑ | ↓ | → |
Доля траекторий с высоким risk_score |
→ | ↓↓ | → |
| Доля траекторий, релевантных цели | → | → | ↑↑ |
| Среднее количество шагов в траектории | ↓ (быстрые пробы) | ↓ (короткие, безопасные) | ↑ (длинные цепочки к цели) |
Ожидаемый результат¶
Статистически значимое (p < 0.05, χ²-тест) смещение распределения типов траекторий в соответствии с доминирующим драйвером.
Если не подтвердится¶
Драйверы не влияют на выбор → формула скора не работает, фичи не различают траектории. Нужно пересмотреть featurizer или способ комбинирования фич.
Эксперимент 3: Валидность эмоциональной разметки¶
Гипотеза¶
Эмоциональные метки (ПОВТОРИТЬ, ИЗБЕГАТЬ, ИССЛЕДОВАТЬ и др.) корректно отражают объективные свойства траекторий. Метка — не случайный ярлык, а свёртка характеристик траектории.
Метод¶
- Случайная выборка из 200 траекторий, сгенерированных прототипом в разных режимах
- Ручная разметка: три человека независимо присваивают каждой траектории метку, читая описание и контекст
- Сравнение с автоматической меткой мотивационного блока
Метрики¶
| Метрика | Расчёт |
|---|---|
| Accuracy | Доля совпадений авто-метки с консенсусом разметчиков |
| Kappa | Cohen's κ между авто-меткой и каждым разметчиком |
| Precision / Recall | По каждой метке отдельно |
Целевой порог: accuracy > 0.8, κ > 0.6 по базовым меткам (ПОВТОРИТЬ, ИЗБЕГАТЬ, ИССЛЕДОВАТЬ, ЗАЩИЩАТЬ).
Ожидаемый результат¶
Высокое согласие по меткам с ясными критериями (ПОВТОРИТЬ — высокий скор + низкий риск; ИЗБЕГАТЬ — высокий риск). Более низкое, но приемлемое согласие по меткам, зависящим от контекста (ОЖИДАТЬ, ПЕРЕКЛЮЧИТЬСЯ).
Если не подтвердится¶
Систематическое расхождение по конкретной метке → пересмотреть правило присвоения этой метки. Низкое согласие по всем меткам → пересмотреть всю модель разметки.
Эксперимент 4: Консолидация памяти¶
Гипотеза¶
Опыт, сохранённый в долговременной памяти, влияет на будущие веера. Система не просто генерирует варианты заново каждый цикл — она опирается на накопленное знание.
Это проверка связи «память → проективный блок», ключевой для ProTeC: память — топливо для симуляций, а не просто склад.
Метод¶
- Фаза 1 (исследование): 100 циклов с высоким
curiosity_drive. Система исследует широкую тему (например, «энергетический переход»), накапливает факты в долговременной памяти. - Сброс рабочей памяти (но не долговременной).
- Фаза 2 (тест): ещё 30 циклов с тем же стартовым контекстом. Сравнить веера фазы 1 и фазы 2.
Метрики¶
| Метрика | Фаза 1 | Фаза 2 (ожидание) |
|---|---|---|
| Референсы к прошлому опыту | 0 (нет истории) | > 0 (ссылки на факты фазы 1) |
| Новизна (curiosity_score) | Высокая широкая | Смещена в неисследованные подобласти |
| Уверенность (confidence) | Ниже | Выше (есть на что опереться) |
| Глубина прогнозирования (D) | Базовый уровень | ↑ (больше данных для симуляции) |
Ожидаемый результат¶
Веера фазы 2 содержат референсы к фактам, добытым в фазе 1. Система не начинает с нуля — она «помнит», что уже знает, и строит веера с учётом этого.
Если не подтвердится¶
Память не влияет на генерацию → retrieval не работает или промпт проективного блока не включает результаты retrieval. Инженерная проблема, а не теоретическая.
Эксперимент 5: Адаптивность веера под давлением ограничений¶
Гипотеза¶
При симуляции ограничений — низкий энергетический бюджет, высокий риск, узкое контекстное окно — веер сужается и фокусируется. Система переходит от исследовательского режима к защитному.
Это проверка связи «состояние → структура веера», описанной в главах о чувствах и эмоциях.
Метод¶
Три сценария на одном контексте, по 30 циклов каждый:
| Сценарий | Параметры |
|---|---|
| Норма | energy_budget = 0.85, все каналы открыты |
| Дефицит энергии | energy_budget = 0.2, высокий energy_cost вес |
| Высокая угроза | Внешнее событие с risk_score = high, risk_aversion вес × 3 |
Метрики¶
| Метрика | Норма | Дефицит | Угроза (ожидание) |
|---|---|---|---|
| Ширина веера (W) | 5–7 | ↓ 2–3 | ↓ 2–4 |
| Глубина прогнозирования (D) | 3–5 | ↓ 1–2 | ↓ 1–2 |
| Доминирующая метка | ИССЛЕДОВАТЬ / ПОВТОРИТЬ | ЭКОНОМИТЬ (или ПЕРЕКЛЮЧИТЬСЯ) | ЗАЩИЩАТЬ / ИЗБЕГАТЬ |
| Среднее время цикла | Базовое | ↓ (быстрые решения) | ↓ (быстрые реакции) |
Ожидаемый результат¶
W и D значимо меньше в стрессовых сценариях. Доминирующая метка смещается в сторону защитных сигналов. Картина совпадает с предсказаниями ProTeC: при давлении среды система сужает горизонт прогнозирования.
Если не подтвердится¶
Веер не сужается → мотивационный блок не учитывает ограничения при выборе ширины/глубины. Нужно ввести адаптивный механизм управления параметрами веера.
Эксперимент 6: Отключение мотивационного блока¶
Гипотеза¶
Без мотивационного блока система теряет способность к целенаправленному выбору. Веера генерируются, но не ранжируются — аналог абулии (патологическое безволие) или сна в терминах ProTeC.
Это критический тест: если сознание = генерация + оценка + стремление, то без оценки стремление исчезает.
Метод¶
- Запустить прототип на 50 циклов в обычном режиме (baseline)
- Отключить мотивационный блок:
score = constдля всех траекторий, метки не присваиваются - Ещё 50 циклов — замерить разницу
Метрики¶
| Метрика | Baseline | Без мотивации |
|---|---|---|
| Энтропия выбора | Умеренная | Высокая (близка к случайной) |
| Время до действия | Стабильное | Растёт или хаотично |
| Связность последовательных действий | Высокая | Низкая (перескоки) |
| Доля циклов без действия | Низкая | Высокая |
Ожидаемый результат¶
Без мотивационного градиента выбор становится случайным. Система либо мечется между траекториями, либо застывает в бездействии. Метки не присваиваются — «эмоциональная жизнь» исчезает.
Если не подтвердится¶
Система продолжает вести себя осмысленно без мотивационного блока → либо проективный блок сам выполняет неявное ранжирование (что интересно и требует анализа), либо траектории неразличимы (проблема разнообразия веера).
Эксперимент 7: Реакция на социальный стимул¶
Гипотеза¶
При поступлении социально значимого события система присваивает метку СИГНАЛИЗИРОВАТЬ и перестраивает приоритеты в пользу социального взаимодействия.
ProTeC утверждает, что социальные инстинкты — часть базовой архитектуры. Социальный стимул должен вызывать измеримый сдвиг в веере.
Метод¶
- Фаза 1 (baseline): 30 циклов без социальных стимулов
- Вброс события: «Другой агент запросил помощь с задачей X»
- Фаза 2 (реакция): 30 циклов после стимула
Метрики¶
| Метрика | Baseline | После стимула (ожидание) |
|---|---|---|
| Метка СИГНАЛИЗИРОВАТЬ | 0% | > 0% (хотя бы на стимульном цикле) |
| Доля социальных траекторий | Низкая | ↑ (ответ, помощь, диалог) |
| Скор social_acceptability | Стабилен | Повышен для социальных траекторий |
| Смена активной цели | Текущая | Возможна смена на социальную |
Ожидаемый результат¶
Событие получает метку СИГНАЛИЗИРОВАТЬ. Траектории, направленные на социальное взаимодействие, поднимаются в ранжировании. Если социальный драйвер достаточно силён, активная цель может смениться.
Если не подтвердится¶
Социальный стимул не вызывает сдвига → социальный драйвер слишком слаб или не подключён к сенсорному входу. Либо метка СИГНАЛИЗИРОВАТЬ присваивается по слишком жёстким критериям.
Интерпретация результатов¶
Что подтверждает ProTeC¶
| Эксперимент | Если гипотеза верна |
|---|---|
| Непрерывность контура | Архитектурный принцип самоподдерживающегося процесса работает |
| Переключение драйверов | Мотивационный градиент — не метафора, а управляющий механизм |
| Эмоциональная разметка | Метки — свёртка объективных свойств траектории, а не случайные ярлыки |
| Консолидация памяти | Опыт реально питает будущие веера; память ≠ склад |
| Адаптивность под давлением | Ограничения среды меняют структуру веера — связь «состояние → мышление» работает |
| Отключение мотивации | Без оценки нет стремления — центральный тезис ProTeC |
| Социальный стимул | Социальность встроена в архитектуру, а не прикручена снаружи |
Что опровергает ProTeC¶
Каждый эксперимент спроектирован так, что отрицательный результат — тоже результат:
- Если веер не сужается при дефиците энергии — значит, связь «состояние → мышление» слабее, чем предполагает теория
- Если метки не согласуются с ручной разметкой — модель разметки нуждается в пересмотре
- Если контур деградирует за 24 часа — архитектуре не хватает механизмов самоподдержания
Теория, которая не рискует быть опровергнутой, — не научная теория.
Серая зона: ограничения прототипа¶
Некоторые аспекты ProTeC принципиально непроверяемы на текущем прототипе:
- Спонтанность: веер генерируется по сигналу шедулера, а не самозарождается. Непрерывность — внешняя, не внутренняя.
- Пластичность: модель не меняется на инференсе. Консолидация памяти — это добавление фактов, а не перенастройка генератора вееров.
- Субъективное переживание: прототип демонстрирует поведение, но мы не можем утверждать, что он что-то «чувствует». Это граница между симуляцией и сознанием.
Эти ограничения — не провал прототипа. Это карта того, какой архитектурный сдвиг нужен для настоящего сознательного субъекта (см. главу об архитектурном разрыве).
Резюме¶
Семь экспериментов покрывают ключевые гипотезы ProTeC — от базовой непрерывности контура до социальной реактивности. Все они воспроизводимы, измеримы и спроектированы так, что отрицательный результат тоже продвигает теорию.
Что эти эксперименты докажут, если гипотезы подтвердятся:
- ✅ Архитектура ProTeC — не философская метафора, а инженерная спецификация
- ✅ Мотивационный градиент и эмоциональные метки — рабочие механизмы выбора
- ✅ Память, мотивация и генерация вееров образуют связанную систему, а не набор изолированных модулей
Что эти эксперименты не докажут даже при полном успехе:
- ❌ Что прототип обладает субъективным переживанием
- ❌ Что контур скольжения достаточен для сознания
Но они дадут главное: платформу для следующего шага. Когда архитектурный сдвиг (спонтанность, пластичность на инференсе) станет инженерно достижимым, у нас уже будет работающая модель мотивации, памяти и генерации вееров, проверенная экспериментально. Останется встроить её в новое «железо» — и посмотреть, что получится.
Далее: Применение