perception · 让 entity 看见你、听见你
视觉识别 + 人脸检测跟随 + VAD 语音活动检测 — the sensory layer that lets the entity perceive the room.
在体系里属于 第 4 层 · Perception 感知层 · 上游接 常驻 daemon (agent runtime 的 presence 模块) · 下游被 Cognition 认知层 (感知事件触发 agent 决策) 与 Embodiment 呈现层 (摄像头跟随驱动视线) 引用 (见 架构图)