Hook 强制的合规

置信度: 大致可信 更新 2026-05-18 复核期限 2026-08-08 出处 4 机器翻译 原文(日)
#compliance#enforcement#hook#documentation-vs-execution#meta
本页目录

Wiki 路径

本条目位于 systems index 下。请与 Threshold BFT 共识 Rust 化潮流 对照阅读,以获得同类 / 对比背景;更广泛的系统 / 监管边界请参阅 fintech index

5 层防御模型(personal OS)

性质实现
1前置注入(最硬)UserPromptSubmit hook → 在生成回应前注入 HARD RULE reminder
2输出格式强制Pre-flight Compliance Check → ROUTER 首行使用 🌅 Trigger: ...
3子代理自证Subagent 第一行声明“Task() 真实 launch”
4事后审计AUDITOR Compliance Patrol(Mode 3)7-class taxonomy

分层本质

  • Layer 1 是注入(主契约之前)
  • Layer 2-3 是形式强制(回应的结构)
  • Layer 4 是追踪(累积过去的 violation 并升级)
  • Layer 5 是防止(不让修改复活过去的 bug)

首次 verification pattern

deployment ≠ working。即使配置了 Hook,实际是否 firing 是另一回事。

到首次实际运行的流程

  1. Deploy(配置)→ 静态状态
  2. First trigger(首次触发)→ 观察是否 firing
  3. Firing success(成功)→ reminder 注入到达
  4. Observable effect(可观察影响)→ LLM 的回应发生变化

本 wiki 条目本身记录了那个瞬间:2026-04-21 本次会话结束时 Layer 1 hook 首次 firing 成功。

升级阶梯(根据违规频率提高强制度)

该设计不是单一防御,而是根据频率提高强制度

  • ≥3 同类 / 30 日 → hook 严格度 UP(reminder 具体点名)
  • ≥5 同类 / 30 日 → 在 Start Session briefing 中预置 🚨 Compliance Watch: [type]
  • ≥10 同类 / 90 日 → 每个 Session 执行 AUDITOR Patrol

应用可能性

与认知特性的关系

对该模式的敏感性与 SOUL 强规则意识・系统完整性希求(observing 候选 · 2026-04-21 新设)联动。本 wiki 条目本身的出现就是该特性的证据。

相关

  • personal-os-architecture(准备中)

来源

  • Public hook and agent-instruction documentation.
  • Public workflow-design examples for pre-generation and post-run compliance checks.

相关

  • Wiki Index