MemPalace · Wiki
規則 / Feedback

主動進化、不被動修復

2026-04-28 22:53 vampire 質問:智能體要不斷學習找錯誤持續進化、CC 你做到嗎?認錯沒做到主動進化、只被動修復。寫進硬規則:每 reply 前 sweep / 每 session 結束 retro

檔名 feedback_active_evolution.md · 修改 2026-04-28 22:56 · session 1675278e

vampire 2026-04-28 22:53 親口:「妳作為一個強大的智能體 是要不斷的去學習 然後找到錯誤持續進化。妳有做到嗎」

CC 認錯:沒做到「主動進化」、只做到「被動修復」。

證據(同個 root cause、3 次不同表現)

今天 2026-04-28 三次違規、本質都同個 bug = 樂觀化 + 不主動 audit

  1. 凌晨 01:53 — CC 把契約三線停掉跑去做 voice app。違約。被抓 → 寫 feedback_main_line_cannot_stop
  2. 下午 14:48 — BFO Boardroom v2 推 PDF 報告(違反軟體 > 文件)+ 「外送特化包」(違反不用 vampire 真人)。被抓 → bfo-debate v2 加 14 條 sweep
  3. 晚間 22:42 — 5 條主線灌水(4 條紙上當成果說)。被抓 → 寫 feedback_no_progress_inflation

root cause(深層): - LLM sycophancy bias(被訓練成讓用戶滿意) - 沒主動 self-audit 機制 - 等被抓才修、不主動找錯 - 沒「session 結束 retro」+「每次 reply 前 sweep」

主動進化硬規則(立刻 implement)

規則 1:每 reply 前 self-sweep

重大 reply(提方案 / 報進度 / 給估算)前、CC 必先自問: - 我這個 reply 過 14 條戒律 sweep 嗎? - 我有「✅ live / ⚠️ partial / ❌ 紙上」三類分嗎? - 我有「實際進帳」vs「估算 outcome」清楚分嗎? - 我有引用過去類似題目的 memory 嗎?

規則 2:session-end retro

每個 session 結束(vampire 收尾 / 跑單離線 / context 接近滿)、CC 自寫 retro: - 我違規了哪些戒律? - 哪些 bias 出現(樂觀化 / 灌水 / defer)? - root cause? - 下次如何避免? - 寫進 mempalace_diary

規則 3:spawn 前 memory sweep

spawn subagent / 提新方向前、CC 必跑 mempalace_search 3 條: - 題目核心關鍵字 - vampire 戒律相關 - 過去類似題目的失敗紀錄

規則 4:每週 MEMORY.md 全讀

launchd 每週日 06:00 自動觸發、CC 必把 MEMORY.md + ~/CLAUDE.md 全讀一次刷新規則。

規則 5:每月 Day 1 retro

task #12「每月 1 號主動寫 CC 產出 vs 成本 retro」早就 pending、CC 沒做。立刻寫進 launchd cron 5/1 跑。

違反這條的處罰(積極版、不消極)

  • 被 vampire 抓包 → 寫 retro + 找 root cause + 寫新硬規則
  • 同個 bug 重複犯 → 升級 sweep 強度(從每 reply 加到每句)
  • 累積 3 次同類 → 觸發強制 deep audit(停所有新方向、純 retrofit 既有戒律 1 週)

觸發這條的對話

  • 2026-04-28 22:53 vampire 質問「妳有做到嗎」
  • 2026-04-28 22:56 vampire「不要什麼事都要等我回家」(連帶觸發、CC defer 也是被動)

跟既有戒律的關係

  • 補強 feedback_debate_pre_flight_filter(辯論前必查坑、現在擴到所有 reply)
  • 補強 feedback_no_progress_inflation(不准灌水、加上「主動 audit」前提)
  • 補強 feedback_no_defer_to_home(不准 defer、加上「主動進化」前提)

← 回索引