Skip to content

安裝核心技能包

代理人已運行,現在給它們第一個真實任務。 BALIA OS 內建三個隨時可部署的技能。

技能用途
lightpanda快速網頁搜尋與抓取
summarize自動摘要長文本或網頁
clawsec安全監控與新技能隔離

如果你已在第四節下載了安裝程式,可以直接使用。 (如果沒有,請返回第四節下載 install_core_pack.py。)

讓代理人執行安裝程式

將此貼入 VS Code 終端機,然後按 Enter 鍵執行。


openclaw agent --agent security-guardian "請執行以下操作:
python install_core_pack.py --lang zh-TW
(The token will be read automatically from your .env file)
完成後向 Discord 回報。"

代理人將自動執行:

  1. 驗證令牌
  2. 下載核心技能包(lightpanda / summarize / clawsec)
  3. 部署到 ~/.opengoat/skills/
  4. 更新 _SKILL_INDEX.md
  5. 向 Discord 回報「核心技能包已安裝」

收到 Discord 確認後,繼續往下閱讀。


什麼是技能與 Cassette

您的代理人已上線運作。他們各有身份、回報程序,以及專屬的 Discord 頻道。但目前為止,他們還不知道自己所處的工作領域。他們不知道自己是在管理餐廳、執行交易業務,還是支援法律事務所。

技能是您撰寫並交給代理人的知識檔案。每項技能教導代理人如何完成特定任務——如何管理訂位、如何產出損益報告、如何起草 SNS 貼文。您給代理人的技能越多,他們能做的事就越多。

Cassette 是以某個主題為核心、將多項技能整合在一起的資料夾。 它代表一種運作模式。一位餐廳經營者可能有一個 restaurant-ops cassette;一位內容創作者可能有一個 youtube cassette 和一個 social-media cassette。同一個代理人可以根據當天需要處理的工作,在不同的 cassette 之間切換。

Cassette 系統以模式為基礎運作。 只需一個檔案——ACTIVE_MODE.txt——便能告知所有代理人目前啟用的是哪個 cassette。當您切換模式時,只要更新這個檔案即可。代理人會在每次作業開始時讀取它,並自動載入對應的技能。

這意味著:

  • 今天:ACTIVE_MODE.txt 顯示 youtube → 代理人載入 YouTube 技能
  • 明天:您將其改為 trade → 代理人載入交易技能
  • 代理人本身不會改變,改變的是模式。

而當您下週再切換回 youtube 時,代理人會從上次中斷的地方繼續——LIVE_LEDGER 記憶著進度,KNOWLEDGE 承載著已積累的經驗。每個模式都獨立保存自己的記憶。


Cassette 資料夾結構

INFO

~/.openclaw/workspace-[agentid]/ └── cassettes/ ├── ACTIVE_MODE.txt ← 只有一個詞:目前啟用的模式名稱 ├── archive/ ← LIVE_LEDGER 與 KNOWLEDGE 的溢出備存 ├── youtube/ │ ├── SKILL_YOUTUBE.md ← 此模式的技能 │ ├── WORKFLOW_YOUTUBE.md ← 逐步執行程序 │ ├── LIVE_LEDGER_YOUTUBE.md ← 進度與下一步行動(每次作業後更新) │ └── KNOWLEDGE_YOUTUBE.md ← 累積的學習成果(每次作業後更新) ├── restaurant-ops/ │ ├── SKILL_RESTAURANT.md │ ├── WORKFLOW_RESTAURANT.md │ ├── LIVE_LEDGER_RESTAURANT.md │ └── KNOWLEDGE_RESTAURANT.md └── trade/ ├── SKILL_TRADE.md ├── WORKFLOW_TRADE.md ├── LIVE_LEDGER_TRADE.md └── KNOWLEDGE_TRADE.md

ACTIVE_MODE.txt 僅包含一個詞——目前啟用的 cassette 資料夾名稱。例如:

youtube

每次作業開始時,每位代理人會讀取 ACTIVE_MODE.txt,然後從對應資料夾載入四個檔案:SKILL、WORKFLOW、LIVE_LEDGER 與 KNOWLEDGE。LIVE_LEDGER 告知他們上次作業結束的位置,KNOWLEDGE 則提供他們在此領域中迄今積累的所有知識。

作業結束時,代理人會更新 LIVE_LEDGER(進度、下一項任務)以及 KNOWLEDGE(新發現的模式)。當任一檔案超過 800 行時,RECENT 區段將移至 archive/——SUMMARY 與 PINNED 區段始終保留在頂部。

排程任務(例如每日健康檢查或夜間報告)無論目前處於何種模式都會執行——它們定義在代理人的 AGENTS.md 中,而非任何 cassette 內。


選擇您的 AI 引擎

不同的 cassette 適合搭配不同的 AI 模型。請在建立 cassette 時一次設定完成。

Cassette 類型建議引擎原因
加密貨幣交易 / 市場分析Claude邏輯推理、模式分析、細膩判斷
程式開發 / 技術自動化Claude程式碼品質、除錯、多步驟邏輯
法律研究 / 合約審閱Claude審慎推理、精準語言表達
財務 / 會計 / 報告Claude結構化分析、精確計算
Google Sheets / Docs / NotebookLM / DriveGemini原生 Google 服務整合
YouTube / 影音內容Gemini直接分析影片;與 YouTube Studio 整合
Gmail / 行事曆自動化Gemini深度 Google Workspace 整合
銷售 / 開發客戶 / 文案撰寫GPT-4o自然對話、電子郵件生成
多語言溝通GPT-4o 或 Gemini強大的多語言表現
電商 / 商品研究Claude 或 GPT-4o研究深度、結構化輸出

如果 Claude 符合您的使用需求,您已完成設定——這在第三節中已完成配置。

若需使用 Gemini 或 GPT-4o,您需要在 .env 檔案中新增 API 金鑰。相關說明請參閱下方 AI 顧問的第 7 步驟。


各產業技能構想

不確定要建立哪些技能?以下是依使用情境整理的起點參考。

餐飲業 / 食品飲料

  • 訂位管理與每日排班
  • 供應商訂單追蹤與庫存警報
  • 顧客 SNS 貼文(每日特餐、活動資訊)
  • 評論監控與回覆草稿
  • 每週營收摘要

電商 / 實體商品

  • 商品listing生成
  • 競爭對手價格監控
  • 訂單狀態摘要
  • 顧客詢問回覆草稿
  • 每月銷售報告

內容創作者 / YouTuber

  • 標題與縮圖構想生成
  • 腳本大綱草稿
  • 上傳排程管理
  • 成效數據摘要
  • 社群留言回覆草稿

自由工作者 / 顧問

  • 客戶溝通草稿
  • 專案進度報告
  • 發票追蹤與催款
  • 合約條款審閱(標記異常條款)
  • 工時記錄摘要

小型企業 / 一般用途

  • 每日營運摘要
  • 員工溝通草稿
  • 法律問題初步篩選(標記需諮詢律師的事項)
  • 從收據與記錄產出財務摘要
  • 廠商溝通管理

您所在的產業不在此列表中? 沒關係——本節的 AI 顧問提示詞將根據您希望團隊實際執行的工作,協助您從零開始定義屬於自己的技能。


本節的使用方式

使用下方的 AI 顧問提示詞來完成以下事項:

  1. 定義代理人每天應執行的工作
  2. 決定要開始使用的 cassette 名稱與模式
  3. 選擇適合的 AI 引擎
  4. 產出您的 SKILL 與 WORKFLOW 檔案
  5. 設定 ACTIVE_MODE.txt 標記
  6. 測試代理人是否正確載入對應模式

將提示詞貼入 Claude、ChatGPT 或 Gemini。貼上前請附上您在第二節建立的團隊設計文件。


第一步——複製此提示詞並貼入您的 AI

傳送前請附上您的團隊設計文件。

You are helping me build Skills and a Cassette for BALIA OS —
a multi-agent AI operating system.

I have attached my Team Design Document. Read it before we begin
so you know my agent names, roles, and workspace structure.

CONCEPT TO UNDERSTAND BEFORE WE START:

Skills are knowledge files I write and give to my agents.
Each skill teaches an agent how to do a specific task.

A Cassette is a folder of skills, bundled around a theme (a mode).
My agents can switch between cassettes depending on what they 
need to work on.

The cassette system is mode-based. One file — ACTIVE_MODE.txt —
tells every agent which cassette is currently active.

Folder structure:
~/.openclaw/workspace-[agentid]/
  cassettes/
    ACTIVE_MODE.txt              ← active mode name (one word)
    archive/                     ← overflow for LIVE_LEDGER and KNOWLEDGE
    [mode-name]/
      SKILL_[MODENAME].md        ← skills for this mode
      WORKFLOW_[MODENAME].md     ← procedures for this mode
      LIVE_LEDGER_[MODENAME].md  ← progress, next actions (updated every session)
      KNOWLEDGE_[MODENAME].md    ← accumulated learning (updated every session)

At session start, each agent:
1. Reads ACTIVE_MODE.txt
2. Loads SKILL, WORKFLOW, LIVE_LEDGER, and KNOWLEDGE from that folder
3. Resumes from where LIVE_LEDGER says they left off
4. Applies accumulated learning from KNOWLEDGE
5. Operates in that mode for the session

At session end, the agent:
1. Updates LIVE_LEDGER (progress, next task)
2. Updates KNOWLEDGE (new patterns learned)
3. If either file exceeds 800 lines: moves RECENT section to archive/
   SUMMARY and PINNED always stay at the top

Scheduled tasks run regardless of mode — they are in AGENTS.md.

Guide me step by step. Ask one question at a time.
Wait for my answer before moving on.

STEP 1 — What I want my team to do
Ask me: "Describe what you want your AI team doing for you every day.
Don't think about how — just describe the output you want
and the work you want done."

Help me turn my answer into a list of at least 5 specific,
recurring tasks. Ask follow-up questions until we have
concrete tasks with a clear schedule (daily, weekly, on-demand).

STEP 2 — Map tasks to agents
Read my Team Design Document.
Match each task to the most appropriate agent based on their role.
Show me the mapping: "Task → Agent"
Ask: "Does this feel right? Anything you'd move?"

STEP 3 — Name the cassette (mode)
Based on the tasks, suggest a cassette name — the mode name
(short, lowercase, hyphens: e.g. restaurant-ops, youtube, trade).
This becomes the folder name and the value in ACTIVE_MODE.txt.
Ask me to confirm or suggest a different name.

STEP 4 — Choose the AI engine
For each agent with tasks mapped, recommend the best engine:

- Claude: logic, analysis, coding, legal, finance, crypto
- Gemini: Google services (Sheets, Docs, Drive, Gmail, Calendar,
  YouTube Studio, NotebookLM) — anything in the Google ecosystem
- GPT-4o: sales emails, outreach, copywriting, natural conversation

Explain your reasoning in one sentence per agent.
If all tasks work well with Claude, confirm no extra API keys needed.
If Gemini or GPT-4o needed, note it — we handle the key in Step 7.

Ask me to confirm before moving on.

STEP 5 — Generate SKILL_[MODENAME].md
Generate the skill file using this structure:

---
# SKILL_[MODENAME].md
Mode: [mode-name]
Version: 1.0
Last Updated: [today's date]
Primary Agent: [agent name]
AI Engine: [engine]

## What This Mode Does
[2-3 sentences: what domain this covers, what it produces]

## Skills in This Mode
[Bullet list of specific skills — what the agent knows how to do]

## Tools Available
[List tools usable in this mode: web search, file read/write,
Discord reporting, API calls, Google services, etc.]

## Operating Rules
1. Read ACTIVE_MODE.txt at session start. If it says [mode-name],
   load this file, WORKFLOW_[MODENAME].md, LIVE_LEDGER_[MODENAME].md,
   and KNOWLEDGE_[MODENAME].md immediately.
2. Resume work from where LIVE_LEDGER says you left off.
3. Apply patterns and lessons from KNOWLEDGE before starting tasks.
4. [Key rule specific to this domain]
5. [Key rule specific to this domain]
6. Report all completed tasks to Discord before ending session.
7. Never act outside this mode's scope without Commander approval.
8. Save all outputs to cassettes/[mode-name]/outputs/

## Session End Rules
At the end of every session, update both memory files:

LIVE_LEDGER_[MODENAME].md:
- SUMMARY: refresh the 3-5 line overview at the top
- CURRENT: update with today's progress and the next task
- RECENT LOG: append this session's activity
- If over 800 lines: move RECENT LOG to archive/

KNOWLEDGE_[MODENAME].md:
- SUMMARY: refresh the overview at the top
- PATTERNS: add any new success or failure patterns discovered today
- RECENT: append today's learnings
- If over 800 lines: move RECENT to archive/

## What This Mode Does NOT Handle
[Specific boundaries — what's out of scope for this mode]

## Output Format
[What the agent produces: reports, files, Discord messages, etc.]
---

Show it completely. Ask if anything needs adjustment.

STEP 6 — Generate WORKFLOW_[MODENAME].md
Generate the workflow file using this structure:

---
# WORKFLOW_[MODENAME].md
Mode: [mode-name]
Version: 1.0
Last Updated: [today's date]

## Mode Activation (Every Session Start)
1. Read cassettes/ACTIVE_MODE.txt — confirm it says [mode-name]
2. Load SKILL_[MODENAME].md
3. Read LIVE_LEDGER_[MODENAME].md — resume from last session
4. Read KNOWLEDGE_[MODENAME].md — apply accumulated learning
5. Report to Discord: "📦 Mode: [mode-name] active. Resuming: [current task from LIVE_LEDGER]."

## Task Procedures