【進階班】全日課程
Claude Code + ComfyUI
AI 助理的影音魔法與自動化操作
這不是一堂單純教你玩 AI 工具的課,而是帶你打造一套真正能工作的 AI 助理系統。
多數人需要的不是像 OpenClaw 那樣的大型系統,而是「最聰明的模型」加上「可靠、可持續的服務流程」。本課程將從現有 AI 服務開始,逐步帶你理解 Claude Code、ComfyUI、語音辨識、語音合成與向量記憶資料庫的整合方式,讓你的 AI 助理不只會回答問題,還能聽見、看見、記住,甚至生成圖片與影片。
課程將以 Claude Code 作為 AI 大腦核心,搭配 ComfyUI 影像生成工作流,並整合 ASR 語音辨識、TTS 語音合成與簡易向量資料庫,協助你建立一套具備完整感知能力的 AI 助理架構。
即使你只有 8GB 顯卡,也不該浪費它。本課程會示範如何在有限硬體資源下,最大化 GPU 的實用價值。
課程適合對象
適合已經有基礎 AI 工具使用經驗,並想進一步學習 AI 助理、自動化工作流、本地模型與影音生成應用的學員。
尤其適合:
想打造個人 AI 助理的人
想學習 Claude Code 實戰應用的人
想理解 ComfyUI 工作流的人
想結合語音、圖片、影片與記憶功能的人
想低成本開始建立 AI Agent 服務的人
想善用本地 GPU 或雲端 API 的進階學習者
基礎訂閱需求
Claude Code 20 美元方案|必要
Claude Sonnet 4.6 是目前非常強大的程式輔助模型,而 Claude Code 能讓模型直接協助你操作電腦環境、撰寫程式、整理專案與建立 AI 助理工作流。
硬體需求|二選一
方案 A|雲端方案:RunningHub 最低 9 美元方案
適合沒有獨立顯卡,或本地 GPU 效能不足的學員。
優點是無需準備本地 GPU,只要透過瀏覽器即可操作 ComfyUI,學習基礎影像生成與工作流概念。
需注意的是,低價方案可能會有較長的 API 等待時間;部分本地記憶、ASR 語音辨識等功能,也可能需要改用雲端 API 替代。
方案 B|本地方案:NVIDIA RTX 4060 以上,建議 8GB VRAM 以上
適合希望在本地端運行 AI 工作流的學員。
你可以善用自己的 NVIDIA 顯卡,即使是 8GB VRAM,也能完成許多實用任務。本地運行的優點是資料更安全,也能減少長期雲端費用。
需注意的是,影片生成通常建議至少 12GB 至 16GB VRAM 以上;若使用 8GB 顯卡,圖片生成品質與影片生成能力會受到限制。不過 ASR、TTS、記憶資料庫與部分 ComfyUI 工作流仍可順利運作。
本地學習需要具備一定電腦操作基礎。由於現場網路環境可能不穩,學員需於課前完成模型與檔案準備。開課前會提供準備清單,包含需要下載的模型與檔案放置位置。
低成本替代方案
除了 ComfyUI 本地搭設之外,本課程也會介紹雲端 API 的替代做法,讓想要先低成本開始的學員,也能建立可運作的 AI 助理雛形。
你將學到什麼
Claude Code 的感官系統
相機|Vision
讓 AI 看懂截圖、相機畫面、設計稿與視覺資料。
耳朵|ASR 語音辨識
整合本地 Whisper 或 Qwen ASR 模型,讓你用說話的方式輸入指令。
記憶|簡易向量資料庫
建立 AI 助理的記憶能力,讓它記住你說過的內容、專案資料與常用知識。
畫筆|ComfyUI
學習文字生成圖片、影片生成、角色一致性與常用影像工作流。
聲音與影片|TTS 與複合應用
整合語音合成、影片生成與多模態應用,並說明在硬體不足時可以如何改用雲端方案。
課程實作內容
安裝與配置 Claude Code 本地環境,打造真正聰明的 AI 助理。
理解 ComfyUI 基礎節點架構與常用工作流,建立可長期使用的本地模型機制。
整合 ASR 語音辨識,讓 AI 能聽懂你的語音指令。
整合 TTS 語音合成,讓 AI 能用聲音回應你。
建立簡易向量資料庫 LanceDB,讓 AI 具備基本記憶能力。
學習如何在本地端與雲端方案之間做取捨,建立更穩定、更可持續的 AI Agent 應用。
課程核心理念
最聰明的模型,搭配更安全、更可靠的工作流,才能打造真正可用的 AI 助理。
AI 的能力,不只來自模型本身,更來自你如何設計它的感官、記憶、工具與邊界。


