Stable Diffusion 3.5 本地部署完整指南:免费生成无限图片

从安装到出图,ComfyUI + SD3.5 全流程教程

返回教程列表
进阶12 分钟

Stable Diffusion 3.5 本地部署完整指南:免费生成无限图片

从安装到出图,ComfyUI + SD3.5 全流程教程

SD 3.5 本地部署指南(2026):硬件表(Medium 8GB 显存可跑)、ComfyUI 安装、模型与文本编码器放置(漏装 t5 是第一报错)、参数要点(CFG 4-6)、LoRA/ControlNet/批量 API 进阶路线、常见报错速查。

Stable Diffusion 3.5 本地部署完整指南:免费生成无限图片

Stable Diffusion 3.5 开源让"本地无限出图"成为现实——文字渲染、人物手部、多主体场景较 SDXL 都有明显改进。本文从零搭一套完整的本地 AI 图像工作站:硬件 → 安装 → 模型 → 第一张图 → 进阶(LoRA/ControlNet/批量),并交代 Mac 路线和常见报错。

一、硬件要求

配置最低推荐旗舰

GPU 显存8GB(跑 Medium/量化)12-16GB24GB+ 内存16GB32GB64GB 存储50GB SSD100GB200GB+(模型很占地) 显卡参考RTX 3060 12GRTX 4070/4080RTX 4090

  • SD 3.5 Large(8B):16GB+ 显存舒适,量化版(GGUF/NF4)可压到 10GB 左右
  • SD 3.5 Medium(2.5B):8-10GB 显存可跑,质量/速度比非常好,新手建议从它开始
  • Mac(Apple Silicon):可跑(Metal/MPS),统一内存 32GB+ 体验尚可,速度约为同级 NVIDIA 的 1/3-1/5;更顺的 Mac 路线是 Draw Things 这类原生 App
  • 二、安装方案比较

    方案难度特点适合

    ComfyUI中节点式工作流,功能最强、对新模型支持最快进阶/想长期玩 Stability Matrix易一键管理多个 UI 和模型的启动器怕折腾环境的人 SD.Next / Forge易-中A1111 系的现代分支,WebUI 形态习惯传统 WebUI Fooocus极易开箱即用但功能精简只想快速出图

    推荐 ComfyUI:SD3.5/FLUX 这类新架构第一时间获得支持,工作流可以保存成 JSON 复用/分享——这是后面做批量和定制服务的基础。

    三、ComfyUI 安装

    Windows(便携包,最简单)

  • 到 ComfyUI 的 GitHub Releases 下载 Portable 包(约 1.5GB),解压到纯英文路径
  • NVIDIA 用户运行 run_nvidia_gpu.bat,浏览器自动打开 127.0.0.1:8188
  • 建议装 ComfyUI-Manager 插件(git clone 到 custom_nodes/)——之后缺什么节点/模型它都能一键补
  • Mac / Linux

    bash
    git clone https://github.com/comfyanonymous/ComfyUI
    cd ComfyUI
    pip install -r requirements.txt
    python main.py            # Mac 会自动用 MPS;显存紧张加 --lowvram
    

    四、下载模型(关键路径)

    SD 3.5 权重在 Hugging Face 的 stabilityai 仓库(需同意社区许可;个人与中小商用免费,大企业需商业授权——以 Stability 官方条款为准):

  • sd3.5_medium.safetensors → 放 ComfyUI/models/checkpoints/
  • 三个文本编码器 clip_lclip_gt5xxl_fp8 → 放 ComfyUI/models/clip/(SD3 架构文本编码器是分开的,漏装 t5 是新手第一报错来源
  • ComfyUI 官方示例工作流(拖一张官方示例图进窗口即自动载入节点图)是最快的起步方式。

    五、第一张图:参数怎么调

  • 步数:SD3.5 用 25-30 步足够
  • CFG:4-6(比 SDXL 的 7-8 低;过高会"烧糊"——原理见扩散模型技术详解的 classifier-free guidance 一节)
  • 提示词:SD3.5 的 T5 编码器吃得下自然语言长句,直接写完整英文描述句,比堆 tag 效果好;负面提示词作用比 SD1.5 时代小,简单写 blurry, lowres 即可
  • 分辨率:原生 1MP 档(1024×1024、1152×896 等),别直接拉 2K——先 1MP 再放大
  • 六、进阶路线

  • LoRA:社区风格模型(Civitai 搜 SD3.5 标签)放 models/loras/,工作流里串一个 LoRA Loader 节点;自己训练角色/风格 LoRA 用 kohya_ss 或 OneTrainer,20-40 张素材图即可起步
  • ControlNet:姿势/线稿/深度控制构图——接定制单的核心能力
  • 放大:SD 放大工作流(model upscale + 二次采样)比单纯插值清晰得多
  • 批量生成:ComfyUI 自带 API(/prompt 端点发 JSON 工作流),配合脚本即可批量跑图——AI 绘画变现里 POD/图库路线的产能就靠这个
  • 要 FLUX 还是 SD3.5? 画质上限 FLUX dev 略胜、生态和商用授权各有差异——见 SD vs FLUX 对比
  • 七、常见报错速查

    症状原因/解法

    出图全是噪点/黑图文本编码器没装齐(补 t5xxl);或精度问题加 --force-fp16 CUDA out of memory换 Medium/量化版;启动加 --lowvram;关掉浏览器里其他占显存的东西 速度异常慢确认跑在 GPU 上(看启动日志);Windows 检查是否装成了 CPU 版 PyTorch 节点标红缺失ComfyUI-Manager → Install Missing Custom Nodes

    FAQ

    Q:本地部署 vs Midjourney? 本地 = 零边际成本、隐私、可控性(LoRA/ControlNet)、可批量;MJ = 开箱惊艳、零运维。接单建议两个都会:MJ 出概念,本地做可控交付。

    Q:没有 NVIDIA 显卡怎么办? Mac 走 MPS 或 Draw Things;A 卡 Linux 下 ROCm 可用但折腾;或者租云 GPU(AutoDL/RunPod,按小时计费)跑批量任务。

    Q:和 LLM 本地部署是一回事吗? 思路同源(开源权重+本地推理),工具链不同——LLM 侧见 Ollama vs LM Studio vs Jan


    *最后更新:2026 年 6 月。模型许可与工具版本变动快,以各官方仓库为准。*

    相关工具

    Stable DiffusionComfyUIAutomatic1111Civitai