小型语言模型(SLM)完全指南：Phi-3、Gemma和端侧AI的部署实践

在手机和边缘设备上运行高质量AI，解锁隐私保护的本地AI应用

高级约 35 分钟

小型语言模型(SLM)完全指南：Phi-3、Gemma和端侧AI的部署实践

在手机和边缘设备上运行高质量AI，解锁隐私保护的本地AI应用

深入介绍小型语言模型的技术特点和部署方案，包括Phi-3、Gemma 2、Llama 3.2等模型的对比测评，以及在iOS/Android、Raspberry Pi和工业边缘设备上的部署实践。

小型语言模型SLM端侧AIPhi-3边缘计算

SLM端侧AI部署指南：主流SLM对比（Phi-3-mini 3.8B最强小模型；Gemma 2 2B Google推出性能超预期；Llama 3.2 1B/3B极小尺寸；Mistral 7B均衡选择）；设备端部署框架（llama.cpp CPU推理原生支持；MLC-LLM WebGPU浏览器部署；Core ML苹果设备优化；ONNX Runtime跨平台）；iOS部署（Apple Intelligence内置模型API；Core ML Stable Diffusion；Swift+CoreML本地推理示例）；Android部署（MediaPipe LLM Inference API；GGUF模型格式；TFLite量化模型）；边缘服务器部署（Raspberry Pi 4/5 llama.cpp；NVIDIA Jetson实时推理；内存优化：4-bit量化）；应用场景（离线翻译/本地代码助手/隐私数据分析/工厂边缘检测）；SLM vs LLM选型（复杂推理→LLM API；简单任务/实时/隐私→SLM）。

Getting Started

Learn how to get started with this application.

Learn more

Installation Guide

小型语言模型(SLM)完全指南：Phi-3、Gemma和端侧AI的部署实践

Documentation

Getting Started

Learn more