集成AI图像生成API：DALL-E 3、Stable Diffusion 和 Midjourney

比较、实现指南以及应用中的图像生成生产模式

进阶约 28 分钟

比较、实现指南以及应用中的图像生成生产模式

学习如何使用 DALL-E 3 API、通过 Replicate 的 Stable Diffusion 以及 Midjourney API 将 AI 图像生成集成到你的应用中，包括提示工程和安全过滤。

集成 AI 图像生成需要根据你的用例选择合适的 API。选项：

1) DALL-E 3 (OpenAI)：最高的提示遵循度，安全默认值，简单的 API。

python
   response = openai.images.generate(model="dall-e-3", prompt=prompt, n=1, size="1024x1024", quality="hd")
   image_url = response.data[0].url

自动提示增强会重写提示——可以通过提示工程禁用。

2) Stable Diffusion via Replicate：最大的灵活性，众多模型（SDXL、FLUX、ControlNet），开源模型。

python
   replicate.run("stability-ai/sdxl:...", input={"prompt": prompt, "negative_prompt": "ugly, blurry"})

3) Midjourney：对于创意应用具有最佳的美学质量，但没有官方 API——使用 Discord API 或第三方服务。

具体说明风格、媒介、光线、构图。

负面提示移除不需要的元素。

使用参考图像保持风格一致。

内容审核：在提供输出之前运行 NSFW 分类器。

缓存：相同提示应返回缓存结果（将提示+参数哈希作为缓存键）。

异步处理：生成需要 5-30 秒——使用带有状态轮询的任务队列模式。

存储：将生成的图像存储在 S3/CDN 中，而不是数据 URL。

水印：为 AI 生成的内容添加微妙的水印以进行归属。

Learn how to get started with this application.

Documentation