图片模型

根据文本生成图片

平台的生图模型支持两种主要用法：一是仅通过prompt输入，由模型直接生成图像；二是以已有图片为基础，结合新的prompt，实现图像的变体创作。

基于文本描述生成图片为了提升图像生成的精度和效果，建议在输入prompt时注意以下几点：
- 细致描述：明确且详细地描述你想要的场景。例如，想生成海滩日落画面，与其只输入“海滩日落”，不如说明“在宁静的海滩，夕阳染红天空，海浪轻拍沙滩，远处可见小船”。
- 情绪与氛围：可以在prompt中补充如“温馨”、“神秘”或“有活力”等词，帮助模型把握你希望呈现的整体感受或风格。
- 指明风格：如有特定的美术风格需求，可直接说明，例如“印象派”或“超现实主义”，提高与预期的一致性。
- 避免含糊表达：尽量不用“美丽”、“好看”等主观或模糊词汇，这类描述难以转换为具体画面。
- 使用排除语句：如不想出现某些元素，可在prompt中明确指出例外，如“不要有船”。
- 分阶段描写：对于复杂内容，建议先生成基础画面，再逐步通过细节调整完善最终图像。
- 多样化描述：尝试不同措辞或表达角度，有时对同一场景的不同描述会产生风格各异的视觉效果。
- 用好模型参数与功能：善用模型提供的分辨率调节、风格权重设置等功能，可以进一步提升图片质量和风格贴合度。

from openai import OpenAI

client = OpenAI(api_key="API_KEY", base_url="https://BASE_URL/v1")

response = client.images.generate(
    model="gpt-image-1",
    prompt="a cat",
    size="1024x1024",
    n=1
)

print(response)

编辑图片

支持参考图编辑（image2image）的模型，基本都适配了OpenAI的编辑接口。

import base64
from openai import OpenAI
client = OpenAI(api_key="API_KEY", base_url="https://BASE_URL/v1")

prompt = "prompt"

result = client.images.edit(
    model="gpt-image-1",
    image=[
        open("image_path.png", "rb"),
    ],
    prompt=prompt
)

image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)

# Save the image to a file
with open("image_path.png", "wb") as f:
    f.write(image_bytes)

注意事项

使用时需要将 OPENAI_BASE_URL 设置为 https://BASE_URL/v1
OPENAI_API_KEY 应设置为您的 API Key
大部分模型已适配OpenAI生图接口，个别模型未适配，请参考模型文档。

OpenAI 官方文档

点击查看OpenAI 官方文档

开始使用

模型与服务

使用指南

根据文本生成图片

编辑图片

注意事项

相关链接

OpenAI 官方文档

开始使用

模型与服务

使用指南

​根据文本生成图片

​编辑图片

​注意事项

​相关链接

OpenAI 官方文档

根据文本生成图片

编辑图片

注意事项

相关链接