跳转到主要内容

根据文本生成图片

平台的生图模型支持两种主要用法: 一是仅通过prompt输入,由模型直接生成图像;二是以已有图片为基础,结合新的prompt,实现图像的变体创作。
  • 基于文本描述生成图片 为了提升图像生成的精度和效果,建议在输入prompt时注意以下几点:
    • 细致描述:明确且详细地描述你想要的场景。例如,想生成海滩日落画面,与其只输入“海滩日落”,不如说明“在宁静的海滩,夕阳染红天空,海浪轻拍沙滩,远处可见小船”。
    • 情绪与氛围:可以在prompt中补充如“温馨”、“神秘”或“有活力”等词,帮助模型把握你希望呈现的整体感受或风格。
    • 指明风格:如有特定的美术风格需求,可直接说明,例如“印象派”或“超现实主义”,提高与预期的一致性。
    • 避免含糊表达:尽量不用“美丽”、“好看”等主观或模糊词汇,这类描述难以转换为具体画面。
    • 使用排除语句:如不想出现某些元素,可在prompt中明确指出例外,如“不要有船”。
    • 分阶段描写:对于复杂内容,建议先生成基础画面,再逐步通过细节调整完善最终图像。
    • 多样化描述:尝试不同措辞或表达角度,有时对同一场景的不同描述会产生风格各异的视觉效果。
    • 用好模型参数与功能:善用模型提供的分辨率调节、风格权重设置等功能,可以进一步提升图片质量和风格贴合度。
from openai import OpenAI

client = OpenAI(api_key="API_KEY", base_url="https://BASE_URL/v1")

response = client.images.generate(
    model="gpt-image-1",
    prompt="a cat",
    size="1024x1024",
    n=1
)

print(response)

编辑图片

支持参考图编辑(image2image)的模型,基本都适配了OpenAI的编辑接口。
import base64
from openai import OpenAI
client = OpenAI(api_key="API_KEY", base_url="https://BASE_URL/v1")

prompt = "prompt"

result = client.images.edit(
    model="gpt-image-1",
    image=[
        open("image_path.png", "rb"),
    ],
    prompt=prompt
)

image_base64 = result.data[0].b64_json
image_bytes = base64.b64decode(image_base64)

# Save the image to a file
with open("image_path.png", "wb") as f:
    f.write(image_bytes)

注意事项

  1. 使用时需要将 OPENAI_BASE_URL 设置为 https://BASE_URL/v1
  2. OPENAI_API_KEY 应设置为您的 API Key
  3. 大部分模型已适配OpenAI生图接口,个别模型未适配,请参考模型文档。

相关链接