0发布
最近被一张Claude中国用户开放使用的官方图迷惑了,就是以下这一张:

首先说明一下,这是一张AI生成的假图片。乍一看这图片做的是挺逼真的,但是图片生成不是很多大模型都支持了吗?直到评论说:

深究发现这原来是最新的模型 ChatGpt Imge2.0 生成的。
# ChatGpt Imge2.0 是什么?
北京时间 2026/4/22 凌晨 3 点,OpenAI 发布会正式宣布,GPT-image-2 可以公开使用了。

全面升级影像生成能力,从单纯生图工具进化为具备推理能力的设计助手。这款新一代AI模型不仅提升创作精准度与细节表现,也让使用者能更直觉地下指令、完成高质感图像。
最大亮点在于大幅提升影像生成的精准度、文字渲染能力与整体真实感。也就是说,在接收指令后,GPT-Image-2能进行推理与逻辑判断,并可针对生成图片的细节即时调整与优化。相较前一代,无论在操作弹性或实用性上都有明显升级。
# 特点
# 1、极强的排版与多文字处理能力
这是 2.0 的核心卖点。官方展示了多张海报、杂志页面和资讯图表(Infographics),它能精准地在图中嵌入大量且复杂的文本,甚至是整页的手写笔记,解决了以往 AI 绘图“文字乱码”的致命伤。
它不再是简单的“描述词-图片”映射,而是在生成前会进行推理和规划。它会拆解复杂的指令,考虑构图逻辑,甚至通过联网搜索最新事实或分析你上传的参考图,再产出图像。
官方的图片表示,在在多语言理解上显著增强,尤其是在日语、韩语、中文、印地语与孟加拉语的文本渲染方面有明显提升。它不仅能正确生成非英语文本,还能保证语言表达自然流畅。
# 2、极宽的画幅比例
支持从 3:1(超宽横屏)到 1:3(超长竖屏)的自由比例,不再局限于传统的方图或简单的 16:9。
轻轻松松生成大尺寸图片。
# 3、极高的视觉保真度与细节
无论是“夜晚抓拍的闪光照片”还是“电影感的人像”,其质感已经达到了照片级。它对光影、纹理(如未煮熟的面食、精美的咖啡馆装饰)的刻画比前代更自然。
# 4、设计领域的生产力工具:
它能生成极简风格海报、包豪斯艺术风、漫画设定表、甚至是品牌书(Brand Books)。这意味着它正从“艺术创作”转向更务实的“商业设计”辅助工具。
我甚至看到已经有人用来生成游戏素材了。

# ⚠️ 潜在的缺点与限制
推理时间成本:
- 虽然官网上主要展示成果,但这种基于“推理模式(Image Reasoner)”的生成方式通常伴随着更高的计算开销。这意味着用户可能需要等待更长的生成时间,无法像以往那样“即出即看”。
订阅层级限制:
- 官网提到这属于最新的研究成果,通常会优先开放给 ChatGPT Plus、Team 或 Enterprise 用户。对于普通免费用户来说,可能存在严格的使用配额或无法体验最高级的“推理模式”。
限制:
- Plus 用户: 通常每 3 小时可生成约 50 张图片。根据需求和系统负载,这个数字可能会有波动,但比免费版高出很多。
- 免费用户: 限制较严,通常每天约 3 张图片。
- 企业/团队用户: 图像生成额度限制非常高,在很多情况下几乎不受
# 如何使用
直接登入 https://chatgpt.com/zh-Hans-CN/images/

图像生成和图像上传功能存在特定的额度限制,我自己尝试就是一天大概只能生成5~8张左右,采用 24 小时重置。
以下是我的一些使用案例:
马老师闪电五连鞭招式图解,招式的特点分解图,攻击目标图解、使用要点,马老师的经典名言
特朗普和哈梅内伊对线, 特朗普对哈梅内伊发动攻击 ,含状态栏、人物,LOL风格

下雪的北京故宫,穿马面裙的女子撑着伞站在故宫红墙前,侧脸 面对相机,空中飘着小雪,地面都是雪,梅花在开,胶片颗粒感,柯达相机质感
