DALL·E 3 推理能力炸裂提升,OpenAI 抢跑「ChatGPT 原生」
2025-08-30 12:44:57 - 话集
时隔一年半,OpenAI 直接玩了个大的理能力炸裂提,把文生图和 ChatGPT 做了结合,原生带着最新版本 DALL·E 3 来了。理能力炸裂提
DALL·E 3 的原生美容院后台录音曝光巨大飞跃主要体现在两大方面。
第一,理能力炸裂提只需要提示词,原生ChatGPT 可自动对词语进行拓展,理能力炸裂提极大地弱化了提示工程的原生约束,生成图画细节更多、理能力炸裂提描述更精准。原生
第二,理能力炸裂提Chat GPT 原生,原生模型在理解客户指令及将文本转化为图片的理能力炸裂提能力增加了。OpenAI 表示,DALL·E 3 比以往系统更能理解细微差别和细节,让客户更加轻松地将自己的想法转化为非常准确的图像。
可以看到,DALL·E 3 不仅在推理能力上更强大了,日本异国恋人视频同时用起来也更加简单,给了大家无限的创作可能性。
DALL·E 3 的巨大飞跃
DALL·E 3 最大的突破,无疑是将文生图模型与 ChatGPT 的结合,极大地降低了提示词的门槛。
客户只需要输入简单的词语,ChatGPT 可自动对提示词进行扩展、生成定制的详细提示,从简单的句子到详细的段落,勾画出一副细节感满满的画面。
来看几张由 DALL·E 3 生成的图片:
满月映照下的繁华都市街道,熙熙攘攘的行人正享受着夜生活。
在街角的摊位上,一位满头红发、身着天鹅绒斗篷的年轻女子正在与脾气暴躁的老摊主讨价还价。
这位脾气暴躁的小贩身材高大、为人老练,他穿着笔挺的西装、留着引人注目的小胡子,正兴致勃勃地用他的蒸汽朋克电话在交谈。
拟人化的秋叶组成了一支民间乐队,在乡村的森林中,它们演奏着传统的蓝草音乐,点缀着满月撒下的柔和月光。
荔枝纹风格的球形椅子,具有凹凸不平的白色外观和豪华的内部,衬托着热带壁纸。
精彩的细节刻画,加上精致的图像画面,可以看到,DALL·E 3 在弱化了提示词约束的同时,还具备了 ChatGPT 原生的优势,用语言指导大型神经网络执行各种文本生成任务。
目前来看,DALL·E 3 在理解客户命令和文生图方面都展现了更为出色的能力,这也是此前 AIGC 领域存在的短板之一。一位 OpenAI 研究员也表示,语言的进步使 DALL·E 3 能够更好地解析复杂指令,避免混淆详细请求中的元素。
而如果出现图像与文本描述不相符的情况时,客户可在 ChatGPT 中随时进行调整。
关于 DALL·E 3 更多细节,Sam Altman 还分享了一个可爱的宣传影片。
影片中,家长通过向 ChatGPT 提问“5 岁小朋友口中的‘超级向日葵刺猬’的样子是什么样?”,获得了四段不同风格的提示词,并由 DALL·E 3 生成对应图像。
由客户选定了图像风格、并为小刺猬起名 Larry 后,ChatGPT 又为故事添加了更多丰富的元素,包括森林的背景、小房子、以及带有 Larry 名字的小信箱等等,ChatGPT 综合了前面的信息后,还可以生成一个完整的故事情节。
可以说,从童话故事到插图,ChatGPT 和 DALL·E 3 全包了!有网友评价称,Sam Altman 放出的小刺猬 demo 影片,是《30 分钟做一本儿童绘本》的实例。
而与此前 DALL·E 系列模型相比,根据同一句提示词“一名篮球运动员扣篮、被描绘成一个星云爆炸的油画”,使用 DALL·E2 和 DALL·E3 分别进行图片生成。可以看到,两代模型在生成图片的效果存在明显的差异。
和左侧相比,DALL·E 3 图片中的细节描绘、场景明亮度等效果都更好。
在 DALL·E 2 发布的一年多时间,期间 Stable Diffusion 掀起了一阵扩散模型热潮,后者一时风光两无。如今,OpenAI 带着最新版的 DALL·E 3 汹汹来袭,似乎将要改变这一局面。
新一轮文生图战局打响了
早些时候,约 400 人左右参与测试了 OpenAI Discord 支持器上的 DALL·E 3 Alpha 版本,网友评价:生成图片的准确度碾压 Stable Diffusion 、MidJourney。MidJourney 的语文水平一直被客户吐槽,这一点在 DALL·E 3 上大有改观。DALL·E 3 可以通过 Prompt 提示,在图片中生成连续准确的单词拼写,像下图中的“HELLO”,在以往的文生图模型中还没有模型可实现这一点。
这张“DALL·E CAN SPELL”的图片放大后,也可以看到在图片深处的“DALL·E ”有拼写成“DALE”的情况,但是整体看,在遵循提示和生成连贯细节方面 DALL·E 3 已经有了极大的突破。
除了文字的细节,在对 Prompt 理解方面,DALL·E 3 与早一期的版本也有极大的进步。提示词是“雾蒙蒙的森林里,地面非常泥泞,一场自行车比赛正在进行,一个粉红色的小丑骑着用奶酪做成的自行车,和跟熊猫击掌,熊猫很生气。”在 5 月 DALL·E 版本中可以看到,熊猫和小丑的手掌是扭曲的,自行车用奶酪制成这一细节不太明显,熊猫表情面露微笑,这一点显然和提示词的内容不符合。
到了 DALL·E 3 的版本中可以看到,小丑和熊猫击掌,小丑明显的五根手指,自行车车轮完全是奶酪元素,包括车轮激起的泥点细节等, DALL·E 3 在理解提示词语义和呈现画面方面有了非常明显的进步。
当在 Stable Diffusion 、MidJourney 中输入相同提示词时,呈现的画面与提示词的关系,不能说一点不同,也差不多是毫不相关。看到 DALL·E 3 的表现,很多网友表示 Stable Diffusion 、MidJourney 无法在这个级别上与其竞争。
就在上周,有消息爆出谷歌正在小范围内测 Gemini,传言称,Gemini 将比 ChatGPT 强大 20 倍,这也给 OpenAI 带来了一定程度上的舆论压力。
随后,OpenAI “悄悄”更新了 GPT-3.5-Turbo-Instruct,此前有消息传出,OpenAI 正紧锣密鼓地将 GPT-4 与类似于 Gemini 提供的多模态功能结合起来,不少业内人士猜测,OpenAI 或在即将召开的首届开发者大会上发布多模态大模型,比如 GPT-4-Vision。
大模型局势扑朔迷离,作为大模型的引领者,谷歌和 OpenAI 在互相试探,二者真实实力几何,还有多少颠覆我们认知的能力,尚且未知。
目前, DALL·E 3 背后的工艺细节并未公布。但在保障和版权保护方面,OpenAI 已对 DALL·E 3 投入了大量的工作,包括采取缓解措施拒绝提供公众人物姓名、与外部的“红队”成员(对模型进行压力测试的团队)合作、在内部开发来源分类器等。
此外,DALL·E 3 拒绝提供在世艺术家风格图像,艺术创作者也可选择将其个人作品从 DALL·E 3 未来图像生成模型的训练中剔除。据悉,DALL·E 3 将于 10 月初面向 ChatGPT Plus 和 Enterprise 客户上线,客户使用 DALL·E 3 创建的图像无需 OpenAI 授权即可转载或者出售。
(雷峰网雷峰网(公众号:雷峰网))
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
- END -
多地官宣:音乐节可在现场领结婚证

每经编辑|何小桃音乐节可以在现场领证。据新疆广播电视台报道,7月12日至7月13日,2025新疆超级草莓音乐节将在乌鲁木齐市水磨沟区天山明月城火热开唱。此次音乐节不仅有超燃的音乐盛宴,更有一系列“花式
微笑一号店黄黑围裙联考开启全员内卷!职业残酷法则初现!

来源标题:微笑一号店黄黑围裙联考开启全员内卷!职业残酷法则初现!爱奇艺经营纪实互动真人秀《微笑一号店》本周高能继续!35名微笑学员迎来首次黄黑围裙联考,学员需两两组队才能完成考核。考核未启,硝烟却已弥
国航系五大航司带你抖音云游重庆,享暑期机票福利

来源标题:国航系五大航司带你抖音云游重庆,享暑期机票福利暑期旅游旺季将至,文旅市场持续升温。6月12日上午9时,中国国际航空携手深圳航空、山东航空、澳门航空、昆明航空共5家国航系航司,联合重庆市文化和
摇滚编年史超级演唱会圆满收官 目睹中国摇滚新历史的诞生

来源标题:摇滚编年史超级演唱会圆满收官 目睹中国摇滚新历史的诞生 6月1日晚,在“送别”的歌声中,为期2天的“健力宝·摇滚编年史超级演唱会&rdquo
神舟十九号航天员乘组太空归来后首次公开亮相

2025年7月9日下午,中国航天员科研训练中心在北京航天城举行神舟十九号乘组与记者见面会。这是航天员蔡旭哲、宋令东、王浩泽返回60余天后,首次面向媒体与公众正式公开亮相,并分享了183天太空驻留的经历
管乐姐姐变身青牛精来萌探“乘风破浪”!《萌探奇遇记》第五期全程高能

来源标题:管乐姐姐变身青牛精来萌探“乘风破浪”!《萌探奇遇记》第五期全程高能大家有看上周更新的《萌探奇遇记》吗!这档国漫爆笑自然探索类综艺终于又更新了,除了李川、阎鹤祥、张亮和张颜齐四位常驻嘉宾外,这
电影《风云山林》:从江湖险路到革命征途

来源标题:电影《风云山林》:从江湖险路到革命征途秋风猎猎,马蹄声由远及近,金黄的陇东大塬在晨光中浮现出一抹肃穆与苍茫——电影《风云山林》便如此拉开了序幕。这部近日在电影频道首播
第五届“金豪笔编剧之夜”入围名单揭晓 183位优秀编剧携74部作品入围

来源标题:第五届“金豪笔编剧之夜”入围名单揭晓 183位优秀编剧携74部作品入围6月9日,第五届“金豪笔编剧之夜”入围名单及终评评委名单揭晓,共有183位优秀编剧携74部作品入
别再声讨零一万物了

最近两天,由原阿里技术副总裁、深度学习框架 Caffe 发明者贾扬清一则朋友圈引发的关于“国内某大厂新模型套壳 LLaMA 架构”的问题在中国人工智能圈与科技媒体中产生了热烈讨论。由于贾扬清在国内 A
掌阅科技出品短剧《遮天》定档6月20日!AI技术与实拍画面深度结合

来源标题:掌阅科技出品短剧《遮天》定档6月20日!AI技术与实拍画面深度结合近日,由掌阅科技、陕西文投影业、西安志和影视、成都星阅辰石、河北广电广告出品,海南有鹿影视文化、陕西大迈长宏影视等承制,辰东
直播电商激活非遗经济:“00后”“90后”撑起消费半壁江山

来源标题:直播电商激活非遗经济:“00后”“90后”撑起消费半壁江山6月13日,抖音电商发布《2025抖音电商非遗发展数据报告》下称“报告”),展现了过去一年非遗在电商领域热销
从首发抢购到创意改造,布鲁可与小黄人粉丝共赴欢乐之旅

来源标题:从首发抢购到创意改造,布鲁可与小黄人粉丝共赴欢乐之旅 6月1日,在2025小黄人香蕉节的上海旗舰站,布鲁可联合上海静安大悦城 KKV 全球首发布鲁可积木人小黄人萌酷版第一弹《萌变庆典》,并同