-
色尼 姑 ChatGPT能靠吉卜力风翻盘吗?
发布日期:2025-07-06 13:21 点击次数:148色尼 姑
出品|虎嗅科技组
作家|余杨
裁剪|苗正卿
头图|视觉中国
在大模子热气腾腾的讲和之中,吉卜力拉了 OpenAI 一把。
4 月 7 日音问,OpenAI 正在测试为 GPT-4o 图像生成模子加入水印。
这是一款领先只对 ChatGPT Plus 用户绽放的 ImageGen 模子,约略生成带有笔墨的图片和传神的视觉作品。OpenAI 示意,该模子通过大批图像与文本的集中磨练,展现出惊艳的视觉施展力和细致无比的荆棘文意会才气。
一周前的愚东说念主节,OpenAI 首席实行官山姆 · 奥特曼刚刚晓示,ChatGPT 图像生获胜能将向统共免用度户推出。很快,吉卜力作风的 AI 图马上全网刷屏。
紧随自后,Midjourney 发布 AI 图片生成模子 Midjourney V7 版块并开启 alpha 测试。全新的"草图花式",复旧对话式交互界面、及时裁剪、语音识别生获胜能。手脚 OpenAI 的"同款",Midjourney 不甘寂寥,和 OpenAI 偷偷较劲。
"吉卜力"(Ghibli)是宫崎骏的动画责任室和好意思术馆的称号,其含义指的是撒哈拉沙漠上吹过的炎风。作风特色主如果水粉与水彩的勾通,动画的中枢多与天然联系,又在天然中注入了高档灰,呈现出眇小慈悲、舒坦深幽的视觉效果。
不仅如斯,这种作风擅长通过同类色的颜色滤镜传达画面热情,在同类色比重较高的画面中,又通过笔触和隐微配色互异性来波折画面档次,诳骗暖光加强浅深档次。东说念主物打算上则强调爽直与绘本作风,使用干练的简笔线条勾画形象。
OpenAI 正在为免用度户生成的图像测试水印,而 ChatGPT Plus 用户则可保存无水印图像。
今天就整个来望望 ChatGPT 的魔法,测评一下 OpenAI 的吉卜力实力。
prompt1:莫得圆柏的北京 春天 阳光明媚 周末的马路上 东说念主群穿梭 中景 吉卜力作风
prompt2:九又四分之三站台 有东说念主在吸烟 驾驭有东说念主斜睨 近景 吉卜力作风色尼 姑
prompt3:解放女神在电脑眼前办公 戴着防蓝光眼镜 脸精粹清晰牛马的麻烦 特写 吉卜力作风
参与测评的玩家则有即梦、可灵和 ChatGPT,也望望各家长处。
即梦 AI
即梦的文生图,速率很快,平均 10 秒。
不仅如斯,复旧图片比例的救助,在完成图片生成后,不错挑选图片进行裁剪,复旧高清、细节开辟、局部重绘、生成视频、扩图、甩掉笔等功能。
最终身成图如下。
可灵 AI
可灵的恭候时分略长于即梦,大要 30 秒生成达成。
不外,可灵有着较好的生态组合,prompt 输入框的右上角就有着 DeepSeek 的辅导词优化进口,图片生成完成后,又不错一键点击生成视频。也等于说,从文到图、再从图到视频,可灵给安排得清理解爽。
最终身见效果如下。
ChatGPT
凭证 OpenAI 在官网的先容,它的文生图模子 DALL · E 3 是基于 ChatGPT 原生构建的,它适用于利用 ChatGPT 作念头脑风暴创意,只需要商讨 ChatGPT 想在检朴单句子到刺眼段落的任何内容中看到什么即可。
和可灵借助 DeepSeek 同样,ChatGPT 会自动为 DALL · E 3 生成量身定制的刺眼辅导。
同期复旧对图片的微调,即如果对某张图片大致逍遥,但又有不太合适的处所,不错条款 ChatGPT 用几句话进行救助。
点开右边的更多,不错看到创建图片的选项。遴荐创建图片,输入 prompt 即可。
全体来说,操作肤浅,经过丝滑,30 秒驾驭的时候仍是产生基骨子调,但整个过程的平均恭候时长达到了 150 秒。
底下是效用。
追忆
即梦以平均 10 秒的生成速率脱颖而出,这种即时性关于需要快速迭代创意的用户来说是无边的上风。然而,速率的进步往往伴跟着细节把控的谐和。从生见效果来看,即梦的图像天然约略快速呈现吉卜力作风的基调,但在热情传达和档次波折上稍显不及。尤其是 prompt1 中"莫得圆柏的北京"这一复杂场景,即梦的生成界限未能澈底捕捉到"高档灰"与"天然氛围"的玄机均衡。
比拟之下,可灵天然生成速率稍慢(约 30 秒),但通过 DeepSeek 的辅导词优化和视频生成才气,构建了一个从文到图再到视频的完满生态。这种生态整合才气,尤其符合需要多模态输出的用户,比如动画创作家或短视频制作家。
从生成图片的质料上看,ChatGPT 对吉卜力作风有着更好的意会,色淹没热情的把控皆相瞄准确。举例,在 prompt3 "解放女神在电脑前办公"这一脑洞场景中,ChatGPT 获胜捕捉到了"防蓝光眼镜"与"牛马的麻烦"之间的玄机热情张力,同期保抓了吉卜力作风的眇小与慈悲。
这种上风源于 ChatGPT 的辅导词优化机制。它约略凭证用户输入的 prompt,自动生成更刺眼的形色,从而进步生成图像的精确度。此外,ChatGPT 复旧对图像的微调功能,允许用户通过肤浅的说话形色救助细节,这种天真性进一步增强了其在创意抒发上的竞争力。
干熟女官网的展示中,ChatGPT 所生成的图片作风并不限于吉卜力,还有如下的细节图、脑洞图和创意图。
而关于图片版权问题,大方开源,使用 DALL · E 3 创建的图像包摄用户,无需获取 OpenAI 许可即可重印、出售或销售。
不仅如斯,OpenAI 阐发正在开发 ImageGen API,昔日开发者可利用该 API 构建应用家具,拓展图像生成模子的应用场景。开发者不错利用该 API 构建我方的应用家具,比如西席用具、打算扶植平台等。这种绽放生态的构建,将股东 AI 生成图像手艺的普及与改革。
ChatGPT 此次换了个念念路。似乎自满着色尼 姑,大说话模子连城之珍还不够,集成多种生态的多元赛说念势头正值。用家具 cue 着中国的大模子:该你出牌了。