称其新图像人工智能真的会拼写 - AI News
称其新图像人工智能真的会拼写

称其新图像人工智能真的会拼写

2025-05-20

新闻要点

Google于5月20日将在多平台推出Imagen 4图像生成模型,称其有“惊人质量”“出色排版” ,文本渲染能力提升,还将推更快变体。

- Google 5月20日推出Imagen 4图像生成模型

- Imagen 4细节清晰,文本渲染能力有提升

- 计划推出比Imagen 3快10倍的快速变体

主要内容

谷歌推出其图像生成模型的新版本,名为 Imagen 4。公司称其提供“惊人的质量”和“卓越的排版”。谷歌 Deepmind 产品副总裁 Eli Collins 在一篇博客文章中表示:“我们最新的 Imagen 模型将速度与精度相结合,能创建出令人惊叹的图像。”Imagen 4 在精细细节如复杂织物、水滴和动物皮毛等方面具有卓越的清晰度,在写实和抽象风格方面都表现出色。谷歌的样本图像确实展示了一些令人印象深刻的真实细节,如一只鲸鱼跃出水面和一只变色龙的图像。该 AI 模型在拼写和排版方面也“明显更好”,Collins 称这使其更易于创建贺卡、海报和漫画。(当 OpenAI 最近在 ChatGPT 中添加图像生成功能时,也吹嘘其文本渲染的改进,但仍容易出现拼写错误。)在谷歌提供的一些图像中,文本看起来确实不错——例如在一个简短的漫画中完全可读,甚至在一个模拟邮票中的小字体也可读。但我们需要看看该模型的文本渲染能力在普通用户手中的表现如何。Collins 表示,Imagen 4 将在 5 月 20 日在 Gemini 应用、Whisk 和 Vertex AI 以及 Slides、Vids、Docs 等“Workspace 中的更多应用”中可用。此外,谷歌计划在“不久后”推出 Imagen 4 的“快速变体”,称其“比 Imagen 3 快多达 10 倍”。