称其新图像人工智能真的会拼写

2025-05-20

新闻要点

Google于5月20日将在多平台推出Imagen 4图像生成模型，称其有“惊人质量”“出色排版” ，文本渲染能力提升，还将推更快变体。

- Google 5月20日推出Imagen 4图像生成模型

- Imagen 4细节清晰，文本渲染能力有提升

- 计划推出比Imagen 3快10倍的快速变体

主要内容

谷歌推出其图像生成模型的新版本，名为 Imagen 4。公司称其提供“惊人的质量”和“卓越的排版”。谷歌 Deepmind 产品副总裁 Eli Collins 在一篇博客文章中表示：“我们最新的 Imagen 模型将速度与精度相结合，能创建出令人惊叹的图像。”Imagen 4 在精细细节如复杂织物、水滴和动物皮毛等方面具有卓越的清晰度，在写实和抽象风格方面都表现出色。谷歌的样本图像确实展示了一些令人印象深刻的真实细节，如一只鲸鱼跃出水面和一只变色龙的图像。该 AI 模型在拼写和排版方面也“明显更好”，Collins 称这使其更易于创建贺卡、海报和漫画。（当 OpenAI 最近在 ChatGPT 中添加图像生成功能时，也吹嘘其文本渲染的改进，但仍容易出现拼写错误。）在谷歌提供的一些图像中，文本看起来确实不错——例如在一个简短的漫画中完全可读，甚至在一个模拟邮票中的小字体也可读。但我们需要看看该模型的文本渲染能力在普通用户手中的表现如何。Collins 表示，Imagen 4 将在 5 月 20 日在 Gemini 应用、Whisk 和 Vertex AI 以及 Slides、Vids、Docs 等“Workspace 中的更多应用”中可用。此外，谷歌计划在“不久后”推出 Imagen 4 的“快速变体”，称其“比 Imagen 3 快多达 10 倍”。

称其新图像人工智能真的会拼写

新闻要点

主要内容

关于我们