现在可在某软件中生成音轨和语音

2025-10-28

新闻要点

Adobe在洛杉矶年度MAX会议上，宣布为创意应用带来众多新特性，大多涉及AI能力。重点围绕Firefly ，如开放自定义模型等。还为其增添生成音轨和语音等功能，并在PS等应用中引入AI助理。这些创新将提升创作效率与体验。

- Firefly将开放自定义模型年底推出

- Firefly Image Model 5发布支持分层编辑

- Firefly新增生成音轨和语音功能

- PS和Express将引入AI助理平衡操作体验

主要内容

Adobe 正大力投入人工智能领域。在该公司于洛杉矶举行的年度 MAX 大会上，宣布其创意应用程序的一系列新功能，几乎所有这些功能都包含某种新的人工智能能力。甚至还预告了与 OpenAI 的 ChatGPT 集成。以下是你需要了解的所有内容。

Adobe 的新宠应用是 2023 年推出的 Firefly，它具备通过生成式人工智能创建图像和视频的能力。因此，大部分公告围绕它展开是有道理的。首先，公司表示将开放对自定义模型的支持，允许创意人员训练自己的人工智能模型来创建特定的角色和色调。一段时间以来，企业已能在 Firefly 中利用自定义模型，但 Adobe 正在将该功能推向个人客户。Adobe 称，训练一个角色的模型只需 6 到 12 张图像，训练一个色调的模型则“稍多一些”。模型的基础仍然是 Adobe 自己的 Firefly 模型，这意味着它是基于专有数据训练的，且在商业上可安全使用。自定义模型将于年底推出，11 月你可以加入等待列表以提前访问。

Adobe 的 Firefly 图像模型 5 今日推出。像图像模型 4 一样，更新后的模型具有原生 400 万像素分辨率，意味着它可以生成 2K（2560 x 1440）图像。它还支持基于提示的编辑，可生成 2MP 或全高清（1920 x 1080）的编辑内容。然而，图像模型 5 的重大改进是分层图像编辑。在演示中，Adobe 向我展示了新 Firefly 模型的工作原理。你可以上传一张图像，Firefly 图像模型 5 将识别不同元素，允许你移动、调整大小并使用生成功能替换这些元素。在我的演示中，Adobe 使用了一碗拉面，展示了图像模型 5 如何裁剪并将筷子移动到场景的不同区域，以及添加由人工智能生成的一碗辣椒片。而且所有这些都没有任何视觉伪影。

Firefly 还将获得两个新的生成式人工智能功能：生成配乐和生成语音。两者如其名称所示，都有一些特定的限制。生成配乐将扫描上传的视频并为配乐提供提示。Adobe 允许你选择氛围、风格和目的，而不是删除提示并从头开始，以找到合适的内容。例如，你可以说你想要一个紧张的管弦乐配乐来覆盖追逐场景。生成语音是 Adobe 首次将文本到语音功能添加到 Firefly 中，利用其自己的 Firefly 模型以及 ElevenLabs 的模型。推出时，Adobe 称将支持 15 种语言的生成语音，并且你可以添加情感标签。这些标签不是通用的，因此你可以在一行的不同部分添加不同的标签以改变语调。生成配乐和生成语音将很快向 Firefly 推出。

还有一个新的 Firefly 视频编辑器。首次，你可以在浏览器中访问带有内置 Firefly 的完整多轨视频编辑器。Adobe 称它是为组合多个来源而构建的，将生成内容和捕获内容整合到视频、音频和图像中。Firefly 视频编辑器将有一个等待列表，但 Adobe 尚未宣布何时广泛发布。

最近人工智能领域的流行词是代理式人工智能——一种为你完成特定任务的人工智能助手。Adobe 在 Acrobat 中已经有这样的助手，但正在将相同的功能引入 Photoshop 和 Express。Adobe 称该助手将在“触觉和代理”之间取得平衡，作为导航 Adobe 应用程序的一种教育工具。在 Photoshop 或 Express 中，你可以调出助手来完成不同的任务。它可以根据你正在做的事情为你指向正确的工具，同时仍让你控制最终输出。Express 中的人工智能助手现已可用。

现在可在某软件中生成音轨和语音

新闻要点

主要内容

关于我们