现在可在某软件中生成音轨和语音 - AI News
现在可在某软件中生成音轨和语音

现在可在某软件中生成音轨和语音

2025-10-28

新闻要点

Adobe在洛杉矶年度MAX会议上 ,宣布为创意应用带来众多新特性 ,大多涉及AI能力。重点围绕Firefly ,如开放自定义模型等。还为其增添生成音轨和语音等功能 ,并在PS等应用中引入AI助理。这些创新将提升创作效率与体验 。

- Firefly将开放自定义模型 年底推出

- Firefly Image Model 5发布 支持分层编辑

- Firefly新增生成音轨和语音功能

- PS和Express将引入AI助理 平衡操作体验

主要内容

Adobe 正大力投入人工智能领域。在该公司于洛杉矶举行的年度 MAX 大会上,宣布其创意应用程序的一系列新功能,几乎所有这些功能都包含某种新的人工智能能力。甚至还预告了与 OpenAI 的 ChatGPT 集成。以下是你需要了解的所有内容。

Adobe 的新宠应用是 2023 年推出的 Firefly,它具备通过生成式人工智能创建图像和视频的能力。因此,大部分公告围绕它展开是有道理的。首先,公司表示将开放对自定义模型的支持,允许创意人员训练自己的人工智能模型来创建特定的角色和色调。一段时间以来,企业已能在 Firefly 中利用自定义模型,但 Adobe 正在将该功能推向个人客户。Adobe 称,训练一个角色的模型只需 6 到 12 张图像,训练一个色调的模型则“稍多一些”。模型的基础仍然是 Adobe 自己的 Firefly 模型,这意味着它是基于专有数据训练的,且在商业上可安全使用。自定义模型将于年底推出,11 月你可以加入等待列表以提前访问。

Adobe 的 Firefly 图像模型 5 今日推出。像图像模型 4 一样,更新后的模型具有原生 400 万像素分辨率,意味着它可以生成 2K(2560 x 1440)图像。它还支持基于提示的编辑,可生成 2MP 或全高清(1920 x 1080)的编辑内容。然而,图像模型 5 的重大改进是分层图像编辑。在演示中,Adobe 向我展示了新 Firefly 模型的工作原理。你可以上传一张图像,Firefly 图像模型 5 将识别不同元素,允许你移动、调整大小并使用生成功能替换这些元素。在我的演示中,Adobe 使用了一碗拉面,展示了图像模型 5 如何裁剪并将筷子移动到场景的不同区域,以及添加由人工智能生成的一碗辣椒片。而且所有这些都没有任何视觉伪影。

Firefly 还将获得两个新的生成式人工智能功能:生成配乐和生成语音。两者如其名称所示,都有一些特定的限制。生成配乐将扫描上传的视频并为配乐提供提示。Adobe 允许你选择氛围、风格和目的,而不是删除提示并从头开始,以找到合适的内容。例如,你可以说你想要一个紧张的管弦乐配乐来覆盖追逐场景。生成语音是 Adobe 首次将文本到语音功能添加到 Firefly 中,利用其自己的 Firefly 模型以及 ElevenLabs 的模型。推出时,Adobe 称将支持 15 种语言的生成语音,并且你可以添加情感标签。这些标签不是通用的,因此你可以在一行的不同部分添加不同的标签以改变语调。生成配乐和生成语音将很快向 Firefly 推出。

还有一个新的 Firefly 视频编辑器。首次,你可以在浏览器中访问带有内置 Firefly 的完整多轨视频编辑器。Adobe 称它是为组合多个来源而构建的,将生成内容和捕获内容整合到视频、音频和图像中。Firefly 视频编辑器将有一个等待列表,但 Adobe 尚未宣布何时广泛发布。

最近人工智能领域的流行词是代理式人工智能——一种为你完成特定任务的人工智能助手。Adobe 在 Acrobat 中已经有这样的助手,但正在将相同的功能引入 Photoshop 和 Express。Adobe 称该助手将在“触觉和代理”之间取得平衡,作为导航 Adobe 应用程序的一种教育工具。在 Photoshop 或 Express 中,你可以调出助手来完成不同的任务。它可以根据你正在做的事情为你指向正确的工具,同时仍让你控制最终输出。Express 中的人工智能助手现已可用。