主要内容
Mistral AI 揭开了 Magistral 的面纱,这是他们专为推理任务打造的首个模型。Magistral 有两种版本:名为 Magistral Small 的 240 亿参数开源版本,任何人都可以对其进行修改;还有功能更强大的企业版 Magistral Medium,旨在满足商业应用中对高级推理能力需求最高的场景。Mistral AI 解释道:“人类最优秀的思维并非线性的——它贯穿于逻辑、洞察力、不确定性和发现之中。”这是一个合理的观点,现有模型往往在人类实际解决问题的混乱、非线性方式上遇到困难。我已经测试了众多推理模型,它们通常存在三个关键限制:在专业领域缺乏深度,思维过程令人沮丧地不透明,以及在不同语言之间表现不一致。
对于那些对在复杂任务中信任 AI 犹豫不决的专业人士来说,Magistral 可能会改变一些想法。法律界人士、金融从业者、医疗专业人员和政府工作人员将欣赏该模型展示其工作过程的能力。所有结论都可以通过逻辑步骤追溯,这在受监管的环境中至关重要,因为“因为 AI 这么说”根本行不通。软件开发人员也没有被遗忘。Magistral 声称在有助于更好的项目规划、架构设计和数据工程的结构化思维方面表现出色。在与一些产生听起来合理但有缺陷的技术解决方案的模型作斗争之后,我渴望看到 Magistral 的推理能力在这方面是否能有所作为。
Mistral 声称他们的推理模型在创造性任务方面也很出色。该公司报告称,Magistral 是写作和讲故事的“优秀创意伙伴”,能够生成连贯的叙述,并且在需要时能够生成更具实验性的内容。这种多功能性表明,我们正在超越将创意和逻辑任务分别使用不同模型的时代。
Magistral 与其他模型的区别是什么?Magistral 与普通语言模型的区别在于透明度。它不是简单地从黑箱中吐出答案,而是以一种用户可以遵循和验证的方式揭示其思维过程。这在专业环境中非常重要。律师不仅想要合同条款建议,他们还需要理解其背后的法律推理。医生不能盲目信任诊断建议,而看不到临床逻辑。通过使推理可追溯,Magistral 可以帮助弥合在高风险领域阻碍 AI 采用的信任差距。
与非英语 AI 开发者交谈后,我听到了他们对推理能力在英语之外急剧下降的一致不满。Magistral 似乎通过强大的多语言支持直接解决了这个问题,允许专业人员使用他们喜欢的语言进行推理,而不会影响性能。这不仅关乎便利,还关乎公平和获取。随着各国越来越多地实施要求本地化解决方案的 AI 法规,在不同语言之间有效推理的工具将比以英语为中心的竞争对手具有显著优势。
对于想要进行实验的人来说,Magistral Small 现在可以通过 Hugging Face 在 Apache 2.0 许可证下使用。对更强大的 Medium 版本感兴趣的人可以通过 Mistral 的 Le Chat 界面或其 API 平台测试预览。寻求部署选项的企业用户可以在 Amazon SageMaker 上找到 Magistral Medium,IBM WatsonX、Azure 和 Google Cloud Marketplace 实现即将推出。随着对通用聊天机器人的最初兴奋开始消退,市场渴望拥有擅长特定专业任务的专用 AI 工具。通过专注于为领域专家提供透明的推理,Mistral 已经开辟了一个潜在有价值的利基市场。