主要内容
一家名为 Extropic 的初创公司开发出一种奇特的新型计算机芯片,可处理概率位。该公司已生产出首个可运行的硬件,并证明更先进的系统能在人工智能和科学研究中处理有用任务。
其芯片的工作方式与英伟达、AMD 等公司的芯片截然不同,且在规模化时有望节能数千倍。随着人工智能公司投入数十亿美元建设数据中心,这种全新方法可为大量传统芯片提供成本低得多的替代方案。
Extropic 将其处理器称为热力学采样单元(TSU),而非中央处理器(CPU)或图形处理器(GPU)。TSU 利用硅组件利用热力学电子波动,塑造它们以模拟各种复杂系统的概率,如天气或能够生成图像、文本或视频的人工智能模型。
首个可运行的 Extropic 芯片已与少数合作伙伴分享,包括前沿人工智能实验室、从事天气建模的初创公司以及几个政府的代表。(Extropic 拒绝提供姓名。)
Extropic 首席执行官 Guillaume Verdon 表示:“这让各种开发者都能进行测试。”他在科技界因作为一个色彩斑斓、有时有争议的在线人物“Based Beff Jezos”以及一种名为有效加速主义(e/acc)的新技术哲学而闻名,之后创立了该公司。
Verdon 及其联合创始人、首席技术官 Trevor McCourt 此前在谷歌从事量子计算工作,之后开始追求他们的新型计算方法。
Atmo 首席执行官 Johan Mathe 是正在测试新硬件的人之一,该公司是一家使用人工智能模型的初创公司,能够以比其他方式更高的分辨率进行预测,其客户包括国防部。Mathe 表示,Extropic 的芯片应能更高效地计算不同天气条件的概率。
Extropic 还发布了名为 TRHML 的软件,可在 GPU 上模拟 Extropic 芯片的行为。Mathe 也使用了该软件和实际芯片。
该公司的硬件 XTR-0 由现场可编程门阵列(FPGA)芯片和两个首批概率芯片 X-0 组成,每个 X-0 包含少量概率位。
新芯片具有概率位(p 位),可模拟不确定性,尽管规模有限,但展示了公司新方法的潜力。McCourt 表示:“我们有一个比矩阵乘法更高效的机器学习原语。问题是,如何在 ChatGPT 或 Midjourney 的规模上构建东西。”
该公司在 arXiv 上发布的一篇论文中阐述了明年可交付的包含数千个 p 位的更大芯片如何用于创建一种新型扩散模型,这是一种用于生成图像和视频以及引导机器人动作的重要模型。
Mathe 谈到即将推出的名为 Z-1 的芯片时表示:“这可能是一个巨大的胜利。他们处理信息处理物理的方法在未来十年可能具有变革性,特别是当传统晶体管缩放达到基本极限时。如果实际规模化,它可以在能效和密度方面带来数量级的改进,这对于每次操作的能量是瓶颈的工作负载至关重要。”
Verdon 和 McCourt 认为,投入到构建人工智能的巨额资金可能会被这种新方法改变。
 
    