我们引入了具有连续状态和相应更新规则的现代 Hopfield 网络。新的Hopfield网络可以以指数方式存储(与关联空间的维度)许多模式,通过一次更新检索模式,并且具有指数级的小检索错误。它具有三种类型的能量最小值(更新的固定点):(1)对所有模式进行全局定点平均,(2)对模式子集进行亚稳态平均,以及(3)存储单个模式的固定点 ...
思想链 (CoT) 在增强大型语言模型 (LLM) 的推理性能方面占有重要地位。虽然一些研究侧重于通过检索增强等方法提高 CoT 准确性,但对于 CoT 为何取得如此成功的严格解释仍不清楚。在本文中,我们通过提出以下问题来分析两种不同设置下的 CoT 方法:(1)对于零样本 CoT,为什么提示模型“让我们一步一步思考”会显着影响其输出? (2)对于few-shot CoT,为什么在质疑模型之前提供例子可以显着提高其推理能力?为了回答这些问题,我们从 Hopfieldian 角度进行了自上而下的可解释分析,并提出了一种读取和控制方法来控制 CoT 的准确性 ...
尽管机器学习 (ML) 技术在解决涉及大维数据的问题方面非常强大,但解释拟合参数的结果仍然是一项极其重要的挑战性任务,尤其是在物理应用中。这项工作展示了如何在铁磁 Ising 模型中实现这一目标,铁磁 Ising 模型是统计物理学中多项机器学习研究的主要目标。这里证明了通过主成分分析(这些研究中的常用方法)对相和序参数的成功无监督识别,检测到每次自旋的磁化强度随温度(相变的实际控制参数)具有最大的变化 ...
这项工作将深度神经网络映射到经典的伊辛自旋模型,允许使用统计热力学来描述它们。状态密度表明结构在经过训练后会在权重中出现——与训练不良的网络相比,训练有素的网络涵盖更广泛的可实现能量。这些结构在整个网络中传播,并且在各个层中观察不到 ...
早在 1867 年,即克劳修斯引入熵概念两年后,麦克斯韦就表明热力学第二定律所施加的限制取决于人们所掌握的有关物理系统状态的信息。一个“非常善于观察、手指灵巧的生物”,后来被开尔文命名为麦克斯韦妖,可以排列气体分子并在不做功的情况下引起温度或压力梯度,这显然与热力学第二定律相矛盾。一个世纪后,兰道尔声称“信息是物理的”,并表明某些涉及信息的过程,例如重写记忆,需要做功才能完成,并且不可避免地伴随着热量耗散 ...
在这项工作中,我们介绍了 Unique3D,这是一种新颖的图像到 3D 框架,用于从单视图图像高效生成高质量的 3D 网格,具有最先进的生成保真度和强大的通用性。先前基于分数蒸馏采样 (SDS) 的方法可以通过从大型 2D 扩散模型中提取 3D 知识来产生多样化的 3D 结果,但它们通常会遇到个案优化时间较长且不一致的问题。最近的工作通过微调多视图扩散模型或训练快速前馈模型来解决该问题并生成更好的 3D 结果 ...
在AI生成文本和2D图像不断扩张版图的同时,3D生成也逐渐成为不可忽视的趋势。自 2023 年以来,3D 生成领域涌现了大量研究论文。这种增长不仅包括 3D 对象的创建,还包括 3D 角色和动作生成的快速发展 ...
我们引入了一种新颖的混合方法,该方法通过大型语言模型 (LLM) 生成的行为增强基于代理的模型 (ABM),以模拟人类交易交互。我们将我们的模型称为 TraderTalk。利用受过大量人工撰写文本训练的 LLM ,我们捕获了金融交易中双边对话的详细而细致的表征 ...
最近的 LLM(大型语言模型)进步使教育和金融等许多领域受益,但人力资源部门有数百个重复流程,例如访问请求、医疗索赔申请和休假提交,这些流程尚未得到解决。我们将这些任务与 LLM 代理联系起来,该代理负责解决写作协助和客户支持等任务。我们推出 HR-Agent,这是一种高效、保密且针对 HR 的基于 LLM 的任务导向型对话系统,专为自动化重复性 HR 流程(例如医疗索赔和访问请求)而量身定制 ...
交易是一项竞争激烈的任务,需要策略、知识和心理毅力的结合。随着大型语言模型 (LLM) 最近的成功,在这个竞争激烈的舞台上应用 LLM 代理的新兴智能并了解他们是否能够超越专业交易者是很有吸引力的。在本次调查中,我们对当前使用 LLM 作为金融交易代理人的研究进行了全面回顾 ...