大型语言模型(LLM)的最新进展增强了自然语言推理。但是,它们有限的参数记忆和对幻觉的敏感性对需要准确的,基于上下文的推论的任务持续挑战。为了克服这些局限性,越来越多的研究提出了利用外部知识来增强LLM的研究 ...
基础模型的质量在很大程度上取决于他们的培训数据。因此,已经付出了巨大的努力。然而,大多数方法都依赖于大量数据的粗粒混合物的手动调整,或者通过手工制作的启发式方法进行过滤 ...
大型语言模型(LLM)表现出了非凡的功能,但经常在需要复杂推理的任务上面临挑战。虽然经过思考链(COT)促使推理显着增强了推理,但它不加选择地为所有查询产生了冗长的推理步骤,从而导致了实质性的计算成本和效率低下,尤其是对于简单的输入而言。为了解决这个关键问题,我们引入了ADACOT(自适应链),这是一个新颖的框架,使LLMS能够自适应地决定何时调用COT ...
近年来,提示指导大语模型的输出的使用已大大增加。但是,即使是最好的专家也很难选择正确的单词来缝制所需任务的提示。为了解决这个问题,LLM驱动的提示优化是一个重要的问题 ...
用于生成AI的大型语言模型(LLM)取得了显着的进步,并发展成为各个领域和应用程序广泛采用的复杂和多功能工具。但是,由其大量参数造成的大量内存开销,再加上注意机制的高计算需求,在实现LLM推理服务的低潜伏期和高吞吐量方面构成了重大挑战。在开创性研究的推动下,最近的进步已大大加快了这一领域的进步 ...
随着业务方案的扩展,真正的推荐系统在处理多任务学习框架中不断出现的新任务方面面临着挑战。在本文中,我们试图提高处理新任务时多任务建议的概括能力。我们发现联合培训将提高新任务的性能,但在大多数多任务学习方法中始终对现有任务产生负面影响 ...
数据Shapley提供了一个原则上的框架,用于将数据贡献归因于机器学习环境。但是,现有的方法需要对不同数据子集进行重新训练模型,这在计算密集型集中取消了其对大规模模型的应用。此外,它们为通过运行学习算法产生的任何模型产生相同的归因分数,这意味着他们无法对从算法的单个运行中获得的特定模型执行有针对性的归因 ...
尽管机器学习研究的迅速增长,但相应的代码实施通常无法实现,这使研究人员重现结果并在先前的工作基础上进行劳动密集型。同时,最近的大型语言模型(LLMS)在了解科学文档并生成高质量代码方面表现出色。受此启发的启发,我们介绍了PaperCoder,这是一个多代理LLM框架,将机器学习论文转换为功能代码存储库 ...
在本文中,我们在享乐游戏(HGS)的背景下,以朋友的欣赏(FA)偏好研究了一种轻松的策略性操纵性(NOM)。在HGS中,目的是根据他们的偏好将代理人分为联盟,这完全取决于他们被分配的联盟。在FA偏好下,代理商考虑了任何其他代理人,无论是朋友还是敌人,都更喜欢与更多朋友的联盟,如果有联系,那些敌人的敌人较少 ...
多模式推理的最新进展在很大程度上忽略了音频方式。我们介绍了Audio-Reasoner,这是一种大规模的音频语言模型,用于在音频任务中进行深入推理。我们精心策划了具有简单注释的大规模和多样化的多任务音频数据集 ...