援助游戏是从人类反馈(RLHF)进行培训AI助手的强化学习的一种有希望的替代方法。帮助游戏可以通过将助手与用户之间的互动建模为两人游戏,从而解决RLHF的关键缺点,例如欺骗行为的激励措施,助手无法观察他们的共同目标。尽管它们具有潜力,但仅在简单的设置中才探索了援助游戏 ...
大型语言模型的最新进展表明,在自动化的知识图中,非结构化文本的自动构造具有巨大的潜力。本文建立在我们以前的工作[16]的基础上,该工作使用精度,召回,F1分数,三重匹配和图形匹配评估了各种模型,并介绍了一种精致的方法来解决幻觉和遗漏的关键问题。我们提出了一个增强的评估框架,其中包含用于图形相似性的Bertscore,为图形匹配设置了95%的实际阈值 ...
声源定位(SSL)使用多通道音频数据确定声源的位置。它通常用于改善语音增强和分离。提取空间特征对于SSL至关重要,尤其是在具有挑战性的声学环境中 ...
事件参数提取(EAE)是从非结构化文本中提取结构化信息的关键,但是由于现实世界中的文档级别的EAE的复杂性,它仍然具有挑战性。我们提出了一种新颖的定义启发式驱动提示(DHP)方法,以增强文档级EAE中大语言模型(LLM)的性能。我们的方法集成了参数提取相关的定义和启发式规则,以指导提取过程,降低错误传播并提高任务准确性 ...
大型语言模型(LLM)正在发展为自主决策者,引起了人们对高风险风险的担忧,特别是在化学,生物学,放射学和核(CBRN)领域中。基于这样的见解,即这种风险可以源于代理商的有益,无害和诚实(HHH)目标之间的权衡,我们建立了一个新颖的三阶段评估框架,该框架经过精心构建,以有效地自然地暴露了这种风险。我们对12个高级LLM进行了14,400次代理模拟,并进行了广泛的实验和分析 ...
扩散模型的最新进展具有显着高级的文本到图像的生成,但是仅凭全球文本提示仍然不足以实现对图像中各个实体的细粒度控制。为了解决这一限制,我们提出了Eligen,这是实体级别受控图像生成的新型框架。首先,我们提出了区域关注,这是扩散 Transformer 的机制,不需要其他参数,无缝整合实体提示和任意形状的空间掩码 ...
我们将因果扩散作为扩散模型的自回旋(AR)对应物。这是一个下一步的预测框架,对离散和连续模式都很友好,并且与现有的下一步预测模型(如Llama和GPT)兼容。尽管最近的工作试图将扩散与AR模型相结合,但我们表明,将顺序分解引入扩散模型可以大大提高其性能,并在AR和扩散生成模式之间实现平稳的过渡 ...
多代理路径查找(MAPF)是物流和仓库管理的关键组成部分,它重点是在已知环境中为机器人团队计划无碰撞路径。最近的工作引入了一种新型的MAPF方法LNS2,该方法通过依靠快速但质量较低的优先规划(PP)算法来修复一组不可行的途径。同时,最近有一个基于多代理增强学习(MARL)的MAPF算法的推动,这些算法在此类PP算法上表现出改善的合作,尽管不可避免地保持较慢 ...