长形的问题回答(LFQA)旨在为复杂问题提供详尽而深入的答案,从而增强理解。但是,这种详细的回应容易出现幻觉和事实矛盾,从而挑战了他们忠实的评估。这项工作介绍了Haluquestqa,这是第一个具有局部错误注释的幻觉数据集,该数据集可用于人体编写和模型生成的LFQA答案 ...
我们介绍了\ texttt {cass},这是第一个用于跨架构GPU代码转移的大型数据集和模型套件,针对源级别(CUDA〜 $ \ leftrightArrow $ 〜HIP)和汇编级别和汇编级别(NVIDIA SASS〜 $ \ leftrightrightarrow $ 〜Amdna3)。该数据集包括跨主机和设备的70K验证的代码对,解决了低级GPU代码可移植性中的关键差距。利用此资源,我们训 ...
尽管已经提出了许多基于深度学习(DL)的漏洞检测方法,并且确实取得了显着的性能,但它们在概括和实际用法中仍然存在局限性。更确切地说,现有的基于DL的方法(1)对词汇相似但具有相反语义的功能之间的预测任务进行负面影响; (2)没有为检测结果提供直观的开发者解释。在本文中,我们提出了一种名为Svuld的新方法,该方法是一种功能级的微妙的语义嵌入,以漏洞检测以及直观的解释,以减轻上述局限性 ...
人类可以通过以高度动态的方式穿越障碍来进行跑酷,需要精确的眼部肌肉协调和运动。让机器人执行相同的任务需要克服类似的挑战。从经典上讲,这是通过独立工程的感知,驱动和控制系统来完成的 ...
柱状存储是现代数据分析系统的核心组成部分。尽管许多数据库管理系统(DBMS)具有专有的存储格式,但大多数数据库管理系统为开源存储格式(例如Parquet和Orc)提供了广泛的支持,以促进跨平台数据共享。但是这些格式是十年前的2010年代初期为Hadoop生态系统开发的 ...
意图检测是以任务为导向对话(TOD)系统中的关键组成部分,在适应具有复杂相互关系的可集成工具的快速涌入时面临重大挑战。现有的方法,例如零拍摄的重新纠正和基于LLM的动态识别,在遇到看不见的意图时会与性能退化斗争,从而导致错误的任务路由。为了增强模型在看不见的任务上的概括性能,我们采用了强化学习(RL),并在小组相对策略优化(GRPO)培训期间结合了基于奖励的课程抽样(RC) ...
意图分类和槽填充是自然语言理解的两个关键任务。传统上,这两项任务被认为是独立进行的。然而,最近,意图分类和槽填充的联合模型已经实现了最先进的性能,并证明这两个任务之间存在很强的关系... ...
在这项工作中,我们使用LLM驱动的方法为无声电影剪辑实施音乐制作。鉴于电影音乐制作的专业要求很强,我们提出了电影节目,模拟了专业音乐家的实际工作流程。 FilmComposer是第一个将大型生成模型与多代理方法相结合的人,利用了波形音乐和象征性音乐发电的优势 ...