卷积神经网络(CNN)最近在基于会话的下一个项目建议的领域中引入。用户在会话(或序列)中与过去相互作用的过去项目的有序集合嵌入到二维潜在矩阵中,并将其视为图像。然后将卷积和集合操作应用于映射的项目嵌入 ...
0 0 0 2025/06/25 arXiv:1808.05163v4 linjianghong
大型语言模型(LLM)集成到信息检索系统中会引入新的攻击表面,尤其是对于对抗性排名的操作。我们提出$ \ textbf {StealthRank} $,这是一种新颖的对抗攻击方法,可以操纵LLM驱动的排名系统,同时保持文本流利度和隐身。与经常引入可检测异常的现有方法不同,StealthRank采用了基于能量的优化框架与Langevin Dynamics结合使用,以生成嵌入在项目中或文档描述中的文档 ...
0 0 0 2025/06/25 arXiv:2504.05804v2 hhhhh
随着神经音频编解码器的快速发展,基于编解码的语音生成(COSG)系统已经变得非常强大。不幸的是,COSG还可以创建高度逼真的深层演讲,从而更容易模仿个人的声音并传播错误的信息。我们将COSG Systems生成的新兴的深层演讲称为CodeCfake ...
0 0 0 2025/06/25 arXiv:2501.08238v2 rosyclouds
函数呼叫使大型语言模型(LLMS)能够充当使用工具的代理,但是将数千个工具模式注入提示是昂贵且容易出错的。我们介绍了MCP-Zero,这是一种主动的代理框架,使LLM本身可以决定何时以及要检索哪些外部工具,从而从头开始组装特定于任务的工具链。该框架建立在三个组件上:(1)主动工具请求,该模型在其中排放了结构化的$ \ left <\ operatatorName {tool \ _ assista ...
0 0 0 2025/06/25 arXiv:2506.01056v4 JayLiu
在本文中,我们提供了我们的里程碑合奏排序作品和第一手实践经验,Pantheon,它将合奏从“人类策划的艺术”转变为“机器优化的科学”。与基于配方的合奏排序相比,我们的万神殿具有以下优点:(1)个性化的联合培训:我们的万神殿是通过实时排名模型共同培训的,该模型可以准确地捕获不断变化的用户个性化兴趣。 (2)表示继承:我们的万神殿不是高度压缩的PXTR,而是利用细颗粒的隐藏状态作为模型输入,这可以从排 ...
0 0 0 2025/06/25 arXiv:2505.13894v1 buzz
我们介绍了Worldsense,这是第一个评估多模式视频理解的基准,该基准同时涵盖了视觉,音频和文本输入。与现有基准相反,我们的WorldSense具有多个功能:(i)Omni-Modosity的协作,我们设计了评估任务以具有强烈的音频和视频耦合,要求模型有效地利用Omni-Mododation的协同感知; (ii)视频和任务的多样性,WorldSense涵盖了1,662个音频视频的多样化集合,系 ...
0 0 0 2025/06/25 arXiv:2502.04326v2 zhangqi33
准确有效的提问系统对于在医疗领域提供高质量的患者护理至关重要。尽管大型语言模型(LLM)在各个领域取得了显着的进步,但它们在医学问题的回答中仍在面临重大挑战,尤其是在理解特定领域的术语和执行复杂的推理方面。这些限制破坏了它们在关键医疗应用中的有效性 ...
0 0 0 2025/06/25 arXiv:2501.05464v2 keve
有效的长期生成是大型语言模型的关键挑战。尽管最近稀疏的解码方法提高了效率,但它们却遭受了KV缓存未对准的损失,在这种情况下,近似错误会累积并降低产生质量。在这项工作中,我们提出了纠正的稀疏注意力(RESA),这是一种简单而有效的方法,将块状注意力与周期性密集的整流结合在一起 ...
0 0 0 2025/06/25 arXiv:2506.04108v2 Maggie

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)