根据用户需求描述视频内容是一个长期的目标。尽管现有的视频字幕方法已经取得了重大进展,但生成的字幕可能并不集中于用户特别感兴趣的实体。要解决此问题,我们提出了一个新的视频字幕字幕,以主题为导向的视频字幕(SOVC),该任务旨在允许用户通过边界框来指定描述目标 ...

0 0 0 0 2025/06/30 arXiv:2312.13330v2 meme

我们介绍了所有(GET)Gripper的所有内容,这是一种新颖的1多道,三指设计,用于牢固抓住许多形状和尺寸的物体。该设计安装在标准的平行颚执行器上,具有三个狭窄的锥形手指,并以两种速度的配置排列,两个手指在其中汇聚成V形。与带有两个平坦的手指的传统设计相比,Get Gripper更有能力符合几何并形成安全的抓地力 ...

0 0 0 0 2025/06/30 arXiv:2505.09771v2 odenkkk

计算机断层扫描(CT)可以提供患者内部器官的3D视图,从而促进疾病的诊断,但它会给患者带来更多的辐射剂量,而CT扫描仪也比X射线机的成本更高。传统的CT重建方法需要通过完整的车身旋转扫描来进行数百个X射线投影,这无法在典型的X射线机上执行。在这项工作中,我们建议使用生成对抗网络(GAN)框架重建两个正交X射线的CT ...

0 0 0 0 2025/06/30 arXiv:1905.06902v1 CZ

参数有效的微调(PEFT)可以弥合大语言模型(LLMS)和下游任务之间的差距。但是,PEFT已被证明容易受到恶意攻击。研究表明,即使在PEFT之后,有毒的LLM也可以保留在输入样品包含预定义触发器时激活内部后门的能力 ...

0 0 1 3 2025/06/30 arXiv:2410.14425v2 wangchongyu21

由于缺乏培训数据和异质知识来源,知识接地的对话系统难以构建。由于培训数据中涵盖的有限的主题,现有系统在看不见的主题上的表现不佳。此外,异质知识来源使系统概括到其他任务中,因为不同知识表示中的知识来源需要不同的知识编码器,因此具有挑战性 ...

0 0 0 0 2025/06/30 arXiv:2112.07924v2 lpfgss

学习4D语言字段,以在动态场景中启用时间敏感的开放式语言查询对于许多现实世界应用至关重要。尽管Langsplat成功将夹子的特征扎成3D高斯表示,从而在3D静态场景中实现了精确和效率,但它缺乏将动态4D字段作为剪辑处理的能力,该剪辑是为静态图像文本任务而设计的,无法捕获视频中的时间动力学。现实世界的环境本质上是动态的,随着时间的流逝,对象语义会发展 ...

0 0 0 0 2025/06/30 arXiv:2503.10437v2 陆三七

部分微分方程(PDE)是建模物理系统的基础,但是解决它们仍然是一个复杂的挑战。传统的数值求解器依靠专家知识来实施,并且在计算上很昂贵,而基于神经网络的求解器则需要大型培训数据集,并且通常缺乏可解释性。在这项工作中,我们将PDE求解作为代码生成任务,并引入Codepde,这是使用大语言模型(LLMS)生成PDE求解器的第一个推理框架 ...

0 0 0 0 2025/06/30 arXiv:2505.08783v1 wgkooo

点击率(CTR)预测是在线广告和推荐系统中的关键任务,依靠特征交互的有效建模。显式相互作用捕获了预定义的关系,例如内部产品,但通常会遭受数据稀疏性的困扰,而隐含的交互作用在通过非线性转换学习复杂模式方面表现出色,但缺乏有效的低阶模型的感应偏见。现有的两流体系结构整合了这些范式,但面临诸如有限的信息共享,梯度失衡和难以在稀疏CTR数据中保存低阶信号之类的挑战 ...

0 0 0 0 2025/06/30 arXiv:2505.19182v1 xuwenlong

近年来,人们对联邦学习(FL)产生了兴趣。但是,客户参与顺序学习的上下文仍然不足。桥接FL和持续学习(CL)引起了一个具有挑战性的实际问题:联合持续学习(FCL) ...

0 0 0 0 2025/06/30 arXiv:2502.14205v1 QQBB

基础模型的出现已经彻底改变了各个领域,从而使计算语言学,计算机视觉和其他领域的任务准确性和灵活性实现了。注意机制已成为基础模型的重要组成部分,因为它们在序列中捕获相关性的出色能力。但是,注意会导致记忆中的二次复杂性并随着上下文长度的增长计算 ...

0 0 0 0 2025/06/30 arXiv:2411.17720v2 shenglijun

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)