车辆轨迹为各种现实世界应用提供了至关重要的运动信息。为了更好地利用车辆轨迹,必须开发一种轨迹学习方法,该方法可以有效,有效地提取丰富的语义信息,包括运动行为和旅行目的,以支持准确的下游应用程序。但是,创建这种方法提出了两个重大挑战 ...
0 0 0 2025/05/22 arXiv:2408.04916v1 momo_curtain
回归模型对于推荐系统至关重要。但是,社区内已明显忽略了转化的偏见问题。尽管其他领域的许多作品都设计了有效的偏见校正方法,但所有这些方法都是在模型外部进行事后治疗的,当应用于现实世界中的推荐系统时,面临实际挑战 ...
0 0 0 2025/05/22 arXiv:2505.13881v1 jacky2025
我们介绍了基于专门的扩散生成模型,该模型通过在注释的腹腔镜手术镜头上进行监督学习,捕获细粒机器人手术子缝隙动作的时空动力学。提出的模型为数据驱动的世界模型构成了基础,该模型能够模拟具有高时间忠诚的手术缝合的生物力学相互作用和程序动力学。注释从模拟视频中提取的$ \ sim2k $剪辑的数据集,我们将手术动作分类为细粒的子缝线类,包括理想和非理想执行针头定位,靶向,驾驶,驾驶和撤回 ...
0 0 0 2025/05/22 arXiv:2503.12531v1 swang
广泛的序列模型建立在以 Transformer 为模型的框架上,包括交替的序列混合器和通道混合层。本文研究了序列混合器的统一矩阵混合器的视图,可以将其概念化为输入序列上的线性图。该框架涵盖了广泛的众所周知的序列模型,包括变形金刚的自我注意力以及最近的强替代方案,例如结构化状态空间模型(SSM),并允许理解下游特征,例如通过其结构化矩阵类的属性来理解效率和表达性 ...
0 0 0 2025/05/22 arXiv:2407.09941v1 zhuyi
大型语言模型(llm)需要扩展上下文来处理许多关键应用程序。然而,现有的方法往往成本高昂且上下文扩展质量较差。在这项工作中,我们提出了,可扩展的嵌入,它实现了llm上下文的高质量扩展,具有很强的灵活性和成本效益... ...
0 0 0 2025/05/22 arXiv:2402.11573v1 claudia222
现有的检索型发电(RAG)系统在成本和有效性方面面临着重大挑战。一方面,他们需要在响应输入任务之前对冗长检索到的上下文进行编码,这构成了大量的计算开销。另一方面,直接使用通用大语言模型(LLM)通常会导致次优答案,而特定于任务的微调可能会损害LLMS的一般功能 ...
0 0 0 2025/05/22 arXiv:2409.15699v1 lpfgss
视频深度估计通过在每个框架上推断密度深度来将单眼视频剪辑提升到3D。大型基础模型的兴起以及合成训练数据的使用引起了对视频深度的新兴趣,这是由于大型基础模型的兴起和使用合成训练数据所带来的最新进展。但是,天真地将单图像深度估计器应用于视频的每个帧无视时间连续性,这不仅会导致闪烁,而且当摄像机运动导致深度范围的突然变化时,可能会破裂 ...
0 0 0 2025/05/22 arXiv:2411.19189v2 jevonhhh
时间序列应用的多样性和特定于域的数据的稀缺性突出了对具有很少射击学习能力的时间序列模型的需求。在这项工作中,我们提出了一种新颖的培训计划和一个基于 Transformer 的架构(统称为TimePFN),用于多元时间表(MTS)预测。 TimePFN基于先验数据拟合网络(PFN)的概念,该网络旨在近似贝叶斯推断 ...
0 0 0 2025/05/22 arXiv:2502.16294v1 wwb

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)