现有的车辆轨迹预测模型与普遍性,预测不确定性和处理复杂的相互作用的斗争。它通常是由于针对特定数据集定制的复杂体系结构等限制以及效率低下的多模式处理。我们提出了带有寄存器查询(PERREG+)的感知器,这是一个新颖的轨迹预测框架,介绍了:(1)通过自distillation(SD)和蒙版重建(MR)进行双层表示学习,捕获全球上下文和细粒度细节 ...
大型语言模型(LLM)代理提供了一个强大的新范式,用于通过将自然语言推理与执行外部工具相结合来解决各种问题。但是,他们的动态和非透明行为引入了关键的安全风险,尤其是在迅速注射攻击的情况下。在这项工作中,我们提出了一种新颖的见解,将代理运行时痕迹视为具有可分析语义的结构化程序 ...
3D空间推理是分析和解释3D空间内对象的位置,方向和空间关系的能力。这使模型能够对3D场景进行全面的了解,从而使其适用于更广泛的领域,例如自动导航,机器人技术和AR/VR。尽管大型多模型模型(LMM)在各种图像和视频理解任务中取得了显着的进步,但对各种自然图像进行3D空间推理的功能的研究较少 ...
这项对检索型生成(RAG)研究文献的系统评价提供了对2020年至2025年5月之间发表的最高度引用的研究的重点分析。总共128篇文章符合我们的纳入标准。记录是从ACM数字图书馆,IEEE Xplore,Scopus,ScienceDirect以及数字书目和图书馆项目(DBLP)中检索的 ...
在本文中,我们提出了一种基于深神经网络(DNNS)的全自动脑肿瘤分割方法。所提出的网络是根据MR图像中图所示的胶质母细胞瘤(低级和高级)量身定制的。从本质上讲,这些肿瘤可以出现在大脑中的任何地方,几乎具有任何形式,大小和对比度 ...
最近,密集的连接引起了计算机视觉的极大关注,因为它们促进了梯度流动和训练过程中隐含的深入监督。特别是,Densenet以馈送方式将每一层连接到其他层,在自然图像分类任务中表现出了令人印象深刻的表现。我们提出了HyperDensenet,这是一个3D完全卷积神经网络,该网络将密集连通性的定义扩展到多模式分割问题 ...
我们基于Chandra X射线观测站进行的成像和高分辨率光谱观测,研究了原型Seyfert 2 Galaxy,Markarian 3。我们构建了一个反v的X射线图像,该图像揭示了窄线区域(NLR)中热气体的S形形态。尽管该形态与无线电和[O III]发射相似,但X射线气体的分布比在这些其他波长下获得的分布更宽 ...
现在,大型语言模型(LLM)通过发出扩展的思想链来解决多步骤问题。在此过程中,他们经常在问题上重新介绍相同的中间步骤,使 Token 使用和延迟膨胀。上下文窗口的饱和度留下了较小的探索能力 ...