在自动驾驶中,使用单眼相机准确的3D车道检测对于下游任务很重要。最近的CNN和 Transformer 方法通常采用两阶段模型设计。第一阶段将图像特征从前图转换为鸟眼视图(BEV)表示 ...
0 0 0 2025/09/10 arXiv:2402.06423v2 wenuyang
远程光绘画学(RPPG)可实现非接触性生理测量,但仍然非常容易受到照明变化,运动伪像和有限的时间建模。大型语言模型(LLMS)擅长捕获长期依赖性,提供潜在的解决方案,但由于其以文本为中心的设计,RPPG信号的持续噪声敏感性挣扎。为了弥合这一差距,我们介绍了Physllm,这是一个协作优化框架,该框架与域特异性RPPG组件协同llms ...
0 0 0 2025/09/10 arXiv:2505.03621v1 zzr123456
可靠且可解释的交通崩溃建模对于理解因果关系和改善道路安全至关重要。这项研究介绍了一种新的方法来通过利用从多个来源融合的全面数据集来预测碰撞类型,包括天气数据,崩溃报告,高分辨率交通信息,路面几何形状和设施特征。我们方法的核心是特征组表型 Transformer (FGTT)模型的开发,该模型将不同的数据组织成有意义的特征组,称为 Token  ...
0 0 0 2025/09/10 arXiv:2412.06825v2 xuexizhanghao
在几次学习任务中,跨模式特征提取和集成的进步可以显着提高性能。但是,当遇到实质域移动时,当前的多模式对象检测(MM-OD)方法通常会出现显着的性能降解。我们建议,合并丰富的文本信息可以使模型能够在视觉实例及其相应的语言描述之间建立更强大的知识关系,从而减轻域转移的挑战 ...
0 0 0 2025/09/10 arXiv:2502.16469v1 zzr123456
我们介绍了一种基于高斯工艺回归(GPR)的合奏学习方法,以预测给定股票水平和宏观经济信息的条件预期股票回报。我们的合奏学习方法大大降低了GPR推论中固有的计算复杂性,并将其赋予一般的在线学习任务。 We conduct an empirical analysis on a large cross-section of US stocks from 1962 to 2016. ...
0 0 0 2025/09/10 arXiv:2212.01048v2 hellbo
深度神经网络(DNN)最近导致了许多领域的显着改善。但是,DNN容易受到对抗性示例的攻击,这些例子是具有不可察觉的扰动的样本,同时极大地误导了DNN。此外,即使对手无法访问基础模型,也可以使用对抗性示例对各种基于DNN的系统进行攻击 ...
0 0 0 2025/09/10 arXiv:1806.09186v3 cella
大型多模型模型的最新进展具有利用基于图像的工具,并通过增强学习来解决视觉问题。但是,现有的开源方法通常表现出单调的推理模式,并且仅允许有限的互动转弯,从而使他们不足以完成需要试用和错误探索的困难任务。在这项工作中,我们通过扩展基于工具的交互并引入Mini-O3来解决此限制,该系统可以执行深层,多转的推理 - 跨越了数十步 - 并在具有挑战性的视觉搜索任务上实现最先进的性能 ...
0 0 0 2025/09/10 arXiv:2509.07969v1 麦兜
深度学习的最新进展彻底改变了地震监测,但开发了一个基础模型,该模型在多个复杂任务中表现良好仍然具有挑战性,尤其是在处理降级信号或数据稀缺时。这项工作提出了Seismollm,这是第一个利用跨模式转移进行地震监测的基础模型,以从大型语言模型中释放大规模预训练的功能,而无需在地震数据集中进行直接预培训。通过精心训练的GPT-2模型的详尽波形 Token 化和微调,Seismollm在五个关键任务中实现 ...
0 0 0 2025/09/10 arXiv:2502.19960v2 zzr123456

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)