红外可见的对象检测旨在通过融合红外和可见图像的互补信息来实现强劲的对象检测。但是,高度动态的可变互补特性和常见的方式错位使互补信息的融合变得困难。在本文中,我们提出了动态自适应多光谱检测 Transformer (DAMSDET),以同时解决这两个挑战 ...
0 0 0 2025/05/05 arXiv:2403.00326v3 wzlcarrot
大沼泽地在周围地区的洪水和干旱调节,水资源规划和生态系统管理中起着至关重要的作用。但是,预测水位的传统基于物理和统计方法通常会面临重大挑战,包括高计算成本以及对各种或不可预见条件的适应性有限。大型时间序列模型的最新进展证明了解决这些局限性的潜力,最先进的深度学习和基础模型在时间序列中取得了巨大的成功预测 ...
0 0 0 2025/05/05 arXiv:2505.01415v1 annseongjin
随着大型语言模型(LLM)演变为使用工具的代理商,实时浏览网络的能力已成为衡量其推理和检索能力的关键标准。诸如BrowseComp之类的现有基准专注于英语,并忽略其他主要信息生态系统的语言,基础设施和与审查相关的复杂性 - 最著名的是中文。为了解决这一差距,我们介绍了BrowseComp-ZH,这是一种高难题的基准测试,以全面评估中国网络上的LLM代理 ...
0 0 0 2025/05/05 arXiv:2504.19314v2 chrisxiong
推理语言模型(RLMS)的最新发展代表了大型语言模型中的一种新颖进化。特别是,DeepSeek-R1的最新发布产生了广泛的社会影响,并激发了研究社区的热情,以探索语言模型的明确推理范式。但是,DeepSeek尚未完全开源,其中包括DeepSeek-R1-Zero,DeepSeek-R1和蒸馏小型型号 ...
0 0 0 2025/05/05 arXiv:2505.00551v2 fazai001
在本文中,我们提出了一个大规模详细的3D面部数据集,面孔和相应的基准测试,以评估单视面部3D重建。通过对面部数据数据进行培训,提出了一种新型算法来预测单个图像输入中精心的可操作的3D面模型。 FaceScape数据集发布$ 16,940 $纹理的3D面孔,从$ 847 $的主题捕获,每个主题都有20美元的特定表达式 ...
0 0 0 2025/05/05 arXiv:2111.01082v2 qinhui_cici
检索增强生成(rag)已成为一种有前途的解决方案 ...
0 0 1 2025/05/05 arXiv:2406.13805v1 meow
图形的深度学习模型已在节点分类任务中实现了强大的性能。尽管它们扩散,但目前尚无对他们对对抗攻击的鲁棒性的研究。但是,在可能使用它们的域中,e ...
0 0 0 2025/05/05 arXiv:1805.07984v4 xixiaixixi
 Transformer 层使用多头注意力的交替模式和多层感知器(MLP)层,为各种机器学习问题提供了有效的工具。由于 Transformer 层使用残差连接来避免消失梯度的问题,因此可以将它们视为微分方程的数值集成。在这个扩展的摘要中,我们基于这种联系,并提出了 Transformer 层的内部体系结构的修改 ...
0 0 0 2025/05/05 arXiv:2212.06011v1 haiyao

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)