随着视觉语言预训练模型(VLPM)的开发,以剪辑和对齐为代表,已经通过零件的零拍功能在没有微调的情况下通过零拍的能力来实现基于关联的视觉任务(例如图像分类和图像文本检索)的显着突破。但是,剪辑很难应用于基于一代的任务。这是由于缺乏解码器体系结构和生成预训练任务 ...
0 0 0 2025/05/15 arXiv:2304.13273v3 hynj
大型语言模型(LLMS)最近被利用用于资产定价任务和股票交易应用程序,使AI代理商能够从非结构化的财务数据中产生投资决策。但是,大多数基于LLM的基于LLM的投资策略的评估都是在狭窄的时间表和有限的库存宇宙上进行的,由于生存和数据努力偏见而导致的有效性夸大了。我们通过提出Finsaber来评估它们的普遍性和鲁棒性,Finsaber是一个回测框架,该框架评估了较长时期和更大的符号宇宙的基于时机的策略 ...
0 0 0 2025/05/15 arXiv:2505.07078v1 irving
数据收集技术的最新进展以及流数据的不断增长的量和速度,强调了时间序列分析的至关重要需求。在这方面,时间序列异常检测一直是一项重要活动,在网络安全,金融市场,执法和医疗保健等领域中有各种应用。尽管有关异常检测的传统文献集中在统计措施上,但近年来,机器学习算法的数量不断增加,呼吁对时间序列异常检测的研究方法进行结构化的一般表征 ...
0 0 0 2025/05/15 arXiv:2412.20512v1 PXXHL
深度学习推荐模型(dlrm)在facebook的许多关键业务服务中使用,并且就其数据中心的基础设施需求而言,是最大的人工智能应用程序。在本文中,我们讨论了用于大规模dlrm高性能分布式训练的软件/硬件联合设计解决方案。我们引入了基于pytorch的高性能可扩展软件堆栈 ...
0 0 0 2025/05/15 arXiv:2104.05158v7 xxx2050
我们提出了AM-INCKING-V1,这是一种32B密集的语言模型,它促进了推理的前沿,体现了开源创新的协作精神。超过deepSeek-r1和竞争性的前专家(MOE)模型(例如QWEN3-235B-A22B和SEED1.5思想,AM-INCKINCING-V1)的表现令人印象深刻,令人印象深刻的得分为85 ...
0 0 0 2025/05/14 arXiv:2505.08311v1 lianzhepku
环境预测框架对于自动驾驶汽车来说是不可或缺的,可以在动态环境中安全导航。激光雷达产生的占用网格图(L-ogm)提供了强大的鸟类眼景场景表示,可促进联合场景预测而不依赖手动标记的情况,这与常用的轨迹预测框架不同。先前的方法已直接在网格细胞空间中优化了确定性的L-OGM预测体系结构 ...
0 0 0 2025/05/14 arXiv:2210.01249v3 leonupup
站立控制对于人形机器人至关重要,具有整合到当前的运动和机能处理系统(例如秋季恢复)中的潜力。现有的方法要么仅限于忽略硬件约束的模拟,要么依赖于预定义的地面特异性运动轨迹,从而无法在现实世界场景中跨越姿势。为了弥合这一差距,我们提出了主机(人形站立控制),这是一个增强学习框架,从头开始学习站立控制,从而使SIM到实现的SIM转移到各种姿势中 ...
0 0 0 2025/05/14 arXiv:2502.08378v2 yydsdsyy
近年来,状态空间模型(SSM)已成为序列建模任务的有效工具。这些模型使用一组基础功能近似连续系统并将其离散为处理输入数据,从而非常适合建模以从连续系统的特定频率收集的时间序列数据。尽管具有潜力,但SSM在时间序列预测中的应用仍未得到充满意,大多数现有模型都将SSM视为用于捕获时间或频道依赖性的黑匣子 ...
0 0 0 2025/05/14 arXiv:2405.16312v2 oneyhu

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)