大型语言模型的预训练数据由多个领域(如网络文本、学术论文、代码)组成,其混合比例对结果模型的能力至关重要... ...

0 0 0 0 2025/08/01 arXiv:2403.16952v2 yang99

在这项工作中,我们扩展了最初用于关节位置控制的低成本Gello远程操作系统,并提供了其他力信息。我们的第一个扩展是实施强制反馈,使用户在与环境互动时会感到阻力。我们的第二次扩展是将力量信息添加到数据收集过程和模仿学习模型的培训中 ...

0 0 0 0 2025/08/01 arXiv:2507.13602v1 odenkkk

在多代理路径查找(MAPF)问题中,一组在图形上移动的代理必须到达自己的各自目的地,而无需碰撞。在实用的MAPF应用程序中,例如自动化仓库中的导航(偶尔有数百个代理商),MAPF必须终生在线迭代。这种情况排除了离线计算密集型最佳方法的简单改编;因此,可扩展的次级算法对此类设置有吸引力 ...

0 0 0 0 2025/08/01 arXiv:1901.11282v5 user

软件问题分辨率是软件工程中的一个关键挑战,并且近年来引起了人们的关注。随着大语言模型(LLM)的快速发展,在解决现实世界软件工程任务方面取得了重大进展。最近的研究引入了集合推理技术,以提高基于LLM的问题解决方案的性能 ...

0 2 1 1 2025/08/01 arXiv:2507.23370v1 leec

股票趋势预测的努力主要集中于预测股票市场的未来轨迹,利用手动或技术方法来优化盈利能力。机器学习技术的最新进步表明了它们在辨别股票趋势预测领域内的真实盈利信号方面的功效,主要采用了源自历史股票价格模式的时间数据。然而,股票市场的固有波动和动态特征使多尺度的时间依赖性和稳定交易机会的学习和捕获成为巨大的挑战 ...

0 0 0 0 2025/08/01 arXiv:2212.08656v2 打笨蛋

3D高斯脱落的最新发展已在表面重建方面取得了重大进步。但是,由于高计算需求以及室外环境的典型动态外观,将这些方法缩放到大型场景仍然具有挑战性。这些挑战阻碍了航空测量和自动驾驶中的应用 ...

0 0 0 0 2025/08/01 arXiv:2506.17636v1 zhifeiji

产生一致的长视频是一个复杂的挑战:而基于扩散的生成模型会产生视觉上令人印象深刻的短剪辑,将它们扩展到更长的持续时间通常会导致记忆瓶颈和长期不一致。在本文中,我们提出了Tokensgen,这是一个新颖的两阶段框架,利用浓缩 Token 来解决这些问题。我们的方法将长时间的视频生成分解为三个核心任务:(1)内盘语义控制,(2)长期一致性控制,以及(3)Clip平滑过渡 ...

0 0 0 0 2025/08/01 arXiv:2507.15728v1 wenzhanwujian

WAVLM等自制学习(SSL)模型通过提供丰富的上下文表示,为说话者诊断带来了重大改进。但是,这些模型的高计算和内存成本阻碍了他们在实时和资源约束的情况下的部署。在这项工作中,我们通过知识蒸馏指导的结构修剪来介绍一项关于压缩基于SSL的诊断模型的综合研究 ...

0 0 0 0 2025/08/01 arXiv:2506.18623v1 takkeri

我们研究了多代理路径查找(MAPF)的优先计划。现有的优先MAPF算法取决于脑规则的启发式和随机分配,以确定所有代理的固定总优先级排序。相反,我们探索了所有可能的部分优先顺序的空间,作为新型系统和冲突驱动的组合搜索框架的一部分 ...

0 0 0 0 2025/08/01 arXiv:1812.06356v1 user

共同语音的手势视频生成旨在综合扬声器的现实,音频一致的视频,并配有同步的面部表情和身体手势。由于音频和视觉内容之间的一对多映射,这项任务提出了挑战,这使大规模公共数据集的稀缺和高计算需求更加复杂。我们提出了一个轻巧的框架,该框架利用2D全身骨骼作为有效的辅助条件,以启动视觉输出的音频信号 ...

0 0 0 0 2025/08/01 arXiv:2507.06812v2 yanghedada

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)