从计算的早期开始,游戏一直是研究机器如何进行复杂决策的重要测试。近年来,机器学习取得了巨大的进步,人造代理在Go,Atari和一些扑克的挑战领域中达到超人的性能。与他们的国际象棋,棋子和巴蒙的前身一样,这些游戏领域通过为人工智能从业者提供了精致而定义明确的挑战来驱动研究 ...
0 0 0 2025/09/21 arXiv:1902.00506v2 parsifalster
检测和避免(DAA)功能对于无人飞机系统(UAS)的安全操作至关重要。本文介绍了Airtrack,这是一个仅实时视觉检测和跟踪框架,尊重SUAS系统的大小,重量和功率(交换)约束。鉴于遥远飞机的低信噪比(SNR),我们建议在深度学习框架中使用完整的分辨率图像,以使连续的图像对齐以消除自我动态 ...
0 0 0 2025/09/21 arXiv:2209.12849v3 小百货
确保安全分离对于在共享领空中实现空降车辆的无缝高密度操作至关重要。为了为受资源受限的航空系统配备这种安全性关键能力,我们提出了Visafe,这是一种高速视觉的避免空中碰撞系统。 Visafe通过将基于学习的Edge-AI框架与根据Swap-C约束设计的自定义多相机硬件原型进行紧密整合,为检测和避免(DAA)问题提供了全栈解决方案 ...
0 0 0 2025/09/21 arXiv:2505.03694v2 小百货
深入的研究系统,通过协调推理,跨开放网络和用户文件搜索以及使用工具的代理AI,可以通过计划者,协调员和执行者进行分层部署。在实践中,培训整个堆栈端到端仍然不切实际,因此大多数工作都会训练与搜索,浏览和代码等核心工具连接的单个计划者。尽管SFT赋予协议保真度,但它遭受了模仿和暴露偏见的影响,并在环境反馈中不足 ...
0 0 0 2025/09/21 arXiv:2509.06733v1 sealaes
虽然当前基于聊天的AI助手主要是在反应性的,只有在用户提示时做出响应,但这些系统有很大的潜力可以主动协助任务而无需明确调用,从而实现混合启动性互动。这项工作探讨了由大语言模型提供动力的主动AI助手的设计和实施。我们首先概述了建立有效的主动助手的关键设计注意事项 ...
0 0 0 2025/09/21 arXiv:2410.04596v2 waterfall666
大型语言模型通常受到隔壁奖励的培训,从而限制了它们优化长期互动的能力。结果,他们经常对模棱两可或开放式用户请求进行被动反应,无法帮助用户达到最终意图并导致对话效率低下。为了解决这些局限性,我们介绍了Collabllm,这是一个新颖而通用的培训框架,可增强Multiturn Human-LLM协作 ...
0 0 0 2025/09/21 arXiv:2502.00640v3 waterfall666
生成AI的最新突破已通过端到端一代改变了推荐系统。 Onerec将建议重新定义为自回归的生成任务,从而实现了高模型的利用。尽管Onerec-V1在现实部署中显示出显着的经验成功,但两个关键的挑战阻碍了其可扩展性和性能:(1)效率低下的计算分配,其中97 ...
0 0 0 2025/09/20 arXiv:2508.20900v3 feng1008wd
这项工作开发了一个基于LLM的优化框架,以确保网络优化中严格的约束满意度。尽管LLM具有上下文推理能力,但现有方法通常无法执行限制,从而导致了不可行的解决方案。与解决平均约束的常规方法不同,所提出的框架集成了基于自然语言的输入编码策略,以限制解决方案空间并确保可行性 ...
0 0 0 2025/09/20 arXiv:2509.07492v1 s_75san

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)