观点综合问题 - 从已知的图像中获得了场景的新颖观点 - 最新的关注部分是由于在虚拟和增强现实中引人入胜的应用。在本文中,我们探讨了一个有趣的场景,以查看合成:推断窄基线立体声摄像机捕获的图像中的视图,包括VR摄像机和现在宽宽的双镜头摄像头手机。我们称此问题立体声放大倍率,并提出了一个学习框架,该框架利用了我们称为Multiplane Images(MPI)的新分层表示形式 ...
0 0 0 2025/02/19 arXiv:1805.09817v1 wonglliam
通过自然语言进行交流是机器智能的关键方面,它要求计算模型以不同的监督水平来学习和推理世界概念。对完全监督的非交互式任务(例如提问和程序文本理解)取得了重大进展。然而,就像基于文本的游戏一样,各种连续的交互任务已经揭示了现有方法的局限性,这些方法在连贯性,上下文意识及其从环境中有效学习的能力方面揭示了现有方法 ...
0 0 0 2025/02/19 arXiv:2305.05091v2 parsifalster
精神疾病仍然是最关键的公共卫生问题之一。尽管它很重要,但许多精神卫生专业人员强调了他们的培训与实际的现实患者实践之间的脱节。为了帮助弥合这一差距,我们建议患者 -  {\ psi},这是一种新型的患者模拟框架,用于认知行为疗法(CBT)培训 ...
0 0 0 2025/02/19 arXiv:2405.19660v3 王德发
LLM-AS-A-Gudge模型生成了旨在捕获响应最终评估的逐步推理过程的思考链(COT)序列。但是,由于缺乏人类注释的婴儿床进行评估,因此所需的组件和有效推理痕迹的结构仍在研究中。因此,以前的方法经常(1)将推理痕迹限制为手工设计的组件,例如标准列表,参考答案或验证问题,以及(2)构建它们,使得计划与评估的推理相互交织 ...
0 0 0 2025/02/19 arXiv:2501.18099v1 leec
在视频中,一个对象通常显示为轨迹,即它跨越一些空间但更长的时间贴片,其中包含丰富的时空环境 ...
0 0 0 2025/02/19 arXiv:2301.01953v3 Jiangzeren
我们介绍了Zep,这是一种新型的AI代理的内存层服务,它在深度内存检索(DMR)基准中优于当前最新系统Memgpt。此外,与DMR相比,ZEP在更全面和具有挑战性的评估中表现出色,该评估更好地反映了现实世界中的用例。虽然现有的检索型生成(RAG)框架用于大语言模型(LLM)的代理商仅限于静态文档检索,但企业应用程序需要来自各种来源的动态知识集成,包括持续的对话和业务数据 ...
0 1 0 2025/02/19 arXiv:2501.13956v1 parsifalster
视觉 Transformer 在人工神经网络(ANN)中取得的显着成功已引起人们对将自我发挥机制和基于 Transformer 的结构纳入尖峰神经网络(SNNS)的越来越兴趣。尽管现有方法提出了与SNN兼容的尖峰自我注意力专业机制,但它们缺乏合理的缩放方法,并且这些方法提出的总体体系结构在有效提取本地特征的情况下遭受了瓶颈的影响。为了应对这些挑战,我们提出了一种新颖的尖峰自我发注意机制,名为Dua ...
0 0 0 2025/02/19 arXiv:2403.14302v2 皮皮家
尽管大型语言模型(LLM)和大型多模态模型(LMM)取得了进步,但它们与基于语言的类人实体的集成仍然不完整,阻碍了物理环境中复杂的现实任务的执行。现有的集成通常具有有限的开源功能,这对这一领域的集体进步构成了挑战。我们推出 LEGENT,这是一个开放、可扩展的平台,用于使用 LLM 和 LMM 开发实体代理 ...
0 0 1 2025/02/19 arXiv:2404.18243v2 h094071

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)