用于任务规划和物联网自动化的大型语言模型(LLM)的探索最近引起了广泛关注。然而,现有的工作在资源可访问性、复杂的任务规划和效率方面受到限制。在本文中,我们提出了 LLMind,这是一种基于 LLM 的人工智能代理框架,可以实现物联网设备之间的有效协作以执行复杂的任务 ...
0 0 0 2025/06/24 arXiv:2312.09007v4 HeiHuZi
解码器在恢复场景深度中起着重要作用。但是,以前的作品中使用的解码器忽略了多级无损细粒信息的传播,无法并行捕获本地和全局信息,并且无法对最终输出差异进行足够的全局统计分析。此外,从低分辨率特征空间到高分辨率特征空间的映射过程是一个可能具有多个解决方案的一对多问题 ...
0 0 0 2025/06/24 arXiv:2305.18706v1 LiuAobin
 Transformer 已成为大型语言模型和各个领域的各种下游任务的事实上的标准。尽管有许多优势,例如固有的训练并行性,但由于无法有效处理固定上下文窗口和注意机制的二次复杂性, Transformer 仍然面临着关键的挑战。这些挑战已经引起了人们对类似RNN的架构的兴趣,这些构建结构具有序列长度的线性缩放,并改善了对远程依赖性的处理,尽管由于其固有的经常性性质,因此具有有限的并行性 ...
0 0 0 2025/06/24 arXiv:2506.11305v1 odenkkk
推荐系统从用户反馈中学习个性化的用户偏好,例如点击。但是,用户反馈通常会偏向部分观察到的兴趣,而许多用户的隐藏兴趣尚未探索。现有方法通常会减轻偏见,增加建议多样性或使用Bandit算法来平衡探索探索折衷的权衡 ...
0 0 0 2025/06/24 arXiv:2405.08582v1 zhr
提升建模是一种用于预测治疗(例如折扣)对个人反应的影响的技术 ...
0 0 0 2025/06/24 arXiv:2401.14426v1 zhr
使用数值反馈(例如标量奖励)的加强学习(RL)的最新进展显着增强了大语言模型(LLMS)的复杂推理能力。尽管取得了成功,但我们确定了RL遇到的三个关键挑战,只有数值反馈:性能高原,自我反射的有效性和持续失败。然后,我们证明,即使在表现出性能高原之后,RL-FineTy的模型也可以通过以批评形式利用自然语言反馈来对持续失败的问题产生正确的改进 ...
0 0 0 2025/06/24 arXiv:2506.03106v2 13843225286
本文解决了动物重新识别的挑战,这是一个新兴领域,与人的重新识别具有相似之处,但由于各种物种,环境和姿势而产生了独特的复杂性。为了促进该领域的研究,我们引入了openanimals,这是专门为动物重新识别而设计的灵活且可扩展的代码库。我们通过重新审查包括机器人,AGW,SB和MGN在内的几种最先进的人重新识别方法进行全面研究,并评估它们对动物重新识别基准的有效性,例如Hyenaid,已豹,Seatu ...
0 0 0 2025/06/24 arXiv:2410.00204v1 17733052961
传统搜索引擎通常为所有用户提供相同的搜索结果,忽略了个人偏好。为了应对这一限制,已经开发了个性化搜索来根据查询日志得出的用户偏好来重新排列结果。深度学习的个性化搜索方法已经表现出了希望,但它们严重依赖丰富的培训数据,使它们容易受到数据稀疏挑战的影响 ...
0 0 0 2025/06/24 arXiv:2402.10548v1 wangluyi

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)