我们探讨了一种进化搜索策略,用于扩展推理时间在大语言模型中计算。提出的方法,思维进化,使用语言模型来产生,重组和完善候选人的反应。提出的方法避免了每当有解决方案评估器可用时,需要正式化基础推理问题 ...
0 0 0 2025/04/16 arXiv:2501.09891v1 leec
当前的车辆到所有设施(V2X)系统使用LIDAR和相机数据显着增强了3D对象检测。但是,这些方法在不利天气条件下遭受性能降解。天气风光4D雷达提供多普勒和其他几何信息,从而提高了应对这一挑战的可能性 ...
0 0 0 2025/04/16 arXiv:2411.08402v4 ttt
在过去的几十年中,扑克作为一个游戏家族已经进行了广泛的研究,但可收藏的纸牌游戏的关注相对较少。直到最近,我们才看到一个可以与最受欢迎的可收藏式纸牌游戏之一与专业人类玩家竞争的经纪人。尽管人工代理必须能够在这两种类型中使用不完美的信息,但可收藏的纸牌游戏构成了另一组独特的挑战 ...
0 0 0 2025/04/16 arXiv:2404.16689v1 gavin218
现有的行人属性识别(PAR)算法主要基于静态图像开发。但是,性能对于具有挑战性因素的图像(例如重闭,运动模糊等)并不可靠。在这项工作中,我们建议使用可以充分利用时间信息的视频框架来理解人类属性 ...
0 0 0 2025/04/16 arXiv:2304.10091v1 韩池
我们引入了零1-3,这是一个框架,用于在给定单个rgb图像的情况下更改对象的相机视角。为了在这种约束条件下执行新颖的视图合成,我们利用大规模扩散模型了解自然图像的几何先验。我们的条件扩散模型使用合成数据集来学习相对相机视点的控制,这允许在指定的相机变换下生成同一对象的新图像... ...
0 0 0 2025/04/16 arXiv:2303.11328v1 li934038421
学习如何适应复杂而动态的环境是导致我们智力的最重要因素之一。赋予人工代理商这种能力并不是一项简单的任务,尤其是在竞争性场景中。在本文中,我们介绍了一项广泛的研究,介绍了如何对流行的增强学习算法进行调整和实施,以学习和播放竞争性的多人卡游戏的现实实现 ...
0 0 0 2025/04/16 arXiv:2004.04000v1 gavin218
故事可视化是基于叙事生成相干图像的任务,随着文本到图像模型的出现,尤其是扩散模型的出现。但是,保持语义一致性,产生高质量的细粒度相互作用,并确保计算可行性仍然具有挑战性,尤其是在长篇小说可视化中(即 ...
0 0 0 2025/04/16 arXiv:2410.06244v1 xuan
RLCARD是用于纸牌游戏中增强学习研究的开源工具包。它支持具有易于使用的界面的各种卡环境,包括二十一点,Leduc Hold'em,Texas Hold'em,Uno,Dou Dizhu和Mahjong。 RLCARD的目的是桥接加强学习和不完美的信息游戏,并推动具有多个代理,大州和行动空间以及稀疏奖励的域中强化学习的研究 ...
0 0 0 2025/04/16 arXiv:1910.04376v2 gavin218

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)