大多数图像到图像翻译模型假设源和目标域的语义类别之间存在独特的对应关系。但是,由于分布分布,不同的类集和不对称信息表示,这种假设并不总是在现实世界中的情况下。当传统的gan试图生成与目标域分布相匹配的图像时,它们可能会幻觉地幻觉,从源域中缺少类的伪造实例,从而降低了翻译图像的有用性和可靠性 ...
大型语言模型(LLM)越来越多地用于模拟,从而在角色扮演代理和计算社会科学(CSS)中应用了应用。但是,这些模拟的可靠性尚未探索,这引起了人们对LLM在这些应用中的可信度的担忧。在本文中,我们旨在回答``基于LLM的仿真如何可靠?''解决此问题,我们介绍了Trustsim,这是一个涵盖10个与CSS相关主题的评估数据集,以系统地研究LLM模拟的可靠性 ...
推荐系统旨在估算历史用户行为和元数据之间动态变化的用户偏好和顺序依赖性。尽管已证明基于 Transformer 的模型在顺序建议中有效,但它们的状态增长与正在处理的序列的长度成正比,这使它们在记忆和推理成本方面变得昂贵。我们的研究集中在顺序建议中的三个有希望的方向上:通过使用状态空间模型(SSM)提高速度,因为它们可以在ARXIV:2403提出的较低潜伏期,记忆和推理成本的顺序建议域中获得SOTA ...
哪种大型语言模型(LLM)更好?每个评估都讲述了一个故事,但是用户对当前LLM的真正看法是什么?本文介绍了线索,这是一位由LLM驱动的访调员,在用户与LLMS互动之后,可以进行瞬间的用户体验访谈,并自动从大量访谈日志中获得有关用户意见的见解。我们对数千名用户进行了一项研究,以了解主流LLM的用户意见,招募用户首先与目标LLM聊天,然后接受Clue的采访。我们的实验表明,线索捕获了有趣的用户意见,例 ...
大型语言模型(LLM)已成为数学定理中有力的工具,尤其是在利用诸如精益之类的正式语言时。主要的学习范式是专家迭代,它需要一个预定义的数据集,其中包括许多数学问题。在此过程中,LLMS试图证明数据集中的问题,并通过对发现的证据进行自我培训来迭代地完善其功能 ...
最新的DNN体系结构设计的最新进展一直在朝着 Transformer 模型发展。这些模型在广泛的应用中具有卓越的精度。自从最初引入 Transformer 模型以来,在过去的几年中,这种趋势一直保持一致 ...
大型语言模型(LLM)准备在我们的生活中发挥越来越重要的作用,从而在各种任务中提供帮助。在地理空间领域,LLMS证明了回答通用问题的能力,例如确定一个国家的资本。尽管如此,在回答有关特定地方的细粒度问题(例如杂货店或餐馆)时,它们的效用受到了阻碍,这些问题构成了人们日常生活的基本方面。这主要是因为我们城市中的地方还没有系统地喂入LLM,以便理解和记住它们 ...
在驾驶场景中,现实的场景重建由于快速移动的对象带来了重大挑战。大多数现有方法依赖于对象姿势的劳动密集型手动标记来重建规范空间中的动态对象,并根据渲染过程中的这些姿势移动它们。尽管某些方法试图使用3D对象跟踪器替换手动注释,但3D跟踪器的有限概括(由大规模3D数据集的稀缺引起)导致现实世界中的劣质重建 ...