低级适应性(LORA)已成为将预先训练的大语言模型调整到下游任务的普遍方法。但是,简单的低排放分解形式可能会限制假设空间。为了解决此限制,我们引入了位置感知余弦适应(LOCA),这是一种基于反离散余弦变换(IDCT)的新型频域参数效率微调方法,并具有可学习组件的选择性位置 ...
0 0 0 2025/02/26 arXiv:2502.06820v1 zxykbz
我们引入了 Kosmos-2,一种多模态大语言模型 (MLLM),支持感知对象描述(例如边界框)和将文本融入视觉世界的新功能 ...
0 0 0 2025/02/26 arXiv:2306.14824v3 18804024672
有效的建议对于大型在线平台至关重要。传统推荐系统主要依靠ID Token 来唯一识别项目,这些项目可以有效地捕获特定的项目关系,但遭受了诸如冗余和寒冷启动场景中性能差的问题。最近的方法是使用语义 Token 作为替代方案进行了探索,但它们面临着挑战,包括项目的重复和不一致的性能增长,从而使语义 Token 的潜在优势不足 ...
0 0 0 2025/02/26 arXiv:2502.16474v1 lhp
最近的多模式大语言模型(MLLM)在视力语言任务中是显着的,例如图像字幕和问题答案,但缺乏基本的感知能力,即对象检测 ...
0 0 0 2025/02/26 arXiv:2305.18279v2 18804024672
作为经济学和金融方面的基本方法,因子模型已被广泛用于定量投资。近年来,从具有专家设计的因素的传统线性模型转变为具有数据驱动因素的更灵活的非线性机器学习模型,旨在提高这些因素模型的有效性。但是,由于市场数据中的信噪比较低,数据驱动模型中的有效因素仍然具有挑战性 ...
0 0 0 2025/02/26 arXiv:2502.05218v1 Dionysus
新兴的人工智能(AI)应用程序通常平衡各种和有争议的利益相关者群体之间的偏好和影响。在系统设计,开发和部署期间,适应这些利益相关者群体需要工具,以促进不同的系统兴趣和协作界面,以支持谈判平衡这些利益。本文介绍了马尔可夫决策过程(MDP)和协作排名问题的交互式视觉“参与接口”,作为恢复以人为中心的控制源的示例 ...
0 0 0 2025/02/26 arXiv:2211.08419v1 weight
(因此如何利用文本数据促进语音预训练是一个尚未解决的问题。在本文中以将语音和文本预训练与预定义的统一离散表示显式对齐。具体来说,我们引入了两种替代的离散分词器来桥接语音和文本模态,包括音素单元和隐藏单元分词器,它们可以使用少量的语音文本配对数据进行训练... ...
0 0 0 2025/02/26 arXiv:2209.15329v3 yiyi_lw
我们提出了一种构建Mahjong人工智能(AI)的方法,Mahjong是多人游戏不完美的信息游戏。由于游戏树的大小很大,因此建造Mahjong的专家级AI播放器是具有挑战性的。我们将多个马尔可夫决策过程(MDP)定义为Mahjong的抽象来构建有效的搜索树 ...
0 0 0 2025/02/26 arXiv:1904.07491v1 weight

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)