用户模拟器对于复制人类与对话系统的互动至关重要,支持协作培训和自动评估,特别是对于大型语言模型(LLMS)。但是,现有的模拟器通常仅依靠文本话语,缺少隐性用户特征,例如个性,说话风格和目标。相反,基于角色的方法缺乏普遍性,因为它们取决于著名个体或原型的预定义概况 ...

0 0 0 0 2026/01/16 arXiv:2502.18968v4 arthur

最近对大型语言模型 (LLM) 多元化调整的呼吁鼓励使模型适应不同的用户偏好。然而,大多数关于个性化奖励模型的先前工作严重依赖于额外的身份信息,例如人口统计详细信息或一组预定义的偏好类别。为此,我们引入了 SynthesizeMe,这是一种从用户交互中归纳合成用户角色以进行个性化奖励建模的方法。 SynthesizeMe 首先生成并验证推理以解释用户偏好,然后从该推理中归纳出合成用户角色,最后过滤出信息丰富的先前用户交互,以便为特定用户构建个性化提示。我们表明,使用 SynthesizeMe 诱导提示可以将 Chatbot Arena 上的个性化 LLM 作为法官的准确率提高 4.4%。将 SynthesizeMe 派生提示与奖励模型相结合,可在 PersonalRewardBench 上实现最佳性能:从 Chatbot Arena 和 PRISM 的 854 位用户收集的用户与聊天机器人的分层交互的新管理 ...

0 0 0 0 2026/01/16 arXiv:2506.05598v1 arthur

个性化大型语言模型(LLM)已成为促进其广泛应用以增强个人生活体验的关键一步。为了追求个性化,从个人的历史数据中提取关键偏好信息作为指导偏好背景来定制 LLM 生成已成为一个有前途的方向。然而,这些方法由于忽视了用户间比较分析而面临着根本性的限制,而用户间比较分析对于识别真正影响偏好的用户间差异至关重要。为了解决这一限制,我们提出了差异感知个性化学习(DPL),这是一种强调提取用户间差异以增强 LLM 个性化的新颖方法。 DPL 战略性地选择代表性用户进行比较,并建立结构化标准来提取有意义的、与任务相关的差异,以定制 LLM 生成。对真实世界数据集的大量实验表明,DPL 显着增强了 LLM 个性化。我们在此 https URL 发布我们的代码 ...

0 0 0 0 2026/01/16 arXiv:2503.02450v3 arthur

个性化大语言模型 (LLM) 旨在根据个人用户偏好定制交互、内容和推荐。虽然参数高效微调(PEFT)方法在性能和泛化方面表现出色,但它们成本高昂,并且单独使用时会限制公共利益。为此,我们引入了 Personalized Pieces (Per-Pcs),这是一个框架,允许用户通过协作努力安全地共享和高效地组装个性化 PEFT。 Per-Pcs 涉及选择共享者、将他们的 PEFT 分成多个部分以及为每个部分训练门。这些片段被添加到一个池中,目标用户可以使用他们的历史数据从中选择和组装个性化的 PEFT。这种方法可以保护隐私并实现细粒度的用户建模,而无需过多的存储和计算需求。实验结果表明,Per-Pcs 的性能优于非个性化和 PEFT 检索基线,提供与 OPPU 相当的性能,并且六项任务的资源使用量显着降低。进一步的分析强调了 Per-Pcs 在共享者数量和选择策略、件共享率以及计算时间和存储空间的可扩展性方面的稳健性。 Per-Pcs 的模块化促进了安全共享,使 LLM 个性化更加高效、有效,并且通过协作努力可以广泛使用 ...

0 0 0 0 2026/01/16 arXiv:2406.10471v3 arthur

本文强调了大型语言模型中个性化的重要性,并介绍了 LaMP 基准——一种用于训练和评估语言模型以生成个性化输出的新颖基准。 LaMP 提供了一个全面的评估框架,其中包含不同的语言任务以及针对每个用户配置文件的多个条目。它由七个个性化任务组成,涵盖三个文本分类和四个文本生成任务。我们还提出了两种检索增强方法,从每个用户配置文件中检索个人项目,以个性化语言模型输出。为此,我们研究了各种检索模型,包括术语匹配、语义匹配和时间感知方法。针对零样本和微调语言模型的 LaMP 进行了大量实验,证明了所提出的检索增强方法的有效性,并强调了个性化在各种自然语言任务中的影响 ...

0 0 0 0 2026/01/16 arXiv:2304.11406v4 arthur

大语言模型 (LLM) 个性化旨在根据个人用户的历史交互来定制模型行为。然而,它的有效性常常受到两个关键挑战的阻碍:\textit{冷启动问题},即历史记录有限的用户无法为准确的个性化提供足够的上下文;以及\textit{偏差问题},即具有丰富但倾斜历史记录的用户导致模型过度拟合狭窄的偏好。我们将这两个问题视为共同的潜在限制的症状,即无法对用户之间的集体知识进行建模。为了解决这个问题,我们提出了一种局部-全局记忆框架(LoGo),它将个性化局部记忆与捕捉整个人群共同兴趣的集体全局记忆结合起来。为了协调这两个内存源之间的差异,我们引入了一个调解器模块,旨在解决本地信号和全局信号之间的冲突。对多个基准的大量实验表明,LoGo 通过预热冷启动用户和减少有偏见的预测,持续提高个性化质量。这些结果凸显了整合集体知识以增强 LLM 个性化的重要性 ...

0 0 0 0 2026/01/16 arXiv:2509.23767v1 arthur

近年来,大型语言模型(LLM)取得了巨大的成功,实现了广泛的应用,包括支持用户日常生活和工作的智能助手。构建此类助手的一个关键因素是 LLM 的个性化,因为用户的偏好和需求差异很大。激活引导直接利用 LLM 激活空间中代表用户偏好的方向来调整其行为,提供了一种经济有效的方法来使模型的输出与个人用户保持一致。然而,现有的方法依赖于所有历史数据来计算引导向量,忽略了并非所有内容都反映真实的用户偏好,这破坏了个性化信号。为了解决这个问题,我们提出了 SteerX,一种分离的转向方法,它将偏好驱动的组件与偏好无关的组件隔离开来。 SteerX 以因果推理理论为基础,估计 Token 级别的因果效应,以识别偏好驱动的 Token ,将这些离散信号转换为连贯的描述,然后利用它们来引导个性化的 LLM 生成。通过关注真正偏好驱动的信息,SteerX 可以生成更准确的激活引导向量并增强个性化。在现实世界数据集中对两种代表性转向骨干方法进行的实验表明,SteerX 持续增强了转向矢量质量,为更有效的 LLM 个性化提供了实用的解决方案 ...

0 0 0 0 2026/01/16 arXiv:2510.22256v1 arthur

大型语言模型(LLM)展现了卓越的能力,并在各个领域取得了重大突破,近年来得到了广泛采用。在此基础上,我们研究了它们在本地生活服务领域的潜力。在这项研究中,我们建立了一个全面的基准,并系统地评估了不同 LLM 在与当地生活服务相关的广泛任务中的表现。为了进一步提高其有效性,我们探索了两种关键方法:模型微调和基于代理的工作流程。我们的研究结果表明,即使是相对紧凑的 7B 模型也可以达到与更大的 72B 模型相当的性能水平,从而有效地平衡推理成本和模型能力。这一优化大大提高了LLM在现实世界在线服务中部署的可行性和效率,使其更实用、更适合本地生活应用 ...

0 0 0 0 2026/01/15 arXiv:2506.02720v3 arthur

通用多模式嵌入模型在捕获查询和候选者之间的语义相关性方面取得了巨大成功。但是,当前的方法要么将查询和候选者置于单个矢量中,因此可能限制了细粒度信息的表现力,或者产生过多的矢量,这些向量对于多向量检索而过于昂贵。在这项工作中,我们介绍了Metabed,这是一个新的多模式检索框架,它重新考虑了如何在大规模上构建多模式嵌入方式并与之相互作用 ...

0 0 0 0 2025/09/24 arXiv:2509.18095v1 arthur

多模式文档检索系统启用跨文本,图像和布局的信息访问,从而使各个领域受益,例如基于文档的问题回答,报告分析和交互式内容摘要。 Rerankers通过重新排序检索候选人来提高检索精度。但是,当前的多模式重新骑行方法仍未得到充实,并在培训策略和整体有效性方面有很大的改善空间 ...

0 0 0 0 2025/09/17 arXiv:2506.12364v2 arthur