联合迅速学习已成为一种沟通效率和隐私性的范式,用于调整跨分散客户的大型视觉模型,例如剪辑。但是,此设置的安全性含义仍然没有被置于不足的状态。在这项工作中,我们介绍了联合及时学习中的后门攻击的首次研究 ...

0 0 0 0 2025/07/05 arXiv:2506.22506v1 chenzhuo-wang

建立在因果视觉语言模型(VLM)的多模式嵌入模型中,在各种任务中都表现出了希望。但是,当前的方法面临三个关键局限性:在VLM骨架中使用因果关注是嵌入任务的次优。依赖高质量标记的配对数据而引起的可伸缩性问题;培训目标和数据的多样性有限。为了解决这些问题,我们提出了MOCA,这是将预训练的VLM转换为有效双向多模式嵌入模型的两阶段框架 ...

0 0 0 0 2025/07/04 arXiv:2506.23115v1 jueli

推荐系统在帮助用户导航的产品和服务选择方面起着关键作用。在在线平台上,用户有机会以各种模式共享反馈,包括数字评分,文本评论以及喜欢/不喜欢。传统推荐系统依赖用户明确的评分或隐式交互(e ...

0 0 0 0 2025/07/04 arXiv:2405.05562v3 siweima

深度学习彻底改变了人工智能领域。基于基于深度学习的方法发现的统计相关性,计算机视觉促进了自动驾驶和机器人技术等领域的巨大增长。尽管是深度学习的基础,但这种相关性并不稳定,并且容易受到不受控制的因素的影响 ...

0 0 0 0 2025/07/04 arXiv:2307.13992v2 TJ

知识追踪是通过学习活动建模学生知识的行为,是计算机辅助教育领域的广泛研究问题。尽管具有注意机制的模型表现优于传统方法,例如贝叶斯知识追踪和协作过滤,但它们具有两个局限性。首先,这些模型依靠浅的注意层,并且随着时间的流逝,练习和反应之间的复杂关系 ...

0 0 0 0 2025/07/04 arXiv:2002.07033v5 乐乐

检索型生成(RAG)系统通常会在不完美的检索中挣扎,因为传统检索员专注于词汇或语义相似性,而不是逻辑相关性。为了解决这个问题,我们提出了Hoprag,这是一种新颖的抹布框架,通过图形结构的知识探索通过逻辑推理来增强检索。在索引期间,Hoprag构造了一个传递图,文本块作为顶点和逻辑连接,通过LLM生成的伪Queries作为边缘建立 ...

0 0 0 0 2025/07/04 arXiv:2502.12442v2 moshmode

在神经解码研究中,最有趣的主题之一是基于fMRI信号的自然图像的重建。先前的研究成功地重新创建了视觉效果的各个方面,例如低级属性(形状,纹理,布局)或高级特征(对象类别,场景的描述性语义),但通常未能将这些属性一起重建这些属性以获得复杂场景图像。 Generative AI最近通过能够产生高复杂性图像的潜扩散模型进行了飞跃 ...

0 0 0 0 2025/07/04 arXiv:2303.05334v2 helloworldhello

传统上,神经时间序列分析一直集中在时间域中的数据建模,通常采用某些方法将等效的傅立叶域表示作为辅助光谱特征。在这项工作中,我们将主要焦点转移到频率表示,将时间序列数据完全和直接在傅立叶域中建模。我们引入了神经傅立叶建模(NFM),这是一种紧凑而强大的时间序列分析解决方案 ...

0 0 0 0 2025/07/04 arXiv:2410.04703v1 yss

虽然端到端的视频到原告的生成大大改善,但产生了高保真的音频,从而真正捕捉视觉内容的细微差别仍然具有挑战性。像创意行业的专业人士一样,这一代人需要关于视觉动态,声学环境和时间关系等项目的复杂推理。我们介绍了思想,这是一个新颖的框架,利用了经过思考链(COT)推理来启用逐步,交互式音频的生成和视频编辑 ...

0 0 0 0 2025/07/04 arXiv:2506.21448v2 Du

如果被恶意用户利用,大语言模型(LLM)的普遍性和强大能力会带来明显的安全性和道德风险。为了防止LLM的潜在欺骗性使用,最近的作品提出了算法来检测LLM生成的文本并保护LLM。在本文中,我们研究了这些LLM检测器在对抗攻击下的鲁棒性和可靠性 ...

0 0 0 0 2025/07/04 arXiv:2305.19713v2 15611250722

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)