基础模型(FMS)已用于生成合成公共数据集,以解决每个客户使用唯一的模型体系结构的异质联合学习(HFL)问题。但是,在HFL上下文中并未对整合FMS的漏洞,尤其是针对后门攻击的漏洞。在本文中,我们引入了一种新型的HFL后门攻击机制,该机制规避了对客户妥协或持续参与FL过程的需求 ...
0 0 0 2025/03/19 arXiv:2311.18350v1 chenzhuo-wang
单个完全卷积神经网络(FCN)如何在对象检测中执行?我们介绍了densebox,这是一个统一的端到端FCN框架,可以通过图像的所有位置和尺度直接预测边界框和对象类的信心。我们的贡献是两个方面。首先,我们表明,如果仔细设计和优化,单个FCN可以非常准确,有效地检测到多个不同的对象 ...
0 0 0 2025/03/19 arXiv:1509.04874v3 lcaiwen
现代对象探测器在很大程度上依赖于矩形边界框,例如锚,建议和最终预测,以在各种识别阶段表示对象。边界框很方便,但仅提供对象的粗糙定位,并导致对象特征的粗略提取。在本文中,我们介绍\ textbf {reppoints}(代表点),这是对象的新表示,作为一组示例点,可用于本地化和识别 ...
0 0 0 2025/03/19 arXiv:1904.11490v2 lcaiwen
微调已成为利用大型语言模型(LLM)进行特定下游任务的关键过程,使这些模型能够在各个领域实现最新的性能。但是,微调过程通常涉及敏感数据集,引入了利用此阶段独特特征的隐私风险。在本文中,我们对与微调LLM相关的隐私挑战进行了全面的调查,强调了各种隐私攻击的脆弱性,包括会员推理,数据提取和后门攻击 ...
0 0 0 2025/03/19 arXiv:2412.16504v1 chenzhuo-wang
视觉问题回答(VQA)的理想形式使我们能够在视觉和语言的联合空间中研究推理,并可以作为场景理解的AI任务的代理。但是,迄今为止,大多数VQA基准都集中在简单计数,视觉属性和对象检测等问题上,这些问题不需要图像中的内容以外的推理或知识。在本文中,我们解决了基于知识的视觉问题回答的任务,并提供了一个名为OK-VQA的基准,其中图像内容不足以回答问题,鼓励依赖外部知识资源的方法 ...
0 0 0 2025/03/19 arXiv:1906.00067v2 zl1994
具有多模式感知和基于大型视觉模型(LVLM)的多模式感知和推理能力的体现代理的最新进展,在自主互动的真实或网络世界中表现出色,帮助人们在复杂的环境中做出明智的决策。但是,当前的作品通常通过黄金行动轨迹或针对确定目标的理想的以任务为导向的解决方案来优化。该范式认为有限的面向用户的因素,这可能是他们在广泛的个人助理应用程序中绩效降低的原因 ...
0 0 0 2025/03/19 arXiv:2412.07472v3 killerman028
我们提出\ llinstruct:一个8B指令调整的模型,旨在为英语语言能力评估(ELPA)和相关应用程序生成内容。我们的工作涉及在ELPA域中创建一个新的70K指令和解释的数据集,并使用它们来微调不同尺寸的Llama-3 8b模型(SFT)(例如, ...
0 0 0 2025/03/19 arXiv:2410.09314v1 wangyadong
量化已被广泛用于压缩和加速大型语言模型(LLMS)的推断。现有的方法着重于探索po绕动态校准,以确保在4位量化下的推理加速度和模型精度。但是,在长序列的自回旋生成推断中,重复的动态量化和去除步骤的开销变得非常昂贵 ...
0 0 0 2025/03/19 arXiv:2503.07654v1 zhangxinyu

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)