多标签分类对于全面的图像理解至关重要,但是获取准确的注释具有挑战性且昂贵。为了解决这个问题,最近的一项研究表明,利用无监督的多标签分类利用夹子,这是一个强大的视觉语言模型。尽管剪辑的熟练程度,它仍遭受了依赖视图的预测和固有的偏见,从而限制了其有效性 ...
0 0 0 2025/07/15 arXiv:2503.16873v1 13843225286
复杂的表问题回答(TQA)旨在回答需要复杂推理的问题,例如多步或多类别推理,而不是表格形式表示的数据。以前的方法通过利用封闭式源说明大语模型(LLM)或微调的开放式LLM来表现出显着的性能。但是,微调LLM需要高质量的培训数据,这是昂贵的,并利用封闭源LLMS构成可访问性挑战,并导致可重复性问题 ...
0 0 0 2025/07/15 arXiv:2412.20145v2 12321
在高能粒子物理学的背景下,展开是指消除实验数据中检测器畸变的过程。所得的展开测量值直接用于实验和各种理论预测之间的直接比较。几十年来,流行的展开策略旨在以一个或多个BINNED直方图格式进行操作 ...
0 0 0 2025/07/15 arXiv:2507.09582v1 abcde
与密集模型相比,专家混合(MOE)语言模型可以将计算成本降低2-4$ \ times $,而不会牺牲性能 ...
0 0 0 2025/07/15 arXiv:2404.05567v1 huwenxing
基于密集的嵌入文本检索$ \ unicode {x2013} $通过深度学习编码从语料库中检索$ \ unicode {x2013} $已成为一种有力的方法,即获得最先进的搜索结果并普及使用增强生成(RAG)。尽管如此,与其他搜索方法一样,基于嵌入的检索可能会受到搜索引擎优化(SEO)攻击的影响,在这种攻击中,对手通过向Corpora引入对抗性段落来促进恶意内容。为了忠实地评估并洞悉此类系统对SE ...
0 0 2 2025/07/15 arXiv:2412.20953v1 0x211
我们介绍了行动链(COA),这是一种基于轨迹自回旋建模建立的新型视觉运动策略范式。与传统的方法预测下一步动作的传统方法不同,COA通过通过动作级别的思想链(COT)过程明确地向后推理来生成整个轨迹。该过程在单个自回归结构中统一:(1)第一个 Token 对应于编码特定于任务目标的稳定的密钥帧动作; (2)随后的操作 Token 是根据初始密钥框架和先前预测的操作生成自动进程的 ...
0 0 0 2025/07/15 arXiv:2506.09990v1 xiewende
自动疾病诊断在临床实践中越来越有价值。大型语言模型(LLM)的出现催化了人工智能的范式转变,越来越多的证据支持LLMS在诊断任务中的疗效。尽管该领域的关注越来越多,但仍然缺乏整体观点 ...
0 0 0 2025/07/15 arXiv:2409.00097v3 NoelYin
对社会出现的研究长期以来一直是社会科学的核心重点。传统的建模方法,例如基于规则的代理模型(ABM),难以捕获人类行为的多样性和复杂性,尤其是行为经济学强调的非理性因素。最近,大型语言模型(LLM)代理人已获得吸引人的仿真工具,用于建模社会科学和角色扮演应用中的人类行为 ...
0 0 0 2025/07/15 arXiv:2502.01506v4 651106682

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)