这项研究对使用大语言模型(LLMS)进行分析的三种方法进行了系统的比较:及时的工程,检索增强发电(RAG)和微调。使用Llama 3,我们对两个数据集的情绪分类和心理健康状况检测任务进行评估。微调达到了最高的准确性(情绪分类为91%,精神健康状况为80%),但需要大量的计算资源和大型培训集,而迅速的工程和抹布则提供了更加灵活的部署,具有中等的性能(40-68%的精度) ...
0 0 0 2025/04/01 arXiv:2503.24307v1 盛大的2
非事实提问(NFQA)构成了重大挑战,这是由于其开放性的性质,多样化的意图以及对多相关推理的需求,这使传统的Factoid QA方法(包括检索成绩(RAG))不足。与Factoid问题不同,非事实问题(NFQ)缺乏确切的答案,需要从各种推理维度的多个来源的综合信息。为了解决这些局限性,我们引入了键入rag,这是NFQA的RAG范式内的一种类型感知的多相关分解框架 ...
0 0 0 2025/04/01 arXiv:2503.15879v2 awaya
当前的销售对话分析和转换预测方法通常依赖于大型语言模型(LLM)以及基本检索增强发电(RAG)。这些系统虽然能够回答问题,但无法准确预测转化概率或实时提供战略指导。在本文中,我们介绍了Salesragent,这是一个新颖的框架,利用专门的强化学习来预测整个销售对话的转换概率 ...
0 0 0 2025/04/01 arXiv:2503.23303v1 wanghuiyong
本文解决了文本条件流动运动产生的挑战,这要求我们根据可变的历史运动和传入的文本来预测下一步的人姿势。现有的方法难以实现流动运动的产生,例如 ...
0 0 0 2025/04/01 arXiv:2503.15451v1 kate2024
随着来自2D图像的高保真3D模型的需求不断增长,由于域间隙的局限性和RGB图像中固有的歧义,现有方法仍然面临着重大繁殖细粒的几何细节的重大挑战。为了解决这些问题,我们提出了HI3DGEN,这是一个新型框架,用于通过正常桥接从图像产生高保真3D几何形状。 HI3DGEN由三个关键组成部分组成:(1)图像到正常的估计器,该估计值将低频率图像模式与噪声注入和双流训练分解,以实现可通用,稳定和尖锐的估计; ...
0 0 0 2025/04/01 arXiv:2503.22236v2 xiewende
语音综合和语音转换的快速发展带来了便利,也带来了新的安全风险,迫切需要有效的音频深击检测。尽管当前的模型表现良好,但是当面对现实世界中的多样化和不断发展的性质时,它们的有效性会降低。为了解决此问题,我们提出了一种持续学习方法,称为“基于区域的优化”(REGO),以进行音频摄影检测 ...
0 0 0 2025/04/01 arXiv:2412.11551v1 mie
本文揭开了扩散模型的草图潜力,解决了生成AI中直接草图控制的欺骗性希望。我们重要的是将过程民主化,使业余素描能够产生精确的图像,并符合“您的素描就是您得到的东西”的承诺。一项试点研究强调了必要性,揭示了现有模型中的畸形源于空间条件 ...
0 0 0 2025/04/01 arXiv:2403.07234v2 lllianghe
大型语言模型(LLM)的最新进展显着增强了他们执行复杂的推理任务的能力,从快速,直觉的思维过渡到缓慢而深层的推理(系统2)。尽管系统2推理提高了任务准确性,但由于其思维性质缓慢,效率低下或不必要的推理行为,它通常会造成大量的计算成本。相反,系统1推理在计算上是有效的,但导致了次优性能 ...
0 0 0 2025/04/01 arXiv:2503.24377v1 lishiqi01

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)