本文研究了特定领域模型微调和推理机制对由大型语言模型 (LLM) 和检索增强生成 (RAG) 驱动的问答 (Q&A) 系统性能的影响。使用 FinanceBench SEC 财务申报数据集,我们观察到,对于 RAG,将微调嵌入模型与微调 LLM 相结合可实现比通用模型更好的准确性,并且微调嵌入模型带来的收益相对较大。此外,在 RAG 之上采用推理迭代可以实现更大的性能飞跃,使问答系统更接近人类专家 ...
0 0 0 2024/05/02 arXiv:2404.11792v2 rayjue
本报告对ChatGPT用于机器翻译的功能进行了初步评估,包括翻译提示、多语言翻译和翻译鲁棒性。我们采用 ChatGPT 建议的提示来触发其翻译能力,发现候选提示总体效果良好,性能差异较小。通过对多个基准测试集进行评估,我们发现 ChatGPT 的性能与商业翻译产品(例如,翻译产品)具有竞争力 ...
0 0 0 2024/05/02 arXiv:2301.08745v4 tuiof5er
由于时间上的本质冗余和有限的计算资源,帧采样是视频动作识别中的一个基本问题。现有的采样策略通常采用固定的帧选择,缺乏处理视频中复杂变化的灵活性。在本文中,我们提出了一种简单、稀疏且可解释的帧采样器,称为运动引导采样器(MGSampler) ...
0 0 0 2024/05/02 arXiv:2104.09952v2 3220220917
少镜头动作识别面临的主要挑战是用于训练的视频数据不足。为了解决这个问题,该领域当前的方法主要集中在特征级别的算法设计,而很少关注对输入视频数据的处理。此外,现有的帧采样策略可能会忽略时间和空间维度上的关键动作信息,这进一步影响视频利用效率 ...
0 0 0 2024/05/02 arXiv:2207.09759v3 3220220917
具有解开控制因素的生成 3D 人脸模型在计算机视觉和计算机图形学的各种应用中具有巨大的潜力。然而,之前的 3D 人脸建模方法面临着挑战,因为它们需要特定的标签来有效地理清这些因素。当集成多个 3D 人脸数据集以提高模型的泛化能力时,这变得尤其成问题 ...
0 0 0 2024/05/01 arXiv:2404.16536v1 ForrestPi
几何和外观控制的全身人体图像生成是一项有趣但具有挑战性的任务。现有的解决方案要么是无条件的,要么依赖于粗略条件(例如 ...
0 0 0 2024/05/01 arXiv:2404.15889v1 ForrestPi
在网格简化中,精度、三角形质量和特征对齐等常见要求通常被视为一种权衡。现有算法仅集中于这些要求的一个或几个特定方面。例如,众所周知的二次误差度量 (QEM) 方法优先考虑准确性,并且也可以保留强特征线/点,但在确保高三角形质量方面存在不足,并且可能会降低不如强特征那么明显的弱特征 ...
0 0 0 2024/05/01 arXiv:2404.15661v1 ForrestPi
ACM 多媒体 2023 计算副语言学挑战赛首次在明确条件下的研究竞赛中解决了两个不同的问题:在情感分享子挑战赛中,必须对语音进行回归;在请求子挑战中,需要检测请求和投诉。我们描述了子挑战、基线特征提取和基于常见 ComPaRE 特征的分类器、auDeep 工具包以及使用 DeepSpectRum 工具包从预训练的 CNN 中提取深度特征;此外,还使用了wav2vec2模型.. ...
0 0 0 2024/05/01 arXiv:2304.14882v2 meral

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)