在本文中,我们建议通过使用预言机的奖励塑造思想将模仿和强化学习结合起来。我们研究了接近最优的成本预测预言机在规划范围内的有效性,并证明成本预测预言机根据其准确性缩短了学习者的计划范围:全局最优的预言机可以将计划范围缩短到一,导致一步贪婪马尔可夫决策过程更容易优化,而远离最优性的预言机需要在更长的范围内进行规划才能实现接近最优的性能。因此,我们的新见解弥合了模仿学习和强化学习之间的差距并进行了补充  ...
0 0 0 2024/11/07 arXiv:1805.11240v1 xuy
通过超分辨率 (SR) 深度神经网络 (DNN) 进行的神经增强为现有编码和网络基础设施上的超高清 (UHD) 直播开辟了新的可能性。然而,繁重的 SR DNN 推理开销导致了严峻的部署挑战。为了减少开销,现有系统建议仅在精心选择的锚帧上应用基于 DNN 的 SR,同时通过基于轻量级重用的 SR 方法放大非锚帧 ...
0 0 0 2024/11/07 arXiv:2408.06152v2 orientalwt
在过去的二十年中,人们令人信服地认为,回旋加速器脉泽起源的磁层无线电发射可能发生在系外行星系统中,类似于太阳行星,具有与行星轨道相同的周期性。这些发射主要发生在低频(通常低于 100 MHz,c.f.) ...
0 0 0 2024/11/07 arXiv:2311.10033v1 orientalwt
开发人员很早就认识到他们构建的系统背后的概念的重要性,以及概念在塑造用户体验方面发挥的主要作用。然而,迄今为止,概念往往只隐含在软件设计中,而开发是围绕更具体的工件(例如线框和代码模块)来组织的。 Palantir 是一家软件公司,其数据分析产品被大公司广泛使用,该公司最近重新设计了其软件开发流程的内部表示,将概念放在首位,明确了其产品背后的概念,以及它们如何集群以及如何在内部和之间使用应用程序, ...
0 0 0 2024/11/07 arXiv:2304.14975v3 orientalwt
仅使用图像级标签的弱监督语义分割(WSSS)由于其成本效益而受到广泛关注。典型的框架涉及使用图像级标签作为训练数据来生成经过细化的像素级伪标签。最近,与 CNN 方法相比,基于视觉变换器 (ViT) 的方法在生成可靠的伪标签方面表现出了卓越的能力,特别是在识别完整的对象区域方面 ...
0 0 0 2024/11/07 arXiv:2407.10649v1 hesy77
使用图像级标签的弱监督语义分割(WSSS)通常利用类激活图(CAM)来生成伪标签。受CNN局部结构感知的限制,CAM通常无法识别完整的物体区域。虽然最近的 Vision Transformer (ViT) 可以弥补这个缺陷,但我们观察到它也带来了过度平滑的问题,即最终的补丁 Token 倾向于统一 ...
0 0 0 2024/11/07 arXiv:2303.01267v1 hesy77
大语言模型 (LLM) 中的情绪智能在自然语言处理中非常重要。然而,以往的研究主要集中在基本的情感分析任务,例如情感识别,不足以评估LLM的整体情感智力。因此,本文提出了一个名为 EmotionQueen 的新颖框架来评估 LLM 的情商 ...
0 0 0 2024/11/07 arXiv:2409.13359v1 云汐瑶
大型语言模型(LLM)通过上下文学习(ICL)范式在情感分析方面取得了可喜的成果。然而,他们区分微妙情绪的能力仍然是一个挑战。受人类通过反馈调整理解的能力的启发,本文通过结合先前的预测和反馈来增强 ICL,旨在纠正 LLM 的情绪误解 ...
0 0 0 2024/11/07 arXiv:2406.02911v1 云汐瑶

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)