我们检验了以下假设:如果指示这样做的话,可以从人类反馈(RLHF)中训练从人类反馈(RLHF)学习的语言模型具有“道德自我校正”的能力 - 避免产生有害的产出。我们发现有力的证据支持在三个不同的实验中支持这一假设,每个实验都揭示了道德自我纠正的不同方面。我们发现,道德自我纠正的能力在22B模型参数下出现,通常会随着模型大小和RLHF训练的增加而提高 ...
0 0 0 2025/09/16 arXiv:2302.07459v2 Yieww
本文介绍了AIDETX,这是一种使用数据压缩技术检测机器生成的文本的新方法。传统方法(例如深度学习分类器)通常会遭受高计算成本和有限的解释性损失。为了解决这些限制,我们提出了一个基于压缩的分类框架,该框架利用有限的文本模型(FCMS) ...
0 0 0 2025/09/16 arXiv:2411.19869v1 15966829631
长时间的视频时间基础(LVTG)旨在根据用户提供的文本查询来识别冗长视频中的特定时刻,以进行有效的内容检索。现有方法将视频分为剪辑和通过全尺度专家编码器处理每个剪辑的方法采取的方法是挑战,这是由于在长视频中处理大量剪辑的计算成本而导致的规模。为了解决这个问题,我们介绍了Decafnet,这是一种采用``委托和纠纷''策略来达到计算效率而无需牺牲接地绩效的方法 ...
0 0 0 2025/09/16 arXiv:2505.16376v1 argbunint256
随着开放式文本生成的重大进展,衡量机器生成的文本与人类语言的距离仍然是一个关键的开放问题。我们介绍了淡紫色,这是开放式文本生成的比较度量,该措施将从文本生成模型与使用Divergence Frontiers的人撰写文本的分布进行了比较。淡紫色通过计算量化嵌入空间中的信息差异来扩展到现代文本生成模型 ...
0 0 0 2025/09/16 arXiv:2102.01454v3 15966829631
使用结构化状态空间序列(S4)层的模型已经在远程序列建模任务上实现了最先进的性能。 S4层结合了线性状态空间模型(SSM),河马框架和深度学习,以实现高性能。我们以S4层的设计为基础,并引入了新的状态空间层S5层 ...
0 0 0 2025/09/16 arXiv:2208.04933v3 千禧狸花
生成视频有可能通过自主创建新内容来彻底改变游戏开发。在本文中,我们介绍了GameFactory,这是一个由动作控制的场景范围的框架。我们首先通过引入GF-Minecraft(一个没有人类偏见的动作宣布的游戏视频数据集)来解决动作可控性的基本挑战,并开发了一个动作控制模块,该模块可以对键盘和鼠标输入进行精确的控制 ...
0 0 0 2025/09/16 arXiv:2501.08325v3 xiewende
Dimage Dehazing是一项至关重要的任务,涉及增强图像以恢复其清晰度和纹理的增强。虽然视觉 Transformer 在多种飞行任务中表现出了令人印象深刻的结果,但它们的二次复杂性和缺乏飞去的先验对现实世界应用却带来了重大的缺点。在本文中,在三重先验,明亮的通道先验(BCP),Dark Channel Prior(DCP)和直方图均衡(HE)的指导下,我们提出了A \ TextIt {p} ...
0 0 0 2025/09/16 arXiv:2503.01136v1 Roa
多芯片整合被广泛认为是摩尔定律的扩展。节省成本是经常提到的优势,但以前的作品很少出现关于多芯片整合比单片SOC的成本优势的定量演示。在本文中,我们建立了一个定量成本模型,并根据三种典型的多芯片集成技术提出了一种分析方法,以分析提高产量,chiplet和套件重复使用以及异质性的成本收益 ...
0 0 0 2025/09/16 arXiv:2203.12268v4 wangjun

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)