大型语言模型 (LLM) 已被证明会产生非法或不道德的响应,特别是在“越狱”时。对越狱的研究凸显了 LLM 的安全问题。然而,先前的研究主要集中在单轮对话,忽略了多轮对话所带来的潜在复杂性和风险,而多轮对话是人类从 LLM 中获取信息的关键模式 ...
通过从增强视图中合并自我监督的信号,对比度学习已在培训顺序推荐模型中有效。大多数现有方法通过随机数据增强从相同的交互序列产生多个视图,旨在使其在嵌入空间中的表示形式对齐。但是,用户通常在购买商品时具有特定意图(e ...
在推理时间下以低精度操作运行的深网提供了与高精度替代方案相比的功率和空间优势,但需要克服随着精确度降低而保持高精度的挑战。在这里,我们提出了一种训练此类网络,学习的步长量化的方法,该方法在使用模型,来自各种体系结构,重量和激活量化为2、3或4位精确度的精确度时,可以在Imagenet数据集上达到最高的精度,并且可以训练3位模型,以达到完整的精确基线精度。我们的方法建立在量化网络中学习权重的现有方法 ...
随着大型语言模型(LLMS)发展越来越复杂的能力并在医疗环境中找到应用,由于其对个人和公共健康,患者安全和人权的影响深远,评估其医疗安全变得重要。但是,在LLM的背景下,对医疗安全的概念几乎没有理解,更不用说如何评估和改进了。为了解决这一差距,我们首先根据美国医学协会规定的医学伦理学原理来定义LLMS中医疗安全的概念 ...
大型语言模型(LLMS)表现出强大的推理能力,尤其是通过增强学习(RL)增强时。虽然先前的工作已成功地将RL应用于数学推理(规则和正确性是明确定义的),将这些方法推广到更广泛的推理领域,由于数据有限,缺乏可验证的奖励结构以及各种任务要求,因此仍然具有挑战性。在这项工作中,我们提出了Nemotron-Crossthink,该框架系统地结合了多域中的Corpora,包括综合和现实的问题 - 答案对,以 ...
信息检索已从独立系统转变为跨更广泛应用的基本组件,索引效率,成本效益和新鲜度变得越来越关键,但经常被忽视。在本文中,我们引入了半参数散开检索(SIDR),这是一种双重编码器检索框架,将从神经参数取回检索指数以实现有效的,低成本和参数 - 不可能的索引,以实现出现的用例。具体而言,除了将嵌入式用作现有神经检索方法之类的索引外,SIDR还支持非参数 Token 化指数用于搜索,从而达到了BM25样索引 ...
我们提出了Kimi-Audio,这是一种开源音频基础模型,在音频理解,发电和对话方面表现出色。我们详细介绍了建立Kimi-Audio的实践,包括模型架构,数据策展,培训配方,推理部署和评估。具体来说,我们利用12 ...
扩散模型已经达到了显着的视觉产生质量。但是,他们在资源受限的移动设备甚至台式机GPU上的应用程序的应用构成了巨大的计算和内存构成挑战。最近的几步扩散模型通过减少降解步骤来减少推理时间 ...