In a joint vision-language space, a text feature (e.g., from "a photo of a dog") could effectively represent its relevant image features (e.
就其本质而言,医学是一个多方面的领域,需要跨各种模式的信息综合。医学生成视觉语言模型(VLM)朝这个方向迈出了第一步,并有望带来许多令人兴奋的临床应用。然而,现有模型通常必须在相当大的下游数据集上进行微调,这造成了很大的限制,因为在许多医疗应用中数据稀缺,需要能够从少数示例中实时学习的模型 ...
根据人类反馈进行强化学习 (RLHF) 是一种训练人工智能系统使其与人类目标保持一致的技术。 RLHF 已成为用于微调最先进的大型语言模型 (LLM) 的核心方法。尽管很受欢迎,但系统化其缺陷的公共工作却相对较少 ...
这项工作旨在减少大型语言模型(LLM)的端到端生成延迟。高生成延迟的主要原因之一是几乎所有最先进的 LLM 都采用顺序解码方法。在这项工作中,受人类思维和写作过程的启发,我们提出了思维骨架(SoT),它首先引导LLM生成答案的骨架,然后进行并行API调用或批量解码来完成内容每个骨架点平行 ...
深度强化学习已经为复杂任务产生了熟练的控制器。然而,这些控制器的内存有限,并且依赖于能够在每个决策点感知完整的游戏屏幕。为了解决这些缺点,本文研究了通过用循环 LSTM 替换第一个后卷积全连接层来向深度 Q 网络 (DQN) 添加循环的效果 ...
随着社交媒体的兴起,假新闻的传播已成为一个重大问题,可能会误导公众认知并影响社会稳定。尽管 CNN、RNN 等深度学习方法和 BERT 等基于 Transformer 的模型增强了假新闻检测,但它们主要关注内容,忽视了新闻传播过程中的社会背景。基于图的技术已经融入了这种社会背景,但受到对大型标记数据集的需求的限制 ...
贝叶斯优化为广泛的应用提供样本高效的全局优化,包括自动机器学习、分子化学和实验设计。我们介绍 BoTorch,一个用于贝叶斯优化的现代编程框架。在蒙特卡罗 (MC) 采集功能和自动微分的支持下,BoTorch 的模块化设计有助于灵活规范和优化 PyTorch 中编写的概率模型,从根本上简化新颖采集功能的实现 ...
大型语言模型 (LLM) 仅基于几个自然语言指令示例,就在各种自然语言任务上展示了卓越的性能,从而减少了对大量特征工程的需求。然而,大多数强大的 LLM 都是闭源的,或者其对英语以外语言的能力有限。在这份技术报告中,我们介绍了百川2,这是一系列包含70亿和130亿个参数、在2上从头开始训练的大规模多语言语言模型 ...