在这份白皮书中,我们提出了Alphaevolve,这是一种进化编码剂,可大大提高最先进的LLM在高度挑战的任务上,例如解决开放科学问题或优化关键的计算基础架构。 Alphaevolve策划了LLMS的自主管道,其任务是通过直接更改代码来改善算法。使用一种进化方法,不断收到一个或多个评估者的反馈,alphaevolve迭代地改善了算法,可能导致新的科学和实用发现 ...
数据增强已成为一种有前途的方法,可以在顺序建议中减轻数据稀疏性。现有方法在模型培训期间生成了新的有效的数据以提高性能。但是,部署它们需要重新训练,修改或引入其他可学习的参数 ...
大型语言模型(LLM)在理解和生成人类语言方面表现出了重要的能力,这有助于与复杂系统更自然的互动。 However, they face challenges such as ambiguity in user requests processed by LLMs.为了应对这些挑战,本文介绍并评估了一个多代理辩论框架,旨在增强单个模型以外的检测和分辨率 ...
视觉导航(VLN)的最新进展主要归因于新兴的大语模型(LLMS)。这些方法在教学理解和任务推理方面表现出极好的概括能力。但是,它们受到LLM的固定知识库和推理能力的限制,以防止完全融入体验知识,从而导致缺乏有效的进化能力 ...
大语言模型(LLM)的性能从根本上取决于推论过程中提供的上下文信息。这项调查介绍了上下文工程,这是一种正式的学科,超越了简单的提示设计,以涵盖LLMS信息有效负载的系统优化。我们向其基础组件和将它们集成到智能系统中的复杂实现中,将上下文工程分解为全面的分类学 ...
最近已经提出了强大的蛋白质配体结构的生成AI模型,但是这些方法中很少有人支持柔性蛋白质 - 配体对接和亲和力估计。在这样做的那些人中,没有人可以直接对多种结合配体进行同时建模,也可以在药理学相关的药物靶标上进行严格的基准测试,从而阻碍了它们在药物发现工作中的广泛采用。在这项工作中,我们提出了Flowdock,这是基于条件流量匹配的第一个深几何生成模型,该模型学会了将任意数量的结合配体数量直接映射到 ...
尽管近年来人们对时间序列的预测越来越关注,但许多研究提出了各种解决方案,以应对时间序列预测中遇到的挑战,旨在改善预测性能。但是,将这些时间序列预测模型有效地应用于金融资产定价领域仍然是一个艰巨的问题。仍然需要桥梁将尖端时间序列的预测模型与金融资产定价联系起来 ...
知识追踪(KT)最近是计算教学法的积极研究领域。任务是根据他们过去对问题的回答来对学生的掌握知识概念的掌握水平进行建模,并预测他们将来正确回答后续问题的概率。历史上使用统计建模方法(例如贝叶斯推理和因素分析)解决了KT任务,但是深度学习的最新进展导致了连续的建议,这些建议利用了深层的神经网络,包括长期短期记忆网络,记忆启动的网络和自我意见网络 ...