文本图的丰富文本和拓扑信息需要在现实世界中的应用程序,例如网页,电子商务和学术文章中进行建模。从业人员很久以来,采用了浅文本编码器和随后的图形神经网络(GNN)来解决此问题。鉴于大语言模型(LLMS)的最新进展,很明显,集成以增强文本编码的LLM可以大大改善文本图的性能 ...
水分配网络(WDN)是重要的基础设施,污染构成了严重的公共卫生风险。有害物质可以与氯之类的消毒剂相互作用,从而使氯监测对于检测污染物必不可少。但是,氯传感器通常变得不可靠,需要频繁校准 ...
我们提出MAATS,这是一种多维自动化翻译系统,利用多维质量指标(MQM)框架作为用于错误检测和改进的细粒信号。 MAATS采用多种专业的AI代理,每种代理都集中在不同的MQM类别上(例如, ...
我们介绍了梯子(通过自主难度驱动的示例递归学习),这是一个框架,使LLMS能够通过自我引导的学习自主提高其解决问题的能力。通过递归生成和解决复杂问题的更简单变体,梯子使模型能够通过强化学习如何解决更严重的问题来逐步学习。这种自我改进过程以可验证的奖励信号为指导,从而使模型可以评估其解决方案 ...
我们提出了一种简单但有效的基于扩散的方法,用于对图像中光源进行细粒度的参数控制。现有的重新考虑方法要么依赖于多个输入视图来在推理时执行反相反渲染,要么无法对光更改提供明确的控制。我们的方法微调在一小部分真实的原始照片对上进行了扩散模型,并以合成的渲染图像进行了大规模补充,以引起其光真逼真的先验 ...
机车操作计划技能是扩大日常环境中机器人效用的关键。这些技能可以根据系统在解决不同任务时协调复杂的整体运动和多个接触互动的能力进行评估。但是,现有的方法仅能通过手工制作的状态机器,密集工程的奖励或预先录制的专家演示来塑造此类行为 ...
小病变在早期疾病诊断和严重感染的干预中起着至关重要的作用。流行的模型通常在细分小病变时面临挑战,因为它仅占据图像的一小部分,而下降\ _Sampling操作可能不可避免地会失去关注小病变的本地特征。要应对挑战,我们提出了一个{\ bf s}购物中心 - {\ bf s} ize- {\ bf s} endistive {\ bf mamba}({\ bf s $^3 $ -mamba}),从而促 ...
我们提出了一个基于学习的系统,以使四足动物的机器人使用其整个身体来操纵大型重物。我们的系统基于一种层次控制策略,该策略使用了深层可变变量嵌入,该变量嵌入,该嵌入从相互作用,本体感受和动作历史记录中捕获与操纵相关的信息,从而使机器人可以隐式地理解对象属性。我们在模拟和现实世界中都评估了我们的框架 ...