我们为无监督的3D医学图像注册提供了双流金字塔注册网络(称为双PRNET)。与最近的基于CNN的注册方法(例如VoxelMorph)不同,它探索了一个单流编码器 - 模块网络,以从一对3D卷中计算一个注册字段,我们设计了一个能够计算多个卷积特征特征Pyramids的多规模注册场的两流体系结构。我们的贡献是两倍:(i)我们设计了一个两流3D编码器 - 码头网络,该网络分别计算两个卷积特征金字塔的输入 ...
0 0 0 2025/03/04 arXiv:1909.11966v2 zfk666
我们研究自我奖励推理大语言模型(LLMS),它们可以同时生成逐步推理并评估其在推理时间与外部反馈期间其产出的正确性。这种集成的方法允许单个模型独立指导其推理过程,从而为模型部署提供了计算优势。我们特别关注自我纠正的代表性任务,在该任务中,模型自主检测其响应中的错误,修改输出并决定何时终止迭代改进循环 ...
0 0 0 2025/03/04 arXiv:2502.19613v1 leec
二进制决策任务,例如不是问问题或回答验证,它反映了一个重要的现实情况,例如用户在其中寻求有关其在特定问题上决策的正确性的地方。在这项工作中,我们观察到语言模型在复杂的推理任务的二进制决策中表现出负面偏见。基于我们的观察结果和对基于注意力的模型动力学的理由,我们提出了负面注意力评分(NAS),以系统和定量表达负偏差 ...
0 0 0 2025/03/04 arXiv:2408.00137v1 leec
尽管大型语言模型(LLM)代理可以有效地使用外部工具来进行复杂的现实世界任务,但它们需要内存系统来利用历史体验。当前的内存系统启用基本存储和检索,但尽管最近尝试合并图形数据库,但仍缺乏复杂的内存组织。此外,这些系统的固定操作和结构限制了它们在各种任务中的适应性 ...
0 0 0 2025/03/04 arXiv:2502.12110v2 leec
长期以来,交互式医学图像分割(IMI)一直受到大规模,多样和密集注释的数据集的有限限制,这阻碍了模型的概括和跨不同模型的一致评估。在本文中,我们介绍了IMED-361M基准数据集,这是IMIS一般研究的重大进步。首先,我们收集和标准化超过6 ...
0 0 0 2025/03/04 arXiv:2411.12814v2 mixiu
大型语言模型(LLMS)在通过诸如Thebough(COT)提示之类的机制来解决复杂的推理任务方面表现出了显着的性能,该机制强调了详细的,逐步的推理。但是,人类通常采用更有效的策略:起草简洁的中间思想,只捕获基本信息。在这项工作中,我们提出了草稿链(COD),这是一种受人类认知过程启发的新型范式,在该过程中,LLMS在解决任务时会产生简约但内容丰富的中间推理输出 ...
0 0 0 2025/03/04 arXiv:2502.18600v2 sealaes
在本文中,Controlvae,这是一种基于模型的新颖框架,用于学习基于变分自动编码器( vae),的生成运动控制策略。我们的框架可以从一组不同的无组织运动序列中学习丰富而灵活的潜在技能表示和技能条件生成控制策略,这使得可以通过在潜在空间中采样来生成现实的人类行为 ...
0 0 0 2025/03/04 arXiv:2210.06063v1 parsifalster
神经辐射场(NERFS)在呈现静态场景中表现出色。但是,由于数据存储和计算约束,无处不在的设备上的动态,长时间的辐射场仍然具有挑战性。在本文中,我们介绍了Videorf,这是在移动平台上实现实时流和渲染的第一种方法 ...
0 0 0 2025/03/04 arXiv:2312.01407v1 orangelcx

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)