一译 —— 文档和论文翻译、对照阅读、讨论和社区

BC-Z: Zero-Shot Task Generalization with Robotic Imitation Learning

在本文中，我们研究了使基于视觉的机器人操纵系统推广到新任务的问题，这是机器人学习中的长期挑战。我们从模仿学习的角度应对挑战，旨在研究如何扩展和扩大所收集的数据可以促进这种概括。为此，我们开发了一个交互式和灵活的模仿学习系统，可以从演示和干预措施中学习，并可以根据不同形式的信息来传达任务，包括自然语言的预先培训的嵌入或人类执行任务的视频 ...

0 0 0 2025/02/16 arXiv:2202.02005v1 Jacky777

Counterflow of lattice polarons in harmonically confined optical lattices

我们在一维和谐波的光学晶格中研究移动杂质，并与骨浴相互作用。检查了带有超流体和莫特绝缘体域的浴缸杂质的行为，包括其对浴室的全部反作用效应。我们表征了浴Imberity相位图，并揭示了相关的逆流相的外观，我们使用该模型为移动杂质孔对的分析模型支持 ...

0 0 0 2025/02/16 arXiv:2502.09448v1 ultracold

FAN: Fourier Analysis Networks

尽管神经网络，特别是以 MLP 和 Transformer 为代表的神经网络取得了显着的成功，但我们发现它们在周期性建模和推理方面表现出潜在的缺陷，即它们倾向于记住周期性数据，而不是真正理解周期性的基本原理 ...

0 0 0 2025/02/16 arXiv:2410.02675v3 daking

Advances in Multimodal Adaptation and Generalization: From Traditional Approaches to Foundation Models

在实际情况下，实现域的适应性和泛化会带来重大挑战，因为模型必须适应或推广到未知的目标分布中。将这些功能扩展到看不见的多模式分布，即 ...

0 0 0 2025/02/16 arXiv:2501.18592v2 psyduck1

CFFormer: Cross CNN-Transformer Channel Attention and Spatial Feature Fusion for Improved Segmentation of Low Quality Medical Images

混合CNN转换器模型旨在结合卷积神经网络（CNN）和 Transformer 的优势，以有效地对局部信息和远程依赖性进行建模。但是，大多数研究倾向于集中于整合CNN和 Transformer 的空间特征，同时忽略了频道特征的关键重要性。这对于低质量医学图像分割中的模型性能尤为重要 ...

0 0 0 2025/02/16 arXiv:2501.03629v1 Roa

Versatile Diffusion: Text, Images and Variations All in One Diffusion Model

扩散模型的最新进展在许多一代任务中树立了令人印象深刻的里程碑，而诸如DALL-E2，Imagen和稳定扩散之类的流行作品引起了极大的兴趣。尽管景观发生了迅速的变化，但最近的新方法集中在扩展和性能而不是容量上，因此需要单独的模型来进行单独的任务。在这项工作中，我们将现有的单流扩散管道扩展到多任务多模式网络，称为多功能扩散（VD），该网络处理了一个统一的文本到图像，图像到文本的多个流量，并在一个统一的 ...

0 0 0 2025/02/16 arXiv:2211.08332v4 zxiang7996

Multimodal Representation Learning by Alternating Unimodal Adaptation

多模式学习整合了来自不同感官模式的数据，在人工智能中起着关键作用。但是，现有的多模式学习方法通常在挑战中遇到困难，在这种挑战中，某些方式在多模式学习过程中比其他方式更为主导，从而导致次优的性能。为了应对这一挑战，我们提出了MLA（多模式学习，并进行了交替的单形化适应） ...

0 0 0 2025/02/16 arXiv:2311.10707v2 liushibo

Unsupervised Graph Neural Architecture Search with Disentangled Self-supervision

现有的图形神经体系结构搜索（GNAS）方法在搜索过程中严重依赖有监督的标签，无法处理无用的无用场景。在本文中，我们研究了无监督的图神经架构搜索的问题，该搜索在文献中仍未探索。关键问题是发现驱动图形数据形成以及因子与最佳神经体系结构之间的潜在关系的潜在图因子 ...

0 0 0 2025/02/16 arXiv:2403.05064v1 CG_Z

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）