arxiv的文档

arxiv 南京

个性签名 ...

USP: Unified Self-Supervised Pretraining for Image Generation and Understanding

最近的研究强调了扩散模型与表示学习之间的相互作用。可以利用来自扩散模型的中间表示，用于下游视觉任务，而自我监视的视觉模型可以增强扩散模型的收敛性和生成质量。但是，由于输入不匹配和使用潜在空间，从视觉模型转移到视觉模型到扩散模型的转移重点是具有挑战性的 ...

0 0 0 0 2025/07/03 arXiv:2503.06132v2 18811558339

Where Paths Collide: A Comprehensive Survey of Classic and Learning-Based Multi-Agent Pathfinding

多代理路径查找（MAPF）是人工智能和机器人技术中的一个基本问题，需要计算从启动位置到指定目标导航的多个代理的无碰撞路径。随着自主系统在仓库，城市运输和其他复杂环境中变得越来越普遍，MAPF已从理论挑战发展为现实世界多机器人协调的关键推动者。这项全面的调查桥接了经典算法方法与MAPF研究中基于学习的方法之间的长期鸿沟 ...

0 0 0 0 2025/07/03 arXiv:2505.19219v1 yuhan

CNN based Channel Estimation using NOMA for mmWave Massive MIMO System

正在积极探索非正交的多重访问（NOMA）方案，以应对第五代（5G）无线通信的一些主要挑战。在NOMA方案与毫米波（MMWave）大量多输入多输出（MIMO）系统集成的情况下，通道估计是极具挑战性的。对通道的准确估计对于利用二人组合和mmwave配对的好处至关重要 ...

0 0 0 0 2025/07/03 arXiv:2108.00367v1 wenwen

Distributed Mixture-of-Agents for Edge Inference with Large Language Models

最近提出了代理（MOA）的混合物（MOA），以增强大语模型（LLM）的性能，使多个单独的LLMS可以共同努力以进行协作推断。与依靠单个LLM相比，这种协作方法可以改善对用户提示的响应。在本文中，我们在分布式设置中考虑了这样的MOA体系结构，其中LLMS在单个边缘设备上运行，每个设备都与用户唯一关联并配备了自己的分布式计算能力 ...

0 0 0 0 2025/07/03 arXiv:2412.21200v1 astonishe

Learning to Infer Counterfactuals: Meta-Learning for Estimating Multiple Imbalanced Treatment Effects

我们定期考虑在实践中回答反事实问题，例如“糖尿病患者会选择另一种药物，会更好吗？”。观察性研究在回答此类问题的显着性上增长，因为它们的广泛积累和比随机对照试验（RCT）相对容易的获取。最近，一些作品将表示和域的适应性引入了反事实推断 ...

0 0 0 0 2025/07/03 arXiv:2208.06748v1 zhr

The Hintons in your Neural Network: a Quantum Field Theory View of Deep Learning

在这项工作中，我们为深度学习开发了一种量子场理论形式主义，其中输入信号在高斯州编码，这是对高斯过程的概括，该过程编码了代理商对输入信号的不确定性。我们将如何表示线性和非线性层作为单一量子门，并将量子模型的基本激发解释为粒子，称为``hintons''。除了打开用于研究神经网络的新观点和技术之外，量子配方非常适合光学量子计算，并提供了可以在这些设备上有效运行的神经网络的量子变形 ...

0 0 0 0 2025/07/03 arXiv:2103.04913v1 parsifalster

xbench: Tracking Agents Productivity Scaling with Profession-Aligned Real-World Evaluations

我们介绍了Xbench，这是一个动态，专业一致的评估套件，旨在弥合AI代理能力与现实世界生产率之间的差距。尽管现有的基准通常专注于孤立的技术技能，但它们可能无法准确反映代理商在专业环境中提供的经济价值。为了解决这个问题，Xbench以行业专业人员定义的评估任务为目标具有商业意义的领域 ...

0 0 0 0 2025/07/03 arXiv:2506.13651v1 Saros

Crosslingual Reasoning through Test-Time Scaling

大型语言模型的推理能力主要研究英语，即使审慎的模型是多语言的。在这项工作中，我们调查了长期以来的思考（COTS）在多大程度上进行英国推理的训练，可以跨越语言。首先，我们发现，以英语为中心的推理语言模型（RLMS）扩展推理对许多语言（包括低资源语言）的多语言数学推理进行了计算，以提高其尺寸两倍的程度 ...

0 0 0 0 2025/07/03 arXiv:2505.05408v1 wozengyi

SNR-aware Semantic Image Transmission with Deep Learning-based Channel Estimation in Fading Channels

语义通信（SC）在塑造第六代（6G）无线系统的未来方面起着核心作用，该系统利用了深度学习的快速进步（DL）。在这方面，已经采用了基于端到端的基于DL的联合源通道编码（JSCC）来实现SCS，尤其是在图像传输方面。在编码器/解码器设计中利用视觉 Transformer 已经在图像语义提取方面取得了重大进步，超过了传统的卷积神经网络（CNN） ...

0 0 0 0 2025/07/03 arXiv:2504.20557v2 wenwen

Multi-Grained Patch Training for Efficient LLM-based Recommendation

顺序推荐的大型语言模型（LLM4SR）将用户 - 项目交互转换为语言建模，已显示出令人鼓舞的结果。但是，由于上下文窗口大小的局限性以及与大语言模型（LLMS）相关的计算成本，当前方法主要通过仅考虑输入提示中最新交互的项目的文本信息来截断用户历史记录。这种截断无法完全捕获用户的长期行为模式 ...

0 0 0 0 2025/07/03 arXiv:2501.15087v2 lanxu