arxiv的文档

arxiv 南京

个性签名 ...

Learning to Infer Counterfactuals: Meta-Learning for Estimating Multiple Imbalanced Treatment Effects

我们定期考虑在实践中回答反事实问题，例如“糖尿病患者会选择另一种药物，会更好吗？”。观察性研究在回答此类问题的显着性上增长，因为它们的广泛积累和比随机对照试验（RCT）相对容易的获取。最近，一些作品将表示和域的适应性引入了反事实推断 ...

0 0 0 0 2025/07/03 arXiv:2208.06748v1 zhr

The Hintons in your Neural Network: a Quantum Field Theory View of Deep Learning

在这项工作中，我们为深度学习开发了一种量子场理论形式主义，其中输入信号在高斯州编码，这是对高斯过程的概括，该过程编码了代理商对输入信号的不确定性。我们将如何表示线性和非线性层作为单一量子门，并将量子模型的基本激发解释为粒子，称为``hintons''。除了打开用于研究神经网络的新观点和技术之外，量子配方非常适合光学量子计算，并提供了可以在这些设备上有效运行的神经网络的量子变形 ...

0 0 0 0 2025/07/03 arXiv:2103.04913v1 parsifalster

xbench: Tracking Agents Productivity Scaling with Profession-Aligned Real-World Evaluations

我们介绍了Xbench，这是一个动态，专业一致的评估套件，旨在弥合AI代理能力与现实世界生产率之间的差距。尽管现有的基准通常专注于孤立的技术技能，但它们可能无法准确反映代理商在专业环境中提供的经济价值。为了解决这个问题，Xbench以行业专业人员定义的评估任务为目标具有商业意义的领域 ...

0 0 0 0 2025/07/03 arXiv:2506.13651v1 Saros

Crosslingual Reasoning through Test-Time Scaling

大型语言模型的推理能力主要研究英语，即使审慎的模型是多语言的。在这项工作中，我们调查了长期以来的思考（COTS）在多大程度上进行英国推理的训练，可以跨越语言。首先，我们发现，以英语为中心的推理语言模型（RLMS）扩展推理对许多语言（包括低资源语言）的多语言数学推理进行了计算，以提高其尺寸两倍的程度 ...

0 0 0 0 2025/07/03 arXiv:2505.05408v1 wozengyi

SNR-aware Semantic Image Transmission with Deep Learning-based Channel Estimation in Fading Channels

语义通信（SC）在塑造第六代（6G）无线系统的未来方面起着核心作用，该系统利用了深度学习的快速进步（DL）。在这方面，已经采用了基于端到端的基于DL的联合源通道编码（JSCC）来实现SCS，尤其是在图像传输方面。在编码器/解码器设计中利用视觉 Transformer 已经在图像语义提取方面取得了重大进步，超过了传统的卷积神经网络（CNN） ...

0 0 0 0 2025/07/03 arXiv:2504.20557v2 wenwen

Multi-Grained Patch Training for Efficient LLM-based Recommendation

顺序推荐的大型语言模型（LLM4SR）将用户 - 项目交互转换为语言建模，已显示出令人鼓舞的结果。但是，由于上下文窗口大小的局限性以及与大语言模型（LLMS）相关的计算成本，当前方法主要通过仅考虑输入提示中最新交互的项目的文本信息来截断用户历史记录。这种截断无法完全捕获用户的长期行为模式 ...

0 0 0 0 2025/07/03 arXiv:2501.15087v2 lanxu

DivShift: Exploring Domain-Specific Distribution Shifts in Large-Scale, Volunteer-Collected Biodiversity Datasets

诸如Inaturalist这样的社区认可的自然世界图像的大规模，自愿收集的数据集已实现了使用机器学习方法对物种的细粒度视觉分类的明显性能提升。但是，这种数据（有时称为公民科学数据）是机会主义的，缺乏结构化的抽样策略。该志愿者收集的生物多样性数据包含地理，时间，分类学，观察者和社会政治偏见，这些偏见可能会对生物多样性模型的表现产生重大影响，但其影响尚不清楚，对于细粒度的物种识别性能 ...

0 0 0 0 2025/07/03 arXiv:2410.19816v5 cengjunlin22

Accelerating Flow-Matching-Based Text-to-Speech via Empirically Pruned Step Sampling

近年来，基于流量匹配的文本到语音（TTS）模型（例如语音盒，E2 TTS和F5-TTS）引起了极大的关注。这些模型需要多个采样步骤来从噪声中重建语音，从而使推理速度成为关键的挑战。减少采样步骤的数量可以大大提高推理效率 ...

0 0 0 0 2025/07/03 arXiv:2505.19931v2 13724122396

Deep Learning-based Channel Estimation for Beamspace mmWave Massive MIMO Systems

当接收器在Beamspace毫米波（MMWave）中配备有限数量的射频（RF）链时，通道估计非常具有挑战性。为了解决这个问题，我们利用了一个学识渊博的基于Denoisising的近似消息传递（LDAMP）网络。该神经网络可以从大量培训数据中学习通道结构并估算渠道 ...

0 0 0 0 2025/07/03 arXiv:1802.01290v2 wenwen

OpusLM: A Family of Open Unified Speech Language Models

本文介绍了开放的统一语言模型（OPUSLMS），这是一个开放的基础语言模型（SpeechLMS）的家族，最高为7b。从仅解码器的文本语言模型初始化，OpuSlms在213K小时的语音文本对和292B仅限文本 Token 中不断预先训练。我们证明了我们的作品在语音识别，语音综合和仅文本功能中实现现有语音的可比性（甚至是卓越）的性能 ...

0 0 0 0 2025/07/03 arXiv:2506.17611v1 Du