arxiv的文档

arxiv 南京

个性签名 ...

Data Whisperer: Efficient Data Selection for Task-Specific LLM Fine-Tuning via Few-Shot In-Context Learning

对特定于任务数据的微调大语言模型（LLM）对于其有效部署至关重要。随着数据集尺寸的增长，有效选择用于培训的最佳子集对于平衡性能和计算成本至关重要。传统的数据选择方法通常需要在目标数据集上进行微调计分模型，该数据集是耗时且资源密集的，或者依靠无法完全利用该模型的预测能力的启发式方法 ...

0 0 0 0 2025/07/03 arXiv:2505.12212v3 DrowXG

Reason-to-Recommend: Using Interaction-of-Thought Reasoning to Enhance LLM Recommendation

在大型语言模型（LLM）的进步驱动下，由于其强烈的语义理解和迅速的灵活性，将其整合到推荐任务中引起了兴趣。先前的工作将用户项目交互或元数据编码为提示。同时，通过测试时间缩放和增强学习来提高的LLM推理在数学和代码等领域中表现出色，在数学和代码等领域，推理轨迹和正确性信号很明确，可以高性能和可解释性 ...

0 0 0 0 2025/07/03 arXiv:2506.05069v2 Ahmoon

Programming by Backprop: LLMs Acquire Reusable Algorithmic Abstractions During Code Training

对源代码的培训大语言模型（LLM）显着增强了其通用推理能力，但是对此概括的机制知之甚少。在本文中，我们建议BackProp（PBB）作为这种效果的潜在驱动力 - 教授模型来评估程序以通过单独培训其源代码来评估输入的程序，而没有看到I/O示例。为了探讨这个想法，我们在代表简单数学问题和算法的两组程序上进行了Finetune LLM：一个带有源代码和I/O示例（W/IO）的程序，另一个仅带有源代码（w/o io） ...

0 0 0 0 2025/07/03 arXiv:2506.18777v1 leec

Retro: Learning Retrosynthetic Planning with Neural Guided A Search

循环合成计划是有机化学中的一项关键任务，它识别一系列可以导致目标产物合成的反应。大量可能的化学转化使搜索空间的大小变得很大，即使对于经验丰富的化学家来说，逆合合成计划也有挑战性。但是，现有方法要么需要通过较高的差异来进行昂贵的回报估算，要么以搜索速度而不是质量来优化 ...

0 0 0 0 2025/07/03 arXiv:2006.15820v1 DoubleSails

An End-to-End Framework for Marketing Effectiveness Optimization under Budget Constraint

在线平台通常会激励消费者改善用户参与度和平台收入。由于不同的消费者可能对激励措施做出不同的反应，因此个人级预算分配是营销活动中的重要任务。该领域的最新进展通常使用两阶段范式解决预算分配问题：第一阶段使用因果推理算法估算了个体级别的治疗效果，第二阶段的第二阶段会调用整数编程技术以找到最佳的预算分配解决方案 ...

0 1 0 0 2025/07/03 arXiv:2302.04477v1 17695951725

CIC-BART-SSA: Controllable Image Captioning with Structured Semantic Augmentation

可控的图像字幕（CIC）旨在为图像生成自然语言描述，并根据最终用户提供的信息，例如区域，实体或感兴趣的事件 ...

0 0 0 0 2025/07/03 arXiv:2407.11393v2 hannibalyfy

Direct Heterogeneous Causal Learning for Resource Allocation Problems in Marketing

营销是增加用户参与并提高平台收入的重要机制，而异质因果学习可以帮助制定更有效的策略。营销中的大多数决策问题都可以作为资源分配问题提出，并且已经研究了数十年。现有作品通常将解决方案过程分为两个完全解耦的阶段i ...

0 2 0 0 2025/07/03 arXiv:2211.15728v2 17695951725

USP: Unified Self-Supervised Pretraining for Image Generation and Understanding

最近的研究强调了扩散模型与表示学习之间的相互作用。可以利用来自扩散模型的中间表示，用于下游视觉任务，而自我监视的视觉模型可以增强扩散模型的收敛性和生成质量。但是，由于输入不匹配和使用潜在空间，从视觉模型转移到视觉模型到扩散模型的转移重点是具有挑战性的 ...

0 0 0 0 2025/07/03 arXiv:2503.06132v2 18811558339

Where Paths Collide: A Comprehensive Survey of Classic and Learning-Based Multi-Agent Pathfinding

多代理路径查找（MAPF）是人工智能和机器人技术中的一个基本问题，需要计算从启动位置到指定目标导航的多个代理的无碰撞路径。随着自主系统在仓库，城市运输和其他复杂环境中变得越来越普遍，MAPF已从理论挑战发展为现实世界多机器人协调的关键推动者。这项全面的调查桥接了经典算法方法与MAPF研究中基于学习的方法之间的长期鸿沟 ...

0 0 0 0 2025/07/03 arXiv:2505.19219v1 yuhan

CNN based Channel Estimation using NOMA for mmWave Massive MIMO System

正在积极探索非正交的多重访问（NOMA）方案，以应对第五代（5G）无线通信的一些主要挑战。在NOMA方案与毫米波（MMWave）大量多输入多输出（MIMO）系统集成的情况下，通道估计是极具挑战性的。对通道的准确估计对于利用二人组合和mmwave配对的好处至关重要 ...

0 0 0 0 2025/07/03 arXiv:2108.00367v1 wenwen