arxiv的文档

arxiv 南京

个性签名 ...

HV-BEV: Decoupling Horizontal and Vertical Feature Sampling for Multi-View 3D Object Detection

在自主驾驶技术，尤其是基于BEV的模型中，基于视觉的多视图环境感知系统的应用已越来越多地认可。当前的最新解决方案主要通过显式或隐式深度预测从每个相机视图中对BEV空间进行编码图像特征。但是，这些方法经常忽略3D空间中对象不同部分之间的结构化相关性，而不同类别的对象通常占据不同的局部高度范围 ...

0 0 0 0 2025/08/26 arXiv:2412.18884v3 xubiao

GraLoRA: Granular Low-Rank Adaptation for Parameter-Efficient Fine-Tuning

低级适应性（LORA）是一种流行的生成模型参数效率微调（PEFT）的方法，以其简单性和有效性而重视。尽管最近有所提高，但洛拉仍然受到基本限制：扩大瓶颈时过度适应。它的表现最好以32-64的排名，但其准确性停滞不前或下降较高，但仍未达到完整的微调（FFT）表现 ...

0 0 0 0 2025/08/26 arXiv:2505.20355v1 15966829631

learning discriminative features from spectrograms using center loss for speech emotion recognition

从语音中识别情绪状态对于机器与扬声器的自然相互作用至关重要。但是，由于情绪是模棱两可的，因此很难为情感识别提取有效的特征。我们提出了一种新的方法，可以从可变长度谱图中学习判别特征，从而通过将软磁性跨透镜丢失和中心损失协作，以识别情绪识别 ...

0 0 0 0 2025/08/26 arXiv:2501.01103v1 sja

MoR: Mixture of Ranks for Low-Rank Adaptation Tuning

低级适应（LORA）推动了研究，以使其性能与完整的微调保持一致。但是，仍然存在重大挑战：（1）简单地增加洛拉的等级规模并不能有效地捕获高级信息，从而导致性能瓶颈。（2）Moe式的Lora方法实质上增加了参数和推论潜伏期，与有效的微调和应用程序的应用相反 ...

0 0 0 0 2025/08/26 arXiv:2410.13408v2 15966829631

LIQUID: A Framework for List Question Answering Dataset Generation

问答（QA）模型通常依赖于大规模培训数据集，这需要开发数据生成框架以降低手动注释的成本。尽管最近的一些研究旨在通过单跨答案产生合成问题，但尚未对以多个无连续跨度作为答案的列表问题进行研究。为了解决此差距，我们提出了Liquid，这是一个自动化框架，用于从未标记的Corpora生成QA数据集 ...

0 0 0 0 2025/08/26 arXiv:2302.01691v2 zjwbr

Concise Reasoning, Big Gains: Pruning Long Reasoning Trace with Difficulty-Aware Prompting

现有的思考链（COT）蒸馏方法可以有效地将推理能力传递给基本模型，但遭受了两个主要局限性：推理轨迹的过度详细性和对问题难度的适应性不足。长期的推理痕迹大大提高推理成本，统一的解决方案阻止基本模型学习适应性推理策略。为了解决这些问题，我们提出了一种困难的提示（DAP）方法，以动态缩短推理痕迹而不会丢失绩效 ...

0 0 0 0 2025/08/26 arXiv:2505.19716v1 manlinghun

LoRA Dropout as a Sparsity Regularizer for Overfitting Control

由洛拉（Lora）代表的参数有效的微调方法在调整大规模的预训练模型中对下游任务起着至关重要的作用。但是，微调的洛拉系列模型也面临着在培训数据集上过度拟合的风险，但是仍然缺乏控制过度适合基于洛拉的PEFT方法的理论指导和实用机制。在本文中，我们通过将随机噪声引入可学习的低级矩阵并增加参数稀疏性，为基于洛拉的方法提出了洛拉辍学机制 ...

0 0 0 0 2025/08/26 arXiv:2404.09610v1 15966829631

Leptogenesis

瘦素发生是一类场景，其中宇宙的重子不对称是由沉重的无菌中微子衰变产生的轻子不对称的。我们解释了诱导生成的动机。我们回顾基本机制，并描述模型的子类 ...

0 0 0 0 2025/08/26 arXiv:0802.2962v3 Jerrymoe

The Benefits of a Concise Chain of Thought on Problem-Solving in Large Language Models

在本文中，我们介绍了简洁的思想链（CCOT）提示。我们比较了标准的COT和CCOT提示，以查看简洁性如何影响响应长度和正确答案的准确性。我们使用GPT-3对此进行了评估 ...

0 0 0 0 2025/08/26 arXiv:2401.05618v3 manlinghun

PROEMO: Prompt-Driven Text-to-Speech Synthesis Based on Emotion and Intensity Control

语音综合已从统计方法显着发展到深度神经网络体系结构，从而导致各种文本到语音（TTS）模型紧密模仿人类的语音模式。但是，捕捉诸如语音综合中情感和风格之类的细微差别是具有挑战性的。为了应对这一挑战，我们引入了一种以迅速的情感控制为中心的方法 ...

0 0 0 0 2025/08/26 arXiv:2501.06276v1 sja