arxiv的文档

arxiv 南京

个性签名 ...

CULEMO: Cultural Lenses on Emotion -- Benchmarking LLMs for Cross-Cultural Emotion Understanding

NLP研究越来越集中于主观任务，例如情绪分析。但是，现有的情感基准有两个主要的缺点：（1）它们很大程度上依赖于基于关键字的情感识别，忽略了更深入的情感理解所需的关键文化维度，并且（2）许多是通过将英语注释的数据转换为其他语言而创建的，从而导致潜在的不可靠的评估。为了解决这些问题，我们介绍了情感文化镜头（Culemo），这是第一个旨在评估跨六种语言的文化情感预测的基准：Amharic，Arabic，Arabic，英语，德语，德语，印地语和西班牙语 ...

0 0 0 0 2025/07/17 arXiv:2503.10688v3 ly123456

Act-With-Think: Chunk Auto-Regressive Modeling for Generative Recommendation

生成建议（GR）通常将项目信息的行为或语义方面编码为离散 Token ，并利用标准自回归（AR）生成范式进行预测。但是，现有的方法倾向于忽略它们的内在关系，即语义通常提供一些合理的解释性“ $ \ textbf {why} $”对行为“ $ \ textbf {what} $”，这可能会限制GR的全部潜力。为此，我们提出了块自回归建模（CAR），这是一种新一代范式，遵循用户通常认为项目语义方面的决策模式（e ...

0 0 0 0 2025/07/17 arXiv:2506.23643v1 xuwenlong

Moral Reasoning Across Languages: The Critical Role of Low-Resource Languages in LLMs

在本文中，我们介绍了多语言的道德推理基准（MMRB），以评估五种类型上多样的语言和三个级别上下文复杂性的大语言模型（LLM）的道德推理能力：句子，段落，段落和文档。我们的结果表明，道德推理性能会随着上下文复杂性的增加而降低，尤其是对于越南语等低资源语言而言。我们使用精选的单语言数据进行对齐和中毒，进一步调整了开源美洲拉玛-3-8B模型 ...

0 0 0 0 2025/07/17 arXiv:2504.19759v1 ly123456

Virgo: Cluster-level Matrix Unit Integration in GPUs for Scalability and Energy Efficiency

现代GPU结合了专门的矩阵单元，例如张量核心，以加速GEMM操作，这对于深度学习工作负载至关重要。但是，现有的矩阵单元设计紧密耦合到SIMT核心，从而限制了由于寄存器文件容量和带宽约束而引起的操作大小。这种可伸缩性的限制使得很难同时提高GPU中的计算吞吐量和能源效率 ...

0 0 1 1 2025/07/17 arXiv:2408.12073v2 jane88

HyPar: Towards Hybrid Parallelism for Deep Learning Accelerator Array

随着近年来人工智能的兴起，深层神经网络（DNN）已被广泛用于许多领域。为了达到高性能和能源效率，在学术界和行业中都深入研究了DNNS的硬件加速度（尤其是推理）。但是，我们仍然面临两个挑战：大型DNN型号和数据集，这些模型和数据集经常出现芯片内存储器访问； DNN的培训，在最近的加速器设计中尚未得到充分探索 ...

0 0 0 0 2025/07/17 arXiv:1901.02067v2 jane88

Your LLM Knows the Future: Uncovering Its Multi-Token Prediction Potential

自回归语言模型受其固有的顺序性质的约束，一次产生一个 Token 。该范式限制了推理速度和并行性，尤其是在生成阶段的文本方向和语义相对确定时。在这项工作中，我们提出了一个新颖的框架，该框架利用了关于未来 Token 的香草自回归语言模型的固有知识，结合了技术来实现这一潜力并能够同时预测随后多个 Token ...

0 0 0 0 2025/07/17 arXiv:2507.11851v1 hellogdc

CoDa-4DGS: Dynamic Gaussian Splatting with Context and Deformation Awareness for Autonomous Driving

动态场景渲染通过启用闭环模拟使用具有逼真的数据，这对于验证端到端算法至关重要。但是，交通环境的复杂而高度动态的性质在准确地呈现这些场景方面面临着重大挑战。在本文中，我们介绍了一种新颖的4D高斯裂（4DGS）方法，该方法结合了上下文和时间变形意识，以改善动态场景渲染 ...

0 1 0 0 2025/07/17 arXiv:2503.06744v1 orangelcx

LaVi: Efficient Large Vision-Language Models via Internal Feature Modulation

尽管大型视觉模型（LVLMS）取得了令人印象深刻的进步，但现有的方法却遭受了基本瓶颈的影响：视觉语言效率低下。当前方法要么破坏该模型的固有结构，要么引入严重的长篇小说计算负担，从而严重限制了可扩展性和效率。在本文中，我们重新考虑了多模式集成并呈现Lavi，这是一种新颖的LVLM，可以通过大语言模型（LLMS）中的内部特征调制来实现无缝有效的视觉融合 ...

0 0 0 0 2025/07/17 arXiv:2506.16691v1 18811558339

3D Human Pose Estimation via Intuitive Physics

从图像中估算3D人类通常会产生令人难以置信的身体，这些身体倾斜，漂浮或穿透地板。这种方法忽略了一个事实，即场景通常支持身体。物理引擎可用于执行身体上的合理性，但是这些并非可区分，依靠不切实际的代理机构，并且很难将其集成到现有的优化和学习框架中 ...

0 0 0 0 2025/07/17 arXiv:2303.18246v3 晚餐杀手

Exploring Intrinsic Normal Prototypes within a Single Image for Universal Anomaly Detection

异常检测（AD）对于工业检查至关重要，但是现有方法通常依赖于``比较''测试图像与培训集中的正常参考。但是，外观和定位的变化通常会使这些参考文献与测试图像的比对复杂化，从而限制了检测准确性。我们观察到大多数异常表现为局部变化，这意味着即使在异常图像中，有价值的正常信息仍然存在 ...

0 0 0 0 2025/07/17 arXiv:2503.02424v2 Roa