arxiv的文档

arxiv 南京

个性签名 ...

Multimodal Generative AI with Autoregressive LLMs for Human Motion Understanding and Generation: A Way Forward

本文介绍了一项有关使用多模式生成人工智能（Genai）和自回归大型语言模型（LLMS）的深入调查，以了解人类运动的理解和产生，从而有见识新兴方法，体系结构及其推动现实和多样性运动合成的潜力。本研究专门关注文本和运动方式，研究文本描述如何指导复杂的，类人类运动序列的产生。本文探讨了各种生成方法，包括自回旋模型，扩散模型，生成的对抗网络（GAN），变异自动编码器（VAE）和基于 Transformer 的模型，通过分析其运动质量，计算效率和适应性方面，通过分析其优势和限制 ...

0 0 0 0 2025/07/25 arXiv:2506.03191v1 xytian

Breaking PEFT Limitations: Leveraging Weak-to-Strong Knowledge Transfer for Backdoor Attacks in LLMs

尽管大型语言模型 (LLM) 因其卓越的功能而得到广泛应用，但已被证明容易受到后门攻击。这些攻击通过毒害训练样本和全参数微调，将有针对性的漏洞引入 LLM。然而，这种后门攻击是有限的，因为它们需要大量的计算资源，特别是随着 LLM 规模的增加 ...

0 0 0 0 2025/07/24 arXiv:2409.17946v4 chenzhuo-wang

Shapley Value-driven Data Pruning for Recommender Systems

推荐系统通常会遇到嘈杂的互动，例如意外点击或受欢迎程度偏见。现有的denoising方法通常会在其交互中识别用户的意图，并过滤掉偏离假定意图的嘈杂交互。但是，他们忽略了被认为嘈杂的互动仍然可以帮助模型培训，而某些``清洁''互动几乎没有学习价值 ...

0 0 0 0 2025/07/24 arXiv:2505.22057v1 plain

Solid-SQL: Enhanced Schema-linking based In-context Learning for Robust Text-to-SQL

最近，大型语言模型（LLM）显着改善了文本到SQL系统的性能。然而，许多最先进的方法（SOTA）方法忽略了系统鲁棒性的关键方面。我们的实验表明，尽管LLM驱动的方法在标准数据集上表现出色，但是当面对对抗性扰动时，它们的准确性显着损害 ...

0 0 0 0 2025/07/24 arXiv:2412.12522v1 qzw

Gemini 2.5 Pro Capable of Winning Gold at IMO 2025

国际数学奥林匹克运动会（IMO）提出了需要深刻洞察力，创造力和正式推理的独特挑战性问题。尽管大型语言模型（LLMS）在数学基准（例如AIME）上表现良好，但它们在奥林匹克级任务中挣扎。我们使用Google的双子座2 ...

0 0 0 0 2025/07/24 arXiv:2507.15855v2 ray075hl

Modality-Agnostic Structural Image Representation Learning for Deformable Multi-Modality Medical Image Registration

在不同的成像方式上建立致密的解剖对应是为众多医学图像分析研究和图像引导的放射疗法而进行的基础但具有挑战性的程序。现有的多模式图像注册算法依赖于基于统计的相似性度量或局部结构图像表示。然而，前者对局部变化的噪声很敏感，而后者的歧视性不足以应对多模式扫描中的复杂解剖结构，从而在确定各种方式的扫描中的解剖学对应性时歧义性 ...

0 0 0 0 2025/07/24 arXiv:2402.18933v2 zfk666

GeoVision Labeler: Zero-Shot Geospatial Classification with Vision and Language Models

对地理空间图像进行分类仍然是诸如灾难响应和土地利用监测诸如稀缺或无法使用的区域的主要瓶颈。现有工具（例如 ...

0 0 0 0 2025/07/24 arXiv:2505.24340v1 Jht

DCG-SQL: Enhancing In-Context Learning for Text-to-SQL with Deep Contextual Schema Link Graph

将自然语言问题转化为SQL查询的文本到SQL已通过对大型语言模型（LLMS）的文化学习进行了进步。但是，与随机选择的演示相比，现有方法的性能几乎没有改善，并且当LLMS较小时的性能下降（例如 ...

0 0 0 0 2025/07/24 arXiv:2505.19956v2 qzw

Deep Unrestricted Document Image Rectification

近年来，已经在文档图像纠正上做出了巨大的努力，但是现有的高级算法仅限于处理受限制的文档图像，即输入图像必须包含完整的文档 ...

0 0 0 0 2025/07/24 arXiv:2304.08796v2 Yange

CCI3.0-HQ: a large-scale Chinese dataset of high quality designed for pre-training large language models

我们提出CCI3.0-HQ（此HTTPS URL），这是中国语料库Internet 3.0的高质量500GB子集（CCI3 ...

0 0 0 0 2025/07/24 arXiv:2410.18505v2 lianzhepku