一译 —— 文档和论文翻译、对照阅读、讨论和社区

Towards Explainable Traffic Flow Prediction with Large Language Models

交通预测对于智能交通系统至关重要。由于深度学习在捕获交通数据的潜在模式方面的力量，它已经取得了显着的进步。然而，最近的深度学习架构需要复杂的模型设计，并且缺乏对从输入数据到预测结果的映射的直观理解 ...

0 0 0 2025/03/03 arXiv:2404.02937v5 18028729692

Direct Consistency Optimization for Robust Customization of Text-to-Image Diffusion Models

文本对图像（T2I）扩散模型在一些个人图像上进行微调时，可以以高度一致性生成视觉效果。但是，这样的微调模型并不强大。他们通常无法使用预验证的模型或其他微调模型的概念组成。为了解决这个问题，我们提出了一个新颖的微调目标，称为直接一致性优化，该目标控制了微调模型和预处理模型之间的偏差，以在微调过程中保留预处理的知识 ...

0 0 0 2025/03/03 arXiv:2402.12004v2 alanyhan

Person Re-identification with Metric Learning using Privileged Information

尽管近年来取得了希望的进展，但由于不同摄像头视图中人类外观的复杂差异，人们的重新识别仍然是一项具有挑战性的任务。本文为这个具有挑战性的问题提供了一种逻辑判别度量学习方法。它与大多数现有的度量学习算法不同，它在培训过程中利用了原始数据和辅助数据，这是由新机器学习范式 - 使用特权信息进行学习的动机 ...

0 0 0 2025/03/03 arXiv:1904.05005v1 L1MICH233

CapsFusion: Rethinking Image-Text Data at Scale

大型多模态模型表现出以零样本方式执行各种多模态任务的卓越通才能力。大规模基于网络的图像-文本对从根本上促成了这一成功，但也受到过多噪音的困扰。最近的研究使用由字幕模型合成的替代字幕，并取得了显着的基准性能 ...

0 0 1 2025/03/03 arXiv:2310.20550v3 my_lsz

Case-based Reasoning for Natural Language Queries over Knowledge Bases

从头开始解决一个复杂的问题通常很具有挑战性，但是如果我们可以通过其解决方案访问其他类似的问题（一种称为基于案例的推理（CBR））的其他类似问题，请容易得多。我们提出了一种神经符号CBR方法（CBR-KBQA），以解决大型知识库的问题。 CBR-KBQA由一个非参数存储器组成，该内存存储了情况（问题和逻辑形式）和一个参数模型，该模型可以通过检索与之相关的情况来为新问题生成逻辑形式 ...

0 0 0 2025/03/03 arXiv:2104.08762v2 Shmily

DiscoveryBench: Towards Data-Driven Discovery with Large Language Models

使用大语言模型（LLMS）的代码生成，函数调用和数据分析的快速进步可以帮助自动化纯粹是从一组提供的数据集中对假设的搜索和验证？为了评估这个问题，我们提出了DiscoveryBench，这是第一个正式化数据驱动发现过程的全面基准。该基准旨在系统地评估发现任务中当前的模型功能，并为改进它们提供有用的资源。我们的基准测试包含在6个不同领域（例如社会学和工程）中收集的264项任务，该任务是通过手动从已发表 ...

0 0 0 2025/03/03 arXiv:2407.01725v1 Saros

Democratizing Large Language Models via Personalized Parameter-Efficient Fine-tuning

大型语言模型（LLM）中的个性化越来越重要，旨在使LLMS的交互，内容和建议与个人用户偏好保持一致。最近的进步通过行为历史记录检索和文本配置文件来丰富用户查询，突出了有效的及时设计。但是，由于缺乏模型所有权，这些方法面临局限性，从而导致自定义和隐私问题受到限制，并且通常未能捕获复杂的动态用户行为模式 ...

0 0 0 2025/03/03 arXiv:2402.04401v3 guowy06

Keep it SMPL: Automatic Estimation of 3D Human Pose and Shape from a Single Image

我们描述了自动估计人体的3D姿势以及其从单个不受约束的图像中的3D形状的第一种方法。我们估计一个完整的3D网眼，并表明仅2D接头带有有关身体形状的惊人信息。由于人体的复杂性，表达，遮挡，衣服，照明以及从2D推断3D的固有歧义，问题是具有挑战性的 ...

0 0 0 2025/03/03 arXiv:1607.08128v1 gaoming1

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）