神经网络以大型语言模型、语音转录系统、分子发现算法、机器人等形式围绕着我们。除去其他任何东西,神经网络是由可微基元组成的,研究它们意味着学习如何编程以及如何与这些模型交互,这是所谓可微编程的一个特殊例子。这本初级读物是对这个令人着迷的领域的介绍,它是为像爱丽丝这样刚刚冒险进入这个奇怪的可微仙境的人想象的 ...

0 0 0 0 2025/01/19 arXiv:2404.17625v2 sealaes

大型语言模型(LLM)在自然语言理解和生成方面表现出了卓越的能力。然而,他们经常难以完成复杂的推理任务,并且容易产生幻觉。最近的研究表明,利用知识图谱 (KG) 来提高 LLM 的成绩具有良好的前景 ...

0 0 0 0 2024/12/28 arXiv:2412.10654v1 sealaes

OpenAI 最近推出的强化微调 (RFT) 展示了推理基础模型的潜力,并提供了超越简单模式模仿的微调新范式。这份技术报告介绍了 \emph{OpenRFT},我们尝试在与 RFT 相同的设置下针对特定领域的任务微调通用推理模型。 OpenRFT 通过以下三种方式利用特定领域的样本,解决了缺乏推理步骤数据和训练样本数量有限的两个关键挑战:问题增强、综合推理过程数据和少样本 ICL ...

0 1 0 0 2024/12/25 arXiv:2412.16849v1 sealaes

2022年,随着ChatGPT的发布,大规模语言模型获得了广泛关注。 ChatGPT 不仅在参数和预训练语料规模上超越了之前的模型,而且通过对大量高质量的人工标注数据进行微调,实现了革命性的性能提升。这一进展让企业和研究机构认识到,构建更智能、更强大的模型依赖于丰富且高质量的数据集 ...

0 0 0 0 2024/12/17 arXiv:2411.07715v1 sealaes

Edge-AI 是边缘计算和人工智能 (AI) 的融合,已成为一种有前途的范例,可以在靠近用户的网络边缘部署先进的 AI 模型。在 Edge-AI 中,联合持续学习(FCL)已成为一种命令式框架,它融合了来自不同客户的知识,同时保护数据隐私,并在学习新任务时保留以前任务的知识。通过这样做,FCL旨在确保学习模型在动态和分布式环境中稳定可靠的性能 ...

0 0 0 0 2024/12/17 arXiv:2411.13740v1 sealaes

我们推出了 Byte Latent Transformer (BLT),这是一种新的字节级 LLM 架构,它首次将基于标记化的 LLM 性能大规模与推理效率和鲁棒性方面的显着改进相匹配。 BLT 将字节编码为动态大小的补丁,作为主要的计算单元。补丁根据下一个字节的熵进行分段,在数据复杂性增加时分配更多的计算和模型容量 ...

0 0 0 0 2024/12/17 arXiv:2412.09871v1 sealaes

在本文中,我们提出了一个系统的努力,以设计,评估和实施现实的对话推荐系统(CRS)。我们系统的目的是允许用户输入自由形式的文本以请求建议,然后收到相关和多样的项目列表。虽然先前关于合成查询的工作使用1-3个工具增强了大语言模型(LLMS),但我们认为,对于有效处理真实的用户请求,必须使用更广泛的工具箱 ...

0 0 0 0 2024/12/11 arXiv:2411.19352v1 sealaes

这份多模态大语言模型 (MLLM) 调查和应用指南探索了快速发展的 MLLM 领域,研究了它们的架构、应用程序以及对人工智能和生成模型的影响。从基本概念开始,我们深入研究 MLLM 如何集成各种数据类型,包括文本、图像、视频和音频,以使复杂的人工智能系统能够进行跨模式理解和生成。它涵盖了培训方法、架构组件以及各个领域的实际应用等基本主题,从视觉讲故事到增强的可访问性 ...

0 0 0 0 2024/11/13 arXiv:2411.06284v1 sealaes

本文提出了一种先进的数学问题解决框架 LLaMA-Berry,用于增强大型语言模型(LLM)的数学推理能力。该框架将蒙特卡罗树搜索(MCTS)与迭代自精炼相结合来优化推理路径,并利用成对奖励模型来全局评估不同的路径。通过利用 LLM 的自我批评和重写能力,应用于 MCTS (SR-MCTS) 的 Self-Refine 通过促进对解决方案空间的更有效探索,克服了传统逐步和贪婪搜索算法的低效率和局限性 ...

0 0 0 0 2024/10/11 arXiv:2410.02884v1 sealaes

在本文中,我们认为通常用于离线评估顺序推荐系统的范式不适合评估基于强化学习的推荐系统。我们发现大多数现有的基于强化学习的推荐的离线评估实践都是基于下一项预测协议,并详细说明了这种评估协议的三个缺点。值得注意的是,它无法反映强化学习 (RL) 预期带来的潜在好处,同时隐藏了某些离线 RL 代理的关键缺陷 ...

0 1 0 0 2024/09/22 arXiv:2301.00993v1 sealaes

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)