定位和修复软件故障是软件开发中一项耗时且耗费资源的任务。传统的故障定位方法,例如基于频谱的故障定位(SBFL),依赖于测试覆盖数据的统计分析,但往往精度较低。基于学习的技术虽然更有效,但需要大量的训练数据,并且计算成本可能很高 ...
基于Transformer的大型语言模型(LLM)已评估知识库、人机界面和动态代理等不同领域,有望实现通用人工智能(AGI)的巨大进步。然而,目前的 LLM 主要是针对短文本的片段进行预训练,这损害了他们处理实际场景中经常遇到的长上下文提示的有效性。本文对基于 Transformer 的 LLM 架构的最新进展进行了全面调查,旨在增强 LLM 在整个模型生命周期(从预到训练推理)中的长上下文能力. ...
我们介绍 ChatGLM,这是我们一直在开发的一个不断发展的大型语言模型家族。本报告主要关注 GLM-4 语言系列,包括 GLM-4、GLM-4-Air 和 GLM-4-9B。它们代表了我们最有能力的模型,这些模型接受了从前三代 ChatGLM 中获得的所有见解和经验教训 ...
本文调查了快速发展的指令调优(IT)领域的研究工作,这是增强大型语言模型(LLM)功能和可控性的关键技术。指令调优是指以监督方式由\textsc{(instruction ,output)}对组成的数据集上进一步训练LLM的过程,它弥补了LLM的下一个单词预测目标与用户的目标之间的差距。LLM人类生存指示。在这项工作中,我们对文献进行了系统回顾,包括IT的一般方法、IT数据集的构建、IT模型在不同 ...
当用户与推荐系统(RecSys)交互时,当前情况(例如时间、位置和环境)会显着影响他们的偏好。情境作为交互的背景,用户和项目之间的关系随着情境的变化而变化。然而,现有的 RecSys 将情况、用户和项目视为同一级别 ...
金融数据的复杂性,其特点是可变性和低信噪比,需要先进的量化投资方法,优先考虑性能和这个http URL,从早期的手动提取到遗传编程,这是阿尔法因子挖掘中最先进的方法Domain 目前采用强化学习来挖掘一组具有固定权重的组合因素。然而,由此产生的α因子的表现不一致,并且固定因子权重的灵活性不足以适应金融市场的动态性质。为了解决这个问题,本文提出了一种两阶段公式化α生成框架AlphaForge,用于α ...
多模态大语言模型(MLLM)促进了视觉和语言模态的集成,使自己成为视觉语言任务的主导范例。当前的思想链 (CoT) 推理等方法增强了大型语言模型 (LLM) 的认知能力,但它们对 MLLM 的适应受到跨模态理解中幻觉风险增加的阻碍。在本文中,我们发现当前多模态 CoT 方法中的边看边思考的范式(其中推理链与视觉输入一起生成)无法减轻由误导性图像引起的幻觉 ...
文本到SQL模型可以生成候选SQL查询列表,最佳查询通常位于候选列表中,但不在列表顶部。有效的重新排序方法可以从候选列表中选择正确的SQL查询并模型的性能。先前关于提高代码生成的研究自动生成测试示例并使用它们对候选代码重新排序... ...