文本到SQL系统使用户能够使用自然语言查询数据库,从而使访问数据分析的访问民主化。但是,他们在理解模棱两可的措辞,特定于领域的词汇和复杂的模式关系方面面临挑战。本文介绍了Datrics Text2SQL,这是一种基于检索的生成(RAG)的框架,旨在通过利用结构化文档,基于示例的学习和特定领域的规则来生成准确的SQL查询 ...
通过大型语言模型(LLM)连接音频编码器,LLM可以执行各种音频理解任务,例如自动语音识别(ASR)和音频字幕(AC)。大多数研究重点是训练适配器层,以生成LLM的统一音频功能。但是,不同的任务可能需要强调语义或声学方面的不同功能,从而使特定于任务的音频功能更加理想 ...
数据制备(DP)将原始数据转换为适合下游应用程序的形式,通常是通过将操作组合到可执行管道中。构建这样的管道是耗时的,需要精致的编程技能。如果我们可以使用自然语言(NL)构建管道,那么DP的技术障碍将大大降低 ...
与大多数常规建议问题不同,顺序建议通过利用相互作用的项目之间的内部顺序和依赖性来关注学习用户的偏好,这已经受到了研究人员和从业者的极大关注。近年来,我们目睹了这一领域取得的巨大进步和成就,需要进行新的调查。在这项调查中,我们从新的角度研究了SR问题(i ...
推理大型语言模型最近在许多领域都取得了最先进的表现。但是,它们的长期思想推理会引起可解释性挑战,因为每个 Token 都取决于所有先前的挑战,从而使计算更难分解。我们认为,分析句子级别的推理痕迹是理解推理过程的一种有前途的方法 ...
在人工智能领域,开发具有跨越各种任务的能力的单一基础模型一直是一个长期的目标。随着通用基础模型的浪潮跨越各个领域,它们的影响大大扩展到了推荐系统领域。尽管最近的努力探索了针对各种生成任务的建议基础模型,但他们经常忽略关键的嵌入任务,并在多任务学习的复杂性(包括知识共享和冲突解决方案)以及融合速度速度不一致方面挣扎 ...
LLM自我评估取决于LLM自身估计响应正确性的能力,这可以大大提高其部署可靠性。在这一研究轨道中,我们提出了潜在空间中的装饰链(COE),以使LLMS能够执行无输出的自我评估。 COE由推理时间期间产生的所有进步隐藏状态组成,可以将其视为LLM的潜在思维路径 ...
预测哪种行动(治疗)将导致更好的结果是决策支持系统的核心任务。为了在实际情况下构建预测模型,由于缺乏随机对照试验(RCT)数据,从偏见的观察数据中学习是一个关键问题。为了处理这种有偏见的观察数据,最新的因果推理和反事实机器学习的努力集中在对二元动作空间潜在结果及其之间的差异的估计估计,即单个治疗效果 ...