我们提出了能够以全双工方式运行的生成对话系统,从而可以进行无缝的互动。它基于仔细对齐的大型语言模型(LLM),以意识到感知模块,电动机函数模块以及具有两个状态的简单有限状态机(称为神经FSM)的概念。感知和电机功能模块以串联运行,从而使系统可以同时讲话和聆听 ...
传统的预测方法依赖于单峰时间序列数据,从而限制了它们利用丰富的文本信息的能力。最近,大型语言模型(LLM)和时间序列基础模型(TSFM)分别在文本推理和时间建模中表现出强大的能力。整合两者的优势,以构建一个多式模型,该模型同时利用时间和文本信息来供将来推断,这是一项关键的研究挑战 ...
尽管实际预测越来越多地获得多模式数据源,但大多数现有的研究仍然存在于单峰时间序列上。在这项工作中,我们介绍了Motime,这是一套多模式时间序列的预测数据集,该数据集将时间信号与外部模态(例如文本,元数据和图像)配对。涵盖不同的领域,Motime支持对模式实用程序的结构化评估:1)共同的预测任务,其中有不同的历史记录,以及2)冷启动预测,没有可用的历史数据 ...
不规则的多元时间序列(IMT)的特征是变量内的不规则时间间隔和跨变量的观察值不规则,在学习时间和变量依赖性方面构成了挑战。许多现有的IMT型号要求带衬垫的样品从时间和可变维度分开学习,或者通过两部分图或集合表示原始样品。但是,前者通常需要处理影响效率并破坏原始抽样模式的额外填充值,而后者则在捕获未对准的观测值之间存在限制 ...
机器翻译(MT)仍然是大型语言模型(LLMS)尚未取代专用监督系统的最后一个NLP任务之一。这项工作利用了LLM和受监督的MT的互补优势,通过引导LLMS自动在编辑后MT和外部反馈其质量的外部反馈,这些反馈源自多维质量度量(MQM)注释。使用Llama-2模型,我们考虑提示策略改变提供的反馈的性质,然后微调LLM以提高其利用提供指导的能力 ...
我们引入了一个新的,广泛的多维质量指标(MQM)注释的数据集,其中涵盖了生物医学领域中11对语言对。我们使用此数据集研究机器翻译(MT)指标是否通过人类生成的MT质量判断进行了微调,对训练和推理之间的领域变化是否强大。我们发现,微型指标相对于依赖于表面形式的指标以及未对MT质量判断的预先调整的指标以及预训练的指标表现出很大的性能下降 ...
大型语言模型(LLM)证明了通过对话互动提高人类效率的能力。传统的LLM驱动对话系统,以基于回合的范式运行,排除了响应生成期间的实时互动。为了解决这一限制,研究人员提出了双工模型 ...
目的:借助大型语言模型(LLMS)的医疗保健,需要竞争性开源模型来保护公共利益。这项工作通过优化数据预处理和培训的关键阶段,同时展示了如何提高模型安全性(通过DPO)和功效(通过RAG)来促进开放医学LLM的领域。所使用的评估方法包括四种不同类型的测试,定义了该领域的新标准 ...