大型语言模型 (LLM) 在各个领域都表现出色,但在复杂的科学推理方面却遇到了困难,尤其是在化学领域。与简单的化学任务不同(例如 ...
用于开发医学应用的语言技术研究是当前自然语言理解和生成的热门话题。因此,许多大型语言模型(LLM)最近已适应医学领域,因此它们可以用作人类与人工智能交互的中介工具。虽然这些 LLM 在自动化医学文本基准上表现出有竞争力的表现,但他们已经过预培训和评估,重点关注单一语言(主要是英语) ...
我们推出了流程工程操作助手 (PEOA),这是一个人工智能驱动的框架,旨在解决化学和流程工业中的复杂问题。该框架采用由元代理精心编排的模块化架构,元代理充当中央协调器,管理动作生成器和指令调整的小型语言模型(专家模型)。动作生成器将复杂的问题分解为子任务,并确定合适的专家模型来执行每个子任务,为多步骤问题解决提供精确的解决方案 ...
像 ChatGPT 这样的大规模语言模型 (LLM) 在根据人类指令生成响应方面表现出了令人印象深刻的能力。然而,由于缺乏具体、深入的知识,它们在医学领域的使用可能具有挑战性。在这项研究中,我们提出了一个名为 LLM 增强医学教科书(LLM-AMT)的系统,旨在提高 LLM 在专业领域的熟练程度 ...
幻觉是大型语言模型 (LLM) 生成的文本中的一种众所周知的现象。几乎所有的应用场景都存在幻觉反应的存在,例如: ...
大型语言模型(LLM)在开放领域任务中得到了普及并取得了显着的效果,但由于缺乏特定领域知识,其在实际工业特定领域场景中的表现一般。这个问题引起了广泛的关注,但相关的基准却很少。在本文中,我们提供了一个名为 MSQA 的基准问答 (QA) 数据集,围绕 Microsoft 产品和客户遇到的 IT 技术问题 ...
医学视觉问答~(VQA)是医学人工智能和流行的 VQA 挑战的结合。给定医学图像和自然语言的临床相关问题,医学 VQA 系统有望预测出合理且令人信服的答案。尽管通用领域的VQA已经得到了广泛的研究,但医学VQA由于其任务特点仍然需要具体的研究和探索 ...
基于知识的视觉问答(VQA)需要图像之外的外部知识来回答问题。早期的研究从显式知识库(KB)中检索所需的知识,这通常会引入与问题无关的信息,从而限制了模型的性能。最近的工作诉诸于使用强大的大语言模型(LLM)作为隐式知识引擎来获取回答所需的知识 ...
大型语言模型 (LLM) 虽然在一般领域中功能强大,但在医疗问答 (QA) 等特定领域任务上通常表现不佳。此外, LLM 往往充当“黑匣子”,这使得改变他们的行为具有挑战性。为了解决这个问题,我们的工作采用了透明的检索增强生成(RAG)过程,旨在提高 LLM 的反应,而无需进行微调或再培训 ...
最近的人工智能 (AI) 系统在从围棋到蛋白质折叠等“重大挑战”方面已经达到了里程碑。长期以来,检索医学知识、推理医学知识以及回答医学问题的能力一直被视为一项巨大的挑战。大型语言模型(LLM)促进了医学问答领域的重大进步; Med-PaLM 是第一个在美国医疗执照考试 (USMLE) 类型问题中超过“及格”分数的模型,得分为 67 分 ...