每学期在在线问答平台上回答数千个学生问题会产生相当大的人力成本,特别是在入学人数快速增长的计算机课程中。为了应对可扩展和智能问答 (QA) 的挑战,我们引入了一种创新解决方案,该解决方案利用 LLaMA-2 系列的开源大型语言模型 (LLM) 来确保数据隐私。我们的方法结合了增强技术,例如检索增强生成(RAG)、监督微调(SFT)以及使用直接偏好优化(DPO)从人类偏好数据中学习 ...

0 0 0 0 2024/06/16 arXiv:2311.02775v3 Cantaloupe

随着人工智能技术的快速发展,大语言模型(LLM)已成为研究热点。教育对人类社会的发展和进步发挥着重要作用。传统教育面临学生个体差异、教学资源配置不足、教学效果评估等挑战 ...

0 0 0 0 2024/06/16 arXiv:2311.13160v1 Cantaloupe

使用大型语言模型 (LLM) 的多模态推理经常会出现幻觉,并且 LLM 中存在缺陷或过时的知识。一些方法试图通过采用文本知识图来缓解这些问题,但它们单一的知识模态限制了全面的跨模态理解。在本文中,我们提出了多模态知识图谱的多模态推理(MR-MKG)方法,该方法利用多模态知识图谱(MMKG)来学习跨模态的丰富语义知识,显着增强了 LLM 的多模态推理能力 ...

0 0 0 0 2024/06/11 arXiv:2406.02030v2 Cantaloupe

网络钓鱼攻击给个人和企业造成了巨大损失,因此需要开发强大且高效的自动网络钓鱼检测方法。基于参考的网络钓鱼检测器 (RBPD) 可将目标网页上的徽标与一组已知的徽标进行比较,已成为最先进的方法。然而,现有RBPD的一个主要限制是它们依赖于手动构建的品牌知识库,使其无法扩展到大量品牌,从而由于知识库的品牌覆盖率不足而导致假阴性错误 ...

0 0 0 0 2024/06/08 arXiv:2403.02253v1 Cantaloupe

即使保守估计,80% 的企业数据也驻留在非结构化文件中,存储在支持异构格式的数据湖中。传统的搜索引擎不再能够满足信息搜索的需求,特别是当任务是浏览和探索洞察力时。换句话说,没有明显的搜索关键字可供使用 ...

0 0 0 0 2024/06/08 arXiv:2406.02962v1 Cantaloupe

虽然像 ChatGPT 这样的大型语言模型 (LLM) 在自然语言处理 (NLP) 任务中表现出了令人印象深刻的能力,但对其在该领域潜力的系统研究在很大程度上仍未得到探索。本研究旨在通过探讨以下问题来弥补这一差距:(1)目前文献中 LLM 如何应用于 NLP 任务? (2) 传统的 NLP 任务是否已被 LLM 解决? (3) NLP LLM 的前景如何?为了回答这些问题,我们首先对 NLP 领域的 LLM 进行全面概述。具体来说,我们首先引入一个统一的分类法,包括(1)参数冻结应用程序和(2)参数调整应用程序,为理解 LLM 在 NLP 领域的当前进展提供统一的视角 ...

0 0 0 0 2024/06/08 arXiv:2405.12819v1 Cantaloupe

由于大量的实际应用,图学习在学习界引起了极大的关注。特别是,以数值节点特征和图结构作为输入的图神经网络(GNN)已被证明可以在各种与图相关的学习任务上实现最先进的性能。最近通过自监督学习探索数值节点特征和图结构之间的相关性的工作为进一步提高 GNN 的性能铺平了道路 ...

0 0 0 0 2024/06/06 arXiv:2111.00064v3 Cantaloupe

利用基于文本的节点属性的节点分类具有许多实际应用,从学术引文图中论文主题的预测到社交媒体网络中用户特征的分类。最先进的节点分类框架(例如 GIANT)使用两阶段管道:首先嵌入图节点的文本属性,然后将所得嵌入输入节点分类模型。在本文中,我们消除了这两个阶段,并开发了一种基于 GIANT 的端到端节点分类模型,称为端到端 GIANT (E2EG) ...

0 0 0 0 2024/06/06 arXiv:2208.04609v2 Cantaloupe

图表示学习(GRL)方法,例如图神经网络和图变换模型,已成功用于分析图结构数据,主要集中在节点分类和链路预测任务。然而,现有的研究大多只考虑局部连接性,而忽略了远程连接性和节点的作用。在本文中,我们提出了统一图变换网络(UGT),它将局部和全局结构信息有效地集成到固定长度的向量表示中 ...

0 0 0 0 2024/06/04 arXiv:2308.09517v1 Cantaloupe

当前的大型语言模型(LLM)是否可以通过参数更新更好地解决图形推理和生成任务?在本文中,我们提出了 InstructGraph,这是一个框架,通过指令调整和偏好对齐,赋予 LLM 图形推理和生成的能力。具体来说,我们首先提出一种结构化格式语言器,将所有图数据统一为通用的类似代码的格式,它可以简单地表示图,而无需任何外部特定于图的编码器。此外,还引入了图形指令调整阶段来指导 LLM 解决图形推理和生成任务 ...

0 0 0 0 2024/05/06 arXiv:2402.08785v1 Cantaloupe

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)