大型语言模型(LLM)的快速发展导致开源社区和行业之间存在巨大的知识差距,这主要是因为后者依赖闭源的高质量数据和培训方法。为了解决这个问题,我们引入了 PCMind-2.1-Kaiyuan-2B,这是一个完全开源的 20 亿参数模型,专注于提高资源限制下的训练效率和效果。我们的方法包括三项关键创新:分位数数据基准方法,用于系统地比较异构开源数据集并提供有关数据混合策略的见解;多阶段范式内的战略选择性重复方案,以有效利用稀疏的高质量数据;以及按质量订购样本的多领域课程培训政策。在高度优化的数据预处理流程和针对 FP16 稳定性的架构修改的支持下,Kaiyuan-2B 实现了与最先进的完全开源模型竞争的性能,展示了针对资源有限的预训练的实用且可扩展的解决方案。我们在 Apache 2.0 许可证下在此 https URL 发布所有资产(包括模型权重、数据和代码) ...
自动驾驶是一项复杂且具有挑战性的任务,旨在通过场景理解和推理来进行安全运动规划。虽然纯视觉自动驾驶方法最近取得了显着的性能,但通过增强场景理解,仍然需要解决一些关键问题,包括缺乏推理、泛化性能低和长尾场景。在本文中,我们提出了 VLP,一种新颖的视觉语言规划框架,它利用语言模型来弥合语言理解和自动驾驶之间的差距。 VLP 通过加强源记忆基础和自动驾驶汽车的上下文理解来增强自动驾驶系统。与之前的最佳方法相比,VLP 在具有挑战性的 NuScenes 数据集上实现了最先进的端到端规划性能,平均 L2 错误率和冲突率分别降低了 35.9% 和 60.5%。此外,VLP在具有挑战性的长尾场景中表现出更好的性能,并且在面对新的城市环境时表现出强大的泛化能力 ...
本文采用参数化方法研究Fredholm积分微分方程组的多点边值问题。单独研究了退化核的情况,为此我们获得了适定性条件并提出了一些算法来找到问题的近似和数值解。然后我们建立了 Fredholm 积分微分方程组多点问题适定性的充分必要条件,并开发了一些求解其近似解的算法。这些算法基于具有简并核的积分微分方程组的逼近问题的解 ...
深度学习模型在广泛的视觉任务中表现出了卓越的性能。然而,它们在测试时通常容易受到域转移的影响。为了缓解这些漏洞,开发了测试时训练(TTT)方法,其中在训练时与主要任务同时解决次要任务,然后在测试时用作自监督代理任务。在这项工作中,我们提出了一种基于多尺度特征图和离散潜在表示之间互信息最大化的新型无监督 TTT 技术,该技术可以作为辅助聚类任务集成到标准训练中。实验结果证明了在不同流行的测试时间适应基准上具有竞争性的分类性能 ...
对于自动驾驶汽车,复杂环境中的安全导航取决于处理各种各样和罕见的驾驶场景。基于模拟和方案的测试已成为自主驾驶系统开发和验证的关键方法。传统的场景生成依赖于基于规则的系统,知识驱动的模型和数据驱动的综合,通常会产生有限的多样性和不切实际的安全性案例 ...
识别高碰撞风险路段并准确预测碰撞发生率是实施有效安全对策的基础。虽然碰撞数据本质上反映了风险,但碰撞报告的频率低且不一致,对稳健的风险预测模型提出了重大挑战。联网车辆技术的普及为利用高密度安全指标来增强碰撞预测提供了一条有前途的途径。紧急制动事件 (HBE) 被解释为一种规避操作,由于其与潜在碰撞因果因素具有明显的相关性,因此可作为驾驶风险升高的有效指标。至关重要的是,与传统碰撞记录相比,HBE 数据在整个道路网络中更容易获得。这项研究利用来自加利福尼亚州和弗吉尼亚州的数据集,系统地评估了警方报告的碰撞事故与通过 Google Android Auto 平台识别的汇总和匿名 HBE 之间在各个路段层面的相关性。经验证据表明,HBE 的发生率高于交通事故。该分析采用最新实践的负二项式回归模型,在 HBE 率和事故率之间建立了统计学上显着的正相关关系:HBE 频率较高的路段始终与较高的事故发生率相关。这个复杂的模型结合并控制了各种混杂因素,包括道路类型、速度曲线、与坡道的接近度和路段坡度。因此,源自互联车辆技术的 HBE 为全网交通安全评估提供了可扩展、高密度的安全替代指标,有可能优化更安全的路线建议并为主动安全对策的战略部署提供信息 ...
在商业无线系统需求不断增长和频谱接入技术进步的推动下,动态频谱共享(DSS)日益成为现代频谱政策的关键要素。无源射电科学,包括射电天文学、地球遥感和气象学,在根本不同的约束下运作。它们依赖于极低的干扰频谱,并且极易受到短暂的射频干扰。我们研究 DSS 是否可以使被动服务受益,或者是否引入新的故障模式和执行挑战。我们提出即时静区(JITQZ)作为保护高价值观测的机制,并评估混合框架,该框架保留对核心无源频段的静态保护,同时允许在相邻频率中进行受限的动态访问。我们分析了传播不确定性、电磁兼容性约束和有限频谱意识的作用。使用博弈论框架,我们展示了非合作共享失败的原因,确定了持续合作的条件,并检查了激励机制,包括促进合规性的假名归因。我们的结论是,DSS 只能作为高可靠性、安全关键的系统来支持无源无线电科学。静态分配仍然至关重要,而动态访问只有在保守的保障措施和可执行的问责制下才可行 ...
自动驾驶汽车 (AV) 的快速发展有望通过提高安全性和效率来彻底改变交通运输。然而,确保它们在各种现实条件下的可靠性仍然是一项重大挑战,特别是由于被称为边缘情况的罕见和意外情况。尽管存在多种检测边缘情况的方法,但明显缺乏系统审查这些技术的全面调查。本文通过对边缘情况检测和评估方法进行实用的、层次化的审查和系统分类来填补这一空白。我们的分类分为两个层次:首先,根据自动驾驶模块对检测方法进行分类,包括与感知相关和与轨迹相关的边缘情况;其次,基于指导这些技术的基本方法和理论。我们通过引入一种称为“知识驱动”方法的新类别来扩展这种分类法,这种方法在文献中很大程度上被忽视了。此外,我们回顾了评估边缘情况检测方法和识别的边缘情况的技术和指标。据我们所知,这是第一个全面涵盖所有 AV 子系统的边缘情况检测方法、讨论知识驱动的边缘情况并探索检测方法评估技术的调查。这种结构化和多方面的分析旨在促进自动驾驶汽车的针对性研究和模块化测试。此外,通过确定各种方法的优缺点并讨论挑战和未来方向,本次调查旨在帮助自动驾驶开发人员、研究人员和政策制定者通过有效的边缘情况检测来增强自动驾驶(AD)系统的安全性和可靠性 ...
本调查论文探讨了前沿人工智能、基础模型和大型语言模型 (LLM) 在智能交通系统 (ITS) 领域的变革性影响,强调它们在推进交通智能、优化交通管理和实现智慧城市方面的不可或缺的作用。前沿人工智能是指人工智能技术的最前沿,涵盖该领域的最新进展、创新和实验技术,特别是人工智能基础模型和 LLM 。基础模型(如 GPT-4)是大型通用 AI 模型,为广泛的应用程序提供基础。它们的特点是多功能性和可扩展性。 LLM 是通过微调基础模型获得的,特别关注处理和生成自然语言。他们擅长语言理解、文本生成、翻译和摘要等任务。通过利用大量文本数据(包括流量报告和社交媒体互动), LLM 可以提取关键见解,促进 ITS 的发展。该调查探讨了 LLM 和智能交通系统之间的动态协同作用,深入研究了交通管理中的应用、自动驾驶汽车的集成及其在塑造智慧城市中的作用。它提供了对正在进行的研究、创新和新兴趋势的见解,旨在激发语言、智能和移动性交叉领域的合作,以实现更安全、更高效和可持续的交通系统。该论文进一步调查了 LLM 与智能交通系统各个方面之间的相互作用,探讨了在交通管理、促进自动驾驶汽车和为智慧城市发展做出贡献方面的作用,同时应对前沿人工智能和基础模型带来的挑战。本文为智能交通变革领域的未来研究和创新提供了宝贵的启发 ...
将驾驶员、车内和外部环境的上下文线索整合到车辆决策中是半自动车辆安全的核心。已经开发了多种系统来为车辆提供背景信息,这些系统通常依赖于捕获驾驶员的身体和环境状态的视频流。虽然视频流是丰富的信息源,但它们提供上下文的能力在某些情况下可能具有挑战性,例如低照度环境(例如夜间驾驶),并且它们高度侵犯隐私。在这项研究中,我们通过智能手表利用被动传感来对驾驶环境的元素进行分类。具体来说,通过使用自然驾驶研究中的 15 名参与者收集的数据,并使用随机森林等多种机器学习算法,我们对驾驶员的活动(例如,使用电话和吃饭)、外部事件(例如,通过十字路口和变道)和外部道路属性(例如,在城市与高速公路中驾驶)进行分类,平均 F1 分数分别为 94.55、98.27 和 97.86%,通过10倍交叉验证。我们的研究结果表明,通过智能可穿戴设备检索的多模态数据在提供现实驾驶场景背景方面的适用性,并为未来自动驾驶汽车更好地共享自主和隐私意识驾驶数据收集、分析和反馈铺平了道路 ...