我们介绍了Unberbel和Instituto SuperiorTécnico对WMT 2023质量估计(QE)的共同任务的共同贡献。我们的团队参与了所有任务:句子和单词级质量预测(任务1)和细粒度错误跨度检测(任务2)。对于所有任务,我们以Cometkiwi-22模型为基础(REI等人 ...
具有巨大的预训练 Token 和参数的大型语言模型(LLMS)出现了多种能力,包括数学推理,代码生成和随后。通过监督的微调(SFT)进一步增强了这些能力。尽管开源社区探索了临时SFT以增强个人功能,但专有的LLMS在各种技能上表现出多功能性 ...
建筑物内部的热舒适性是一个经过充分研究的领域,在其中收集了对热舒适的人类判断,可用于自动舒适估计。但是,就热状态变化而言,室内场景相当静态,因此不能应用于动态条件,例如 ...
高性能交通流量预测模型设计是一种智能运输系统的核心技术,是工业和学术社区的长期挑战但仍然具有挑战性的任务。物理原理和数据驱动模型之间缺乏整合是限制该领域发展的重要原因。在文献中,基于物理的方法通常可以清楚地解释流量流系统的动态过程,但准确性有限,而数据驱动的方法,尤其是具有黑盒结构的深度学习,可以提高性能,但由于缺乏合理的物理基础,无法完全受到信任 ...
在推荐系统中,包括检索和排名在内的传统多阶段范式通常会遭受阶段之间的信息损失和降低性能。受自然语言处理的启发,生成模型的最新进展表明,有可能统一这些阶段以减轻这种损失。本文介绍了统一的生成推荐框架(UNIGRF),这是一种新颖的方法,将检索和排名整合到单个生成模型中 ...
本文介绍了一种新型的数值方法,可以在自主驾驶场景中实现平稳的车道变化轨迹。我们的轨迹生成方法利用粒子群优化(PSO)技术,结合了轨迹细化的神经网络(NN)预测。通过将多项式曲线拟合与粒子传播相结合,可以促进平滑且动态可行的轨迹,从而促进了可以解释车辆动力学的粒子传播 ...
在指纹识别领域工作的研究人员的主要障碍是缺乏公开可用的大规模指纹数据集。确实存在的公开数据集包含很少的身份和印象。这限制了许多主题的研究,包括e ...
Gradual Binary Search and Dimension Expansion : A general method for activation quantization in LLMs
大型语言模型(LLM)已成为人工智能的关键,在推理,理解和生成数据中表现出强大的能力。但是,它们在边缘设备上的部署受到大量大小的阻碍,通常达到数十亿个参数。量化是一种广泛使用的方法来减少记忆使用时间和推理时间,但是由于离群值在激活中的流行,LLM会带来独特的挑战 ...