一译 —— 文档和论文翻译、对照阅读、讨论和社区

OpenEP: Open-Ended Future Event Prediction

未来的事件预测（FEP）是世界上长期且至关重要的任务，因为理解事件的演变可以使早期的风险识别，知情的决策和战略计划。现有工作通常将事件预测视为分类任务，并将未来事件的结果限制在固定范围中，例如是/否问题，候选人集和分类学，这很难包括未来事件的所有可能结果。在本文中，我们介绍了OpenEP（一项开放式的未来事件预测任务），它产生了与现实世界情景相符的灵活和多样的预测 ...

0 0 0 2025/09/19 arXiv:2408.06578v2 xuexizhanghao

Comparing LLM-generated and human-authored news text using formal syntactic theory

这项研究提供了六种大型语言模型与真实的，由人为著名的纽约时报撰写产生的纽约时报式文本的首次全面比较。比较基于形式的句法理论。我们使用头驱动的短语结构语法（HPSG）来分析文本的语法结构 ...

0 0 0 2025/09/19 arXiv:2506.01407v1 15966829631

Benchmarking Large Language Models on CFLUE -- A Chinese Financial Language Understanding Evaluation Dataset

鉴于彻底改变了自然语言处理（NLP）的大型语言模型（LLM）的最新突破，迫切需要新的基准测试以与LLM的快速发展保持同步。在本文中，我们提出了中国财务语言理解评估基准CFLUE，旨在评估LLM在各个方面的能力。具体而言，CFLUE提供了针对知识评估和应用评估的量身定制的数据集 ...

0 0 0 2025/09/19 arXiv:2405.10542v1 hxh123

eIQ Neutron: Redefining Edge-AI Inference with Integrated NPU and Compiler Innovations

神经处理单元（NPU）是在资源受限的边缘环境中有效推断AI推断的关键。虽然峰值TERA操作每秒（顶部）通常用于衡量性能，但它反映了现实世界的性能，通常与较高的硅成本相关。为了解决这个问题，建筑师必须专注于最大化计算利用率，而无需牺牲灵活性 ...

0 0 0 2025/09/19 arXiv:2509.14388v1 13057594548

LLMServingSim: A HW/SW Co-Simulation Infrastructure for LLM Inference Serving at Scale

最近，在建立有效的大语言模型（LLM）推理系统方面进行了广泛的研究工作。这些努力不仅包括算法和软件域中的创新，而且还构成了各种硬件加速技术的发展。然而，缺乏模拟基础架构能够在LLM服务系统中精确建模多功能硬件软件行为，而无需大量延长仿真时间 ...

0 0 0 2025/09/19 arXiv:2408.05499v1 tongxianhui

AgentGen: Enhancing Planning Abilities for Large Language Model based Agent via Environment and Task Generation

大型基于语言模型的代理人引起了极大的关注，并且越来越受欢迎。此外，规划能力是基于LLM的代理的关键组成部分，该代理通常需要从初始状态实现所需的目标。本文通过教学调整调查了LLM的计划能力，称为代理培训 ...

0 0 0 2025/09/19 arXiv:2408.00764v3 zhufeizzz

What is "Spatial" about Spatial Computing?

地理信息系统和混合现实技术的最新进展将空间计算定位为计算科学中的变革范式。然而，该领域在概念上仍然存在分散，在人类互动，地理信息科学和计算机科学等学科之间进行了多种解释，这阻碍了人们对空间计算的全面理解，并为其连贯的进步和跨学科整合带来了挑战。在本文中，我们追踪了空间计算的起源和历史演变，并研究了如何理解“空间”，并确定了两个思想流派：“空间”是对空间的上下文理解，而空间数据指导物理世界中的相互作 ...

0 0 0 2025/09/19 arXiv:2508.20477v2 kkkk

Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4

本文介绍了26条指导原则，旨在简化大型语言模型的查询和提示过程。我们的目标是简化为不同规模的大型语言模型制定问题的基本概念，检查其能力，并增强用户在输入不同提示时对不同规模的大型语言模型的行为的理解。在llama-1/2 （7b、13b和70b（70b），gpt-3上进行了大量实验... ...

0 1 0 2025/09/19 arXiv:2312.16171v2 江寒

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）