arxiv的文档

arxiv 南京

个性签名 ...

YOLO-Z: Improving small object detection in YOLOv5 for autonomous vehicles

随着自动驾驶汽车和自主赛车的普及，需要更快，更准确的探测器的需求也会上升。尽管我们的裸眼几乎能够立即提取上下文信息，即使是从遥远的角度来看，图像分辨率和计算资源的限制使检测到较小的对象（即，在输入图像中占据了一个小像素区域的对象）是机器和广泛开放的研究领域真正具有挑战性的任务。这项研究探讨了如何修改流行的Yolov5对象检测器，以提高其在自主赛车中的特定应用中检测较小物体的性能 ...

0 0 0 0 2025/07/27 arXiv:2112.11798v4 18165929621

A Chat About Boring Problems: Studying GPT-based text normalization

文本归一化 - 文本从书面形式的转换 - 传统上被认为是语言模型的不良任务。在这项工作中，我们辩称。我们从经验上展示了在几个场景中大型语言模型（LLM）在文本归一化方面的能力 ...

0 0 0 0 2025/07/27 arXiv:2309.13426v2 林夕2

HybridFlow: Infusing Continuity into Masked Codebook for Extreme Low-Bitrate Image Compression

本文调查了具有极低比特率的学习图像压缩（LIC）的具有挑战性的问题。由于严重的量化损失，基于传输量化的连续特征的先前LIC方法通常会导致模糊和嘈杂的重建。虽然以前的LIC方法是基于离散视觉空间的学习的代码手册，通常由于有限的代码字的代表力不足而在捕获忠实的细节方面具有不足的代表权，因此通常会产生不良的重建 ...

0 0 0 0 2025/07/27 arXiv:2404.13372v1 1150501302

Systematic Literature Review on Cyber Situational Awareness Visualizations

网络威胁的动态越来越复杂，使组织对其网络安全状况的深入了解比以往任何时候都更具挑战性。因此，组织依靠网络情境意识（CSA）来更好地了解网络事件的威胁和相关影响。由于网络安全数据的异质性和复杂性通常具有多维属性，因此需要复杂的可视化技术来实现CSA ...

0 1 0 0 2025/07/27 arXiv:2112.10354v3 simple_donk

Nabla-R2D3: Effective and Efficient 3D Diffusion Alignment with 2D Rewards

在3D视觉和计算机图形中，产生高质量和逼真的3D资产仍然是一个长期的挑战。尽管最新的生成模型（例如扩散模型）在3D代中取得了重大进展，但由于有限的能力遵循指示，与人类的偏好相一致或产生现实的纹理，几何形状和物理属性，因此它们通常缺乏人为设计的内容。在本文中，我们介绍了Nabla-R2D3，这是一种使用2D奖励的3D本地扩散模型的高效和样品的增强学习对准框架 ...

0 0 0 0 2025/07/27 arXiv:2506.15684v1 yuliangliu

A Survey on Immersive Cyber Situational Awareness Systems

网络情境意识系统越来越多地用于创建网络共同的操作图片，用于网络安全分析和教育。但是，由于网络安全数据的复杂性，维度和异质性，这些系统面临数据阻塞和卷积问题，这会损害最终用户的网络情况意识（SA）。此外，在分析大型基础设施的网络情况时，人类计算机相互作用的常规方式，例如小鼠和键盘，增加了网络安全从业者的心理努力和认知负荷 ...

0 1 0 0 2025/07/27 arXiv:2408.07456v1 simple_donk

Causal-Copilot: An Autonomous Causal Analysis Agent

因果分析在科学发现和可靠的决策中起着基础作用，但是由于其概念性和算法的复杂性，它在领域专家中仍然很大程度上无法接近。因果方法与实践可用性之间的这种脱节提出了双重挑战：领域专家无法利用因果学习的最新进展，而因果研究人员缺乏广泛的现实世界部署来测试和完善其方法。为了解决这个问题，我们介绍了一种自治药物因果关系，它在大型语言模型框架内运行专家级别的因果分析 ...

0 0 0 0 2025/07/27 arXiv:2504.13263v2 waterfall666

Survey on Models and Techniques for Root-Cause Analysis

支持复杂人类决策的自动化和计算机智能对于管理云和物联网时代的大型和分布式系统至关重要。几十年来，了解复杂系统中观察到的症状的根本原因一直是一个主要问题。随着行业深入物联网世界，每年生成的数据量以惊人的速度增长，一个重要的问题是如何找到适当的机制来确定可以处理大量数据或可以实时提供有价值的反馈的根本原因 ...

0 0 0 0 2025/07/27 arXiv:1701.08546v2 waterfall666

RoboScape: Physics-informed Embodied World Model

世界模型已成为具有体现智能的必不可少的工具，它是能够生成逼真的机器人视频的强大模拟器，同时解决关键数据稀缺挑战。但是，当前的体现世界模型表现出有限的身体意识，尤其是在建模3D几何和运动动力学中，从而导致了不切实际的视频生成，用于富裕的机器人场景。在本文中，我们提出了Roboscape，这是一种统一的物理学世界模型，该模型共同学习集成框架内的RGB视频生成和物理知识 ...

0 1 0 0 2025/07/27 arXiv:2506.23135v1 wangshii

Large Language Models for Cyber Security: A Systematic Literature Review

大型语言模型（LLM）的快速发展为在包括网络安全在内的各个领域利用人工智能开辟了新的机会。随着网络威胁的数量和复杂性不断增长，对能够自动检测漏洞、分析恶意软件和响应攻击的智能系统的需求也越来越大。在本次调查中，我们对 LLM 在网络安全中的应用（LLM4Security）的文献进行了全面的回顾 ...

0 1 0 0 2025/07/27 arXiv:2405.04760v4 simple_donk