parsifalster的文档

parsifalster

个性签名 ...

TensorLog: A Differentiable Deductive Database

大型知识库（KB）在许多任务中都很有用，但目前尚不清楚如何将此类知识集成到“深度”基于梯度的学习系统中。为了解决这个问题，我们描述了一个称为 TensorLog 的概率演绎数据库，其中推理使用可微过程。在 TensorLog 中，逻辑理论中的每个子句首先被转换为某种类型的因子图 ...

0 0 0 0 2024/06/16 arXiv:1605.06523v2 parsifalster

A tensorized logic programming language for large-scale data

我们引入了一种基于张量嵌入的新逻辑编程语言 T-PRISM。我们的嵌入方案是对 PRISM（最先进的概率逻辑编程语言之一）中分布语义的修改，通过用多维数组替换分布函数，即 ...

0 0 0 0 2024/06/16 arXiv:1901.08548v1 parsifalster

A Plug-in Tiny AI Module for Intelligent and Selective Sensor Data Transmission

物联网 (IoT) 中的应用利用机器学习来分析传感器生成的数据。然而，一个主要挑战在于当前传感系统缺乏有针对性的智能，导致大量数据生成并增加计算和通信成本。为了应对这一挑战，我们提出了一种新颖的传感模块，通过集成放置在传感器附近的高效机器学习模型，为传感框架配备智能数据传输功能 ...

0 0 0 0 2024/06/16 arXiv:2402.02043v1 parsifalster

The Deep Learning Compiler: A Comprehensive Survey

在不同的 DL 硬件上部署各种深度学习 (DL) 模型的难度推动了社区对 DL 编译器的研究和开发。业界和学术界已经提出了几种深度学习编译器，例如 Tensorflow XLA 和 TVM。类似地，深度学习编译器将不同深度学习框架中描述的深度学习模型作为输入，然后为不同的深度学习硬件生成优化的代码作为输出 ...

0 0 0 0 2024/06/14 arXiv:2002.03794v4 parsifalster

TensorIR: An Abstraction for Automatic Tensorized Program Optimization

在各种设备上部署深度学习模型已成为一个重要课题。硬件专业化浪潮为多维张量计算带来了多种加速原语。这些新的加速原语以及新兴的机器学习模型带来了巨大的工程挑战 ...

0 0 0 0 2024/06/14 arXiv:2207.04296v2 parsifalster

The CoRa Tensor Compiler: Compilation for Ragged Tensors with Minimal Padding

用于深度学习的输入数据的形状和大小通常存在变化。在许多情况下，此类数据可以使用形状不均匀的张量或参差不齐的张量来表示。由于对不规则张量的高效执行的支持有限且不可移植，当前的深度学习框架通常使用填充和掩码等技术来使数据形状统一，然后将计算卸载到优化内核以实现稠密张量代数 ...

0 0 0 0 2024/06/11 arXiv:2110.10221v3 parsifalster

Bring Your Own Codegen to Deep Learning Compiler

深度神经网络（DNN）已广泛应用于许多应用中，加速器的出现成为支持这些应用快速高效的推理任务的推动者。然而，为了实现高模型覆盖率和高性能，每个加速器供应商都必须开发完整的编译器堆栈来摄取、优化和执行 DNN。这给软件堆栈的开发和维护带来了重大挑战 ...

0 0 0 0 2024/06/11 arXiv:2105.03215v1 parsifalster

UNIT: Unifying Tensorized Instruction Compilation

由于 DNN 中计算的需求不断增加，研究人员开发了硬件和软件机制来减少计算和内存负担。一种广泛采用的方法是使用混合精度数据类型。然而，由于数据转换的开销，在没有硬件支持的情况下很难利用混合精度 ...

0 0 0 0 2024/06/11 arXiv:2101.08458v3 parsifalster

Cortex: A Compiler for Recursive Deep Learning Models

优化深度学习模型通常分两个步骤进行：(i) 高级图优化，例如内核融合；(ii) 低级内核优化，例如供应商库中的优化。这种方法通常会带来显着的性能损失，特别是对于递归深度学习模型的情况。在本文中，我们提出了 Cortex，这是一种基于编译器的方法，可为递归模型生成高效代码以实现低延迟推理 ...

0 0 0 0 2024/06/11 arXiv:2011.01383v2 parsifalster

Nimble: Efficiently Compiling Dynamic Neural Networks for Model Inference

现代深度神经网络越来越多地利用动态控制流、数据结构和动态张量形状等特征。现有的深度学习系统侧重于优化和执行静态神经网络，静态神经网络假设预先确定的模型架构和输入数据形状，而动态神经网络违反了这些假设。因此，使用深度学习系统执行动态模型目前即使不是不可能，也是不灵活且次优的 ...

0 0 0 0 2024/06/11 arXiv:2006.03031v2 parsifalster