zengyanxiang的文档

zengyanxiang

个性签名 ...

On the Opportunities and Challenges of Offline Reinforcement Learning for Recommender Systems

强化学习是在推荐系统中对动态用户兴趣进行建模的有效工具，最近引起了越来越多的研究关注。然而，一个显着的缺点仍然存在：由于其交互性，其数据效率较差。基于强化学习的推荐系统的训练需要昂贵的在线交互来积累足够的轨迹，这对于代理了解用户偏好至关重要 ...

0 0 0 0 2024/09/27 arXiv:2308.11336v1 zengyanxiang

GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models

最近，扩散模型已被证明可以生成高质量的合成图像，特别是与引导技术结合使用时，可以在多样性和保真度之间进行权衡。我们探索了文本条件图像合成问题的扩散模型，并比较了两种不同的引导策略：CLIP 引导和无分类器引导。我们发现后者在照片真实感和标题相似性方面受到人类评估者的青睐，并且通常会产生照片真实感样本 ...

0 0 0 0 2024/09/27 arXiv:2112.10741v3 zengyanxiang

Bias and Debias in Recommender System: A Survey and Future Directions

尽管近年来有关推荐系统（RS）的研究论文迅速增长，但大多数论文都专注于发明机器学习模型以更好地适应用户行为数据。然而，用户行为数据是观察性的而不是实验性的。这使得数据中广泛存在各种偏差，包括但不限于选择偏差、位置偏差、曝光偏差和流行度偏差 ...

0 0 1 1 2024/09/26 arXiv:2010.03240v2 zengyanxiang

ISimDL: Importance Sampling-Driven Acceleration of Fault Injection Simulations for Evaluating the Robustness of Deep Learning

深度学习 (DL) 系统在许多应用中激增，需要专门的硬件加速器和芯片。在纳米时代，设备变得越来越容易出现永久性和暂时性故障。因此，我们需要一种有效的方法来分析先进的深度学习系统针对此类故障的恢复能力，并了解神经加速器芯片中的故障如何在深度学习应用程序级别表现为错误，其中错误可能导致不可检测和不可恢复的错误 ...

0 0 0 0 2024/09/26 arXiv:2303.08035v2 zengyanxiang

Sample Selection Bias in Machine Learning for Healthcare

虽然机器学习算法有望实现个性化医疗，但其临床应用仍然有限。造成这种限制的一个关键因素是样本选择偏差（SSB），它是指研究人群对目标人群的代表性较差，从而导致有偏见和潜在有害的决策。尽管 SSB 在文献中广为人知，但在医疗保健机器学习领域仍然很少进行研究 ...

0 0 0 0 2024/09/25 arXiv:2405.07841v1 zengyanxiang

Smooth Min-Max Monotonic Networks

单调性约束是统计建模中强大的正则化器。它们可以支持计算机辅助决策的公平性，并提高数据驱动的科学模型的合理性。开创性的最小最大 (MM) 神经网络架构可确保单调性，但由于 MM 非线性的偏导数为零，因此在训练过程中经常陷入不期望的局部最优 ...

0 0 0 0 2024/09/24 arXiv:2306.01147v3 zengyanxiang

How to Incorporate Monotonicity in Deep Networks While Preserving Flexibility?

领域知识对于增强模型性能和在现实世界中做出可靠预测的重要性至关重要。这导致人们更加关注特定模型属性的可解释性。我们专注于整合单调趋势，并提出了一种新颖的基于梯度的逐点损失函数，用于通过深度神经网络强制执行部分单调性 ...

0 0 0 0 2024/09/24 arXiv:1909.10662v3 zengyanxiang

Constrained Monotonic Neural Networks

由于需要解释其预测并对其施加额外的限制，神经网络在金融和医疗保健等许多关键领域的更广泛采用受到阻碍。单调性约束是现实场景中最需要的属性之一，也是本文的重点。构建单调全连接神经网络最古老的方法之一是限制其权重的符号 ...

0 0 0 0 2024/09/24 arXiv:2205.11775v4 zengyanxiang

RILe: Reinforced Imitation Learning

强化学习在生成复杂行为方面取得了巨大成功，但通常需要大量的奖励函数工程。模仿学习和逆强化学习的对抗变体提供了一种替代方案，通过判别器从专家演示中学习策略。与标准方法相比，使用判别器可以提高数据和计算效率；然而，这会导致对专家数据缺陷的敏感性 ...

0 0 0 0 2024/09/24 arXiv:2406.08472v1 zengyanxiang

Variational Inference: A Review for Statisticians

现代统计学的核心问题之一是近似难以计算的概率密度。这个问题在贝叶斯统计中尤其重要，贝叶斯统计将所有关于未知量的推断框架为涉及后验密度的计算。在本文中，我们回顾了变分推理（VI），这是一种通过优化来近似概率密度的机器学习方法 ...

0 1 0 0 2024/09/21 arXiv:1601.00670v9 zengyanxiang