一译 —— 文档和论文翻译、对照阅读、讨论和社区

Wafer-Scale Fast Fourier Transforms

我们已经在小脑CS-2上实现了一个，两个和三维阵列的快速傅立叶变换，该系统的内存和处理元素位于单个硅晶圆上。晶圆尺度发动机（WSE）涵盖了大约850,000个处理元件（PES）的二维网格，并具有快速的本地内存和同样快速的邻近互连。我们的晶圆尺度FFT（WSFFT）并行了一个$ n^3 $的问题，最多$ n^2 $ pes ...

0 0 0 2025/04/23 arXiv:2209.15040v1 hwrabbit

Progressive Semantic-Guided Vision Transformer for Zero-Shot Learning

零射击学习（ZSL）通过进行视觉语义相互作用将语义知识从可见的类传递到看不见的类别（例如语义信息（例如属性）），从而识别出了看不见的类 ...

0 0 0 2025/04/23 arXiv:2404.07713v2 wonders

DropGaussian: Structural Regularization for Sparse-view Gaussian Splatting

最近，由于其快速性能，同时产生了出色的图像质量，因此3D高斯脱落（3DGS）在新型视图综合领域引起了相当大的关注。但是，稀疏视图设置中的3DG（例如 ...

0 0 0 2025/04/23 arXiv:2504.00773v1 13886416427

Cerebras-GPT: Open Compute-Optimal Language Models Trained on the Cerebras Wafer-Scale Cluster

我们研究最新的研究进展，小脑-GPT，这是一系列开放式计算最优语言模型，参数范围从111M扩展到13B。我们按照深阵阵Chinchilla缩放规则在Eleuther PILE数据集上训练小脑gpt模型，以实现高效的预训练（给定计算预算的最高准确度，以实现高效的预训练（给定计算预算的最高准确度）... ...

0 0 0 2025/04/23 arXiv:2304.03208v1 huwenxing

Guiding Vision-Language Model Selection for Visual Question-Answering Across Tasks, Domains, and Knowledge Types

视觉提问（VQA）（VQA）已成为多种应用程序中的关键用例，以帮助用户体验，尤其是在视觉语言模型（VLMS）在零摄像中取得良好结果之后。但是，在实际设置中使用标准化框架评估不同的VLM为应用程序要求仍然具有挑战性。本文介绍了一个综合框架，用于评估在实际设置中针对VQA任务量身定制的VLM ...

0 0 0 2025/04/23 arXiv:2409.09269v3 zl1994

UniAnimate: Taming Unified Video Diffusion Models for Consistent Human Image Animation

最近基于扩散的人类图像动画技术在合成视频方面取得了令人瞩目的成功，这些视频忠实地遵循给定的参考身份和一系列所需的运动姿势。尽管如此，仍然存在两个限制：i（i），需要额外的参考模型来将身份图像与主视频分支对齐，这显着增加了优化负担和模型参数； ii）生成的视频通常时间较短（例如 ... ...

0 0 0 2025/04/23 arXiv:2406.01188v1 ForrestPi

Protecting Your Video Content: Disrupting Automated Video-based LLM Annotations

最近，基于视频的大型语言模型（基于视频的LLM）在各种视频理解任务中取得了令人印象深刻的表现。但是，这种快速的进步引起了严重的隐私和安全问题，特别是关于在基于视频的LLM的自动注释中未经授权使用的个人视频数据的使用。然后可以使用这些未经授权的注释的视频文本对来改善下游任务的性能，例如文本到视频生成 ...

0 0 0 2025/04/23 arXiv:2503.21824v1 woodman

Improving Automatic VQA Evaluation Using Large Language Models

视觉问答（（VQA））任务提出8年后，准确性仍然是自动评估的主要指标。迄今为止，VQA精度在iid评估设置中一直有效。然而，我们的社区正在经历向开放式生成模型和ood评估的转变... ...

0 0 0 2025/04/23 arXiv:2310.02567v2 meimei0211

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）