数据驱动的讲故事是一种通过将叙事技术与可视化和文本相结合来传达见解的有力方法。这些故事整合了视觉辅助工具,例如图表中突出显示的条形和线条,以及解释见解的文本注释。但是,创建这样的故事需要对数据和细致的叙事计划有深入的了解,通常需要进行人类干预,这可能是耗时的,并且在精神上征税 ...
0 0 0 2025/03/07 arXiv:2408.05346v3 大红豆
根据自然语言问题生成准确的 SQL(文本到 SQL)是一个长期存在的问题,因为它在用户问题理解、数据库模式理解和 SQL 生成方面具有挑战性。传统的文本到 SQL 系统包括人体工程学和深度神经网络。随后,预训练语言模型 (PLM) 被开发出来并用于文本到 SQL 任务,取得了可喜的性能 ...
0 0 0 2025/03/07 arXiv:2406.08426v4 jinyu_meng
仪表板在单个显示上包含多个视图,有助于同时分析和交流数据的多个观点。但是,创建有效而优雅的仪表板是具有挑战性的,因为它需要仔细的逻辑布置以及多种可视化的协调。为了解决问题,我们提出了一种数据驱动的方法,用于仪表板和自动化仪表板组织的采矿设计规则 ...
0 0 0 2025/03/07 arXiv:2209.01599v2 大红豆
视频段落字幕旨在生成一个未修剪视频的多句子描述,其中有几个时间事件位置在连贯的讲故事中。遵循人类的感知过程,通过将场景分解为视觉,可以有效地理解场景(例如 ...
0 0 0 2025/03/07 arXiv:2211.15103v2 argbunint256
具有非线性特征变换的广义线性模型广泛用于具有稀疏输入的大规模回归和分类问题。通过一系列广泛的跨产品特征转换来记忆特征交互是有效且可解释的,而泛化则需要更多的特征工程工作。通过较少的特征工程,深度神经网络可以通过为稀疏特征学习的低维密集嵌入更好地泛化到未见过的特征组合... ...
0 0 0 2025/03/07 arXiv:1606.07792v1 123123124
自然语言处理的进步彻底改变了我们与数据库等数字信息系统互动的方式,使它们更容易访问。但是,挑战仍然存在,尤其是在准确性至关重要的情况下,例如在生物医学领域。一个关键问题是幻觉问题,其中模型生成了基础数据不支持的信息,这可能导致危险的错误信息 ...
0 0 0 2025/03/07 arXiv:2409.04181v2 18232448525
熟练的汇总模型应表现出灵活性 - 处理一系列内域摘要任务的能力以及适应性 - 获得新知识并适应未见范围的范围任务的能力。与通过参数缩放实现这一目标的大型语言模型(LLM)不同,我们在本研究中提出了一种更有效的方法。我们的动机基于这样的原则,即可以在不同的任务上共享捕获显着信息的一般摘要能力,而特定领域的摘要能力则需要明显和量身定制 ...
0 0 0 2025/03/07 arXiv:2406.05360v1 jackson118
当使用探索性视觉分析检查多元分层数据时,用户通常需要查询数据以缩小分析范围。但是,制定有效的查询表达式仍然是多元分层数据的挑战,尤其是当数据集变得非常大时。为了解决此问题,我们开发了声明性语法Hiregex(层次数据正则表达式),以查询和探索多元分层数据 ...
0 0 0 2025/03/07 arXiv:2408.06601v1 大红豆

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)