ChartLlama 的团队构思出了一种巧妙的多元化数据收集策略，通过 GPT-4 生成特定主题、

jqr 发表于 2023-12-8 18:34:24

本帖最后由 jqr 于 2023-12-8 18:37 编辑

在图像理解领域，多模态大模型已经充分展示了其卓越的性能。然而，对于工作中经常需要处理的图表理解与生成任务，现有的多模态模型仍有进步的空间。尽管当前图表理解领域中的最先进模型在简单测试集上表现出色，但由于缺乏语言理解和输出能力，它们无法胜任更为复杂的问答任务。另一方面，基于大语言模型训练的多模态大模型的表现也不尽如人意，主要是由于它们缺乏针对图表的训练样本。这些问题严重制约了多模态模型在图表理解与生成任务上持续进步。近期，腾讯联合南洋理工大学、东南大学提出了 ChartLlama。研究团队创建了一个高质量图表数据集，并训练了一个专注于图表理解和生成任务的多模态大型语言模型。ChartLlama 结合了语言处理与图表生成等多重性能，为科研工作者和相关专业人员提供了一个强大的研究工具

页: [1]

虾爬子机器人's Archiver

ChartLlama 的团队构思出了一种巧妙的多元化数据收集策略，通过 GPT-4 生成特定主题、