字节联手中科大推出统一表格理解大模型 TabPedia,它整合了不同处理表格任务的专有模型,通过概念协同机制实现多任务、多源信息协作。该模型可在测试数据集上精准识别表格位置和结构,无需裁剪识别多表格结构,在表格问答任务中能给出正确答案和理由,在实战多种开放场景中表现优异。作者还构建了复杂的 TQA 数据集 ComTQA,并介绍了 TabPedia 的实现方式,包括高低分辨率分别训练、开源数据集与合成数据共同训练等,同时指出了目前存在的挑战和未来探索方向。
论文地址:
https://arxiv.org/pdf/2406.01326
ComTQA数据集:
https://huggingface.co/datasets/ByteDance/ComTQA
本站文章通过互联网转载或者由本站编辑人员搜集整理发布,如有侵权,请联系本站删除。