书生·万卷:2TB多模态语料库

工具软件1年前 (2023)发布 AI观察员
131 0 0

书生·万卷:2TB多模态语料库

上海人工智能实验室联合中央广播电视总台、人民网、国家气象中心、中国科学技术信息研究所、上海报业集团、上海文广集团等语料数据联盟成员,共同开源发布 “书生・万卷” 1.0 多模态预训练语料。“书生・万卷” 1.0 目前包含文本数据集、图文数据集、视频数据集三部分,本次开源的数据总量超过 2TB。

书生·万卷:2TB多模态语料库

© 版权声明

相关文章

天猫U特购  京东优惠购        京东优惠    天猫优惠