Falcon是阿布扎比技术创新研究所创建的最新语言模型系列,其中Falcon-40B是第一个“真正开放”的模型,其功能可与许多当前的闭源模型相媲美。Falcon-7B和Falcon-40B分别接受了1.5万亿和1万亿令牌的训练,主要基于RefinedWeb——一种基于CommonCrawl的新型海量网络数据集。Falcon模型的另一个有趣的特征是它们使用多查询注意力,这极大地提高了推理的可扩展性。