最先进的封闭模型将继续以显著优势胜过最先进的开放模型

工具软件3年前 (2023)发布 AI观察员

574 0 0

最先进的封闭模型将继续以显著优势胜过最先进的开放模型

当今人工智能讨论中的一个重要话题是围绕开源和闭源人工智能模型的辩论。虽然大多数尖端人工智能模型开发者——如OpenAI、Google DeepMind、Anthropic、Cohere等——保留其最先进的模型的专有权，但包括Meta和备受关注的新创企业Mistral在内的少数公司选择公开其最先进的模型权重。

如今，性能最优秀的基础模型（例如OpenAI的GPT-4）是闭源的。但许多开源倡导者认为，闭源和开源模型之间的性能差距正在缩小，开源模型有望在性能上超越闭源模型，也许在明年之前。（最近这张图表广为流传。）

我们不同意。我们预测，最好的封闭模型将在2024年（以及以后）继续显著优于最好的开放模型。

基于基础模型性能的最新技术是一个快速发展的前沿。Mistral最近宣称将在2024年某个时候开源一个GPT-4级别的模型，这一说法在开源社区引起了激动。但OpenAI在2023年初就发布了GPT-4。等Mistral推出这个新模型时，很可能已经落后了一年以上。届时，OpenAI很可能已经发布了GPT-4.5甚至GPT-5，开创了全新的性能前沿。（有传言称GPT-4.5甚至可能在2023年年底之前发布。）

在许多其他领域一样，跟随者在另一组人定义了前沿之后追赶前沿要比在任何人展示可能之前建立新的前沿更容易实现。例如，OpenAI在此前未有人展示这种规模下的专家混合架构可行之前构建GPT-4是相当冒险、具有挑战性和昂贵的，而Mistral在几个月后跟随OpenAI的步伐使用自己的专家混合模型要容易得多。

有一个基本的结构性原因让人怀疑开放模型在2024年会超越封闭模型的性能。开发一个推动技术前沿的新模型所需的投资是巨大的，并且随着模型能力的每一次跨越式增长，这种投资只会不断膨胀。一些行业观察者估计OpenAI将花费大约20亿美元来开发GPT-5。

Meta是一家上市公司，最终要对股东负责。该公司似乎并不指望从其开源模型发布中获得直接收入。据报道，Llama 2的建造成本约为2000万美元；即使没有任何相关的收入增长，这种投资水平也可能是合理的，考虑到战略利益。但Meta真的会投入近20亿美元来建立一个超越现有任何其他模型的人工智能模型，然后开源它，而不指望有任何具体的投资回报吗？

像Mistral这样的新兴公司面临着类似的困境。开源基金会模式没有明确的收入模式（正如Stability AI已经吃过苦头）。例如，为托管开源模型收费最终会变成价格战，就像我们最近在Mistral的新Mixtral模型中看到的那样。因此，即使Mistral有数十亿美元来构建一个超越OpenAI的新模型，它真的会选择把该模型免费提供吗？

我们隐约感觉到，随着像Mistral这样的公司投入越来越多的资金来构建更强大的人工智能模型，他们可能会放松对开源的立场，将他们最先进的模型保留为专有，以便收费。

要明确一点：这并不是反对开源人工智能的优点的论点。这也不是说开源人工智能在未来的人工智能世界中不重要。相反，我们预计开源模型将在未来几年中在人工智能的普及中发挥关键作用。然而：我们预测，最先进的人工智能系统，那些推动人工智能可能性边界的系统，将继续是专有的。