AI 是如何工作的

工具软件2年前 (2024)发布 AI观察员

506 0 0

AI 是如何工作的

Nir Zicherman在他的文章中，用非技术性的语言解释了大型语言模型（LLMs）的工作原理，他采用了烹饪和菜单规划的类比来简化这些概念。Zicherman擅长将复杂的技术概念深入浅出地解释给非技术受众，他将这一过程分为两个主要步骤：构建食物模型和发现模式。

在“构建食物模型”的步骤中，目标是教会计算机如何将食物作为数据来处理，而不依赖于口味或食物搭配等定性细节。这一过程通过向计算机输入大量关于过去菜肴搭配的数据来完成，使计算机能够根据菜肴之间的共现频率对它们进行分类。这样就形成了一个“菜肴空间”，在这个空间里，根据共现模式，相似的菜肴被归为一组，而不同的菜肴则相隔较远。

第二步“发现模式”则涉及训练模型预测哪种菜肴最能补充一套特定的菜肴组合。模型依据其从数据中学习到的模式，使用这个“菜肴空间”来确定最适合完成一顿餐的菜肴类型。

将这个比喻应用到LLMs上，Zicherman建议把食物换成句子，把菜肴换成单词。训练过程包括理解单词之间基于上下文的关系，以及发现用于预测句子中下一个最可能出现的单词的模式。这实际上是文本AI工具的基本操作——“下一个单词预测”。

文章强调，尽管AI具有变革性潜力，但其基础原理并不复杂。它涉及简单的数学概念、大量的训练数据，以及找出数据中的模式以模拟机器的“思维”过程。Zicherman在文章最后指出，只要正确解释，AI技术其实是易于理解和简单的，这意味着它并不像许多人所想的那样难以接近。

# 工具软件