更新内容:
- 16k 上下文 3.5 Turbo 模型(今天向所有人提供)
- 新的 GPT-4 和 3.5 Turbo 模型
- Chat Completions API 中的新函数调用功能
- V2 嵌入模型降价 75%
- GPT-4的API权限将开放给更多的人
GPT-4的模型
gpt-4-0613 包括一个更新和改进的模型,带有函数调用。gpt-4-32k-0613 包括与 gpt-4-0613 相同的改进,同时上下文长度再度扩展,以便更好地理解更大的文本。
未来几周内邀请候补名单中的更多人试用 GPT-4,直到完全删除候补名单
新的GPT-3.5 Turbo和16K模型
gpt-3.5-turbo-0613 包括与 GPT-4 相同的函数调用以及通过系统消息提供的更可靠的可控性。
gpt-3.5-turbo-16k 的16k 上下文意味着该模型现在可以在单个请求中支持约 20 页文本。
Function calling 函数调用
开发人员现在可以向 gpt-4-0613 和 gpt-3.5-turbo-0613 描述函数,并让模型智能地选择输出包含调用这些函数的参数的 JSON 对象。这是一种更可靠地将 GPT 功能与外部工具和 API 连接的新方法。
这些模型已经过微调,可以检测何时需要调用函数(取决于用户的输入)并使用符合函数签名的 JSON 进行响应。函数调用允许开发人员更可靠地从模型中获取结构化数据。例如,开发人员可以:
- 创建通过调用外部工具(例如 ChatGPT 插件)来回答问题的聊天机器人。
- 将自然语言转换为 API 调用或数据库查询
- 从文本中提取结构化数据
模型降价
text-embedding-ada-002 将成本降低 75% 至每 1K Token 0.0001 美元。gpt-3.5-turbo-16k 的定价为每 1K 输入Token 0.003 美元,每 1K 输出Token 0.004 美元。gpt-3.5-turbo’s 输入Token的成本降低了 25%
两个模型已经被弃用
将开始对 3 月份宣布的 gpt-4 和 gpt-3.5-turbo 初始版本进行升级和弃用。使用稳定模型名称( gpt-3.5-turbo 、 gpt-4 和 gpt-4-32k )的应用程序将在 6 月 27 日自动升级到上面列出的新模型。为了比较版本之间的模型性能, Evals 库支持公共和私有评估,以显示模型更改将如何影响你的用例。
这些旧模型将在 9 月 13 日之前开放,之后指定这些模型名称的请求将失败。