ChatGPT 上线
2022 年 11 月 30 日,OpenAI 向全世界免费推出了 ChatGPT,作为研究预览的一部分。在短短两个月的时间里,它积累了超过1亿的月度用户,成为世界上增长最快的服务,甚至超过了Facebook。
与普通用户似乎遥不可及的抽象人工智能概念不同,ChatGPT 最终允许用户在友好的网络界面中与人工智能驱动的聊天机器人进行交互。
ChatGPT 被训练为对话式的,它是建立在 OpenAI 的 GPT-3.5 模型之上的。在某种程度上,它类似于 InstructGPT,它按照用户指令给出响应。然而,ChatGPT 经过训练,可以与用户进行对话,同时考虑到上下文。OpenAI 在其开幕博客中指出,
ChatGPT 有时会写出听起来似是而非但不正确或荒谬的答案
幻觉是建立在 GPT-3.5 模型之上的 ChatGPT 初始版本的一个具有挑战性的问题。然而,随着 GPT-4 模型的推出(更多内容见下文),OpenAI 已设法显着减少了事实不正确的响应。
至于 ChatGPT 的炒作,当该服务推出时,人工智能聊天机器人似乎将杀死谷歌搜索和其他各种在线产品。我们甚至在 YouTube 视频中将 ChatGPT 与 Google 搜索进行对比。现在一年过去了,感觉这只是人工智能时代的开始,还有很多新产品有待发现。
推出 AI 分类器以检测 AI 编写的文本
ChatGPT迅速声名鹊起,它特别擅长创造性的任务,如撰写学术论文、撰写营销邮件,甚至创建错误信息活动等。看到网络上人工智能书写的文本激增,迫切需要人工智能抄袭检测器和文本检查器。
因此,在 ChatGPT 推出两个月后,OpenAI 发布了一款官方的 AI 分类器工具,以帮助人们区分 AI 和人类编写的文本。
然而,在 7 月,OpenAI 以准确率低为由悄悄关闭了该服务。如果您需要这样的工具,您可以查看我们的最佳 AI 抄袭检查器列表。然而,在那里,我们已经清楚地提到,人工智能驱动的抄袭工具经常给出误报和不一致的结果。
因此,即使在 ChatGPT 发布一年后,正确识别 AI 书写文本的努力仍在继续。
ChatGPT Plus 订阅上线
2023 年 2 月,在发布四个月后,OpenAI 决定是时候从炒作中获利并建立一个忠诚和付费的社区了。因此,它以每月 20 美元的价格推出了第一个名为 ChatGPT Plus 的订阅计划。
首次推出时,ChatGPT+ 允许用户即使在高峰时段也能以更快的响应时间访问聊天机器人。此外,aChatGPT Plus 用户将在未来几个月内抢先体验新功能和改进。最初,订阅计划仅适用于美国客户,后来扩展到世界各地的用户。
ChatGPT API 为开发人员发布
到 2023 年 3 月,该公司终于发布了 ChatGPT API,让开发人员能够访问聊天机器人的强大功能。开发人员可以使用 ChatGPT 的 API 构建各种产品。Snapchat 是最早使用其 API 创建可定制聊天机器人的公司之一,该聊天机器人可以提供推荐并为朋友写俳句。
该计划最好的部分是 OpenAI 向所有免费用户赠送了价值 5 美元的 API 积分。因此,开发人员和普通用户都使用 ChatGPT API 创建了一些有趣的项目。
ChatGPT 升级到 GPT-4 模型
2023 年 3 月,OpenAI 公布了其聊天机器人发展的下一步,这是以下一代模型的形式出现的。它宣布了世界上最强大的大型语言模型 GPT-4,ChatGPT Plus 用户从第一天起就可以访问它。
这是法学硕士发展史上的分水岭之一。在对抗幻觉方面,它比 GPT-3.5 模型要好得多。GPT-4 在所有类别的准确性测试中得分超过 80%。
GPT-4 还是第一个可以同时理解文本和图像的多模态模型。GPT-4 可以分析一张纸上潦草的笔记,并立即创建网站模型。当然,多模式功能是在 9 月晚些时候添加的(见下文),但 OpenAI 早在 3 月份就已经破解了这个秘密。请注意,自推出以来只有 5 个月。
OpenAI 宣布 GPT-4 是第一个多模态 LLM,早在 3 月份就已经破解了这个秘密。
除此之外,ChatGPT Plus 用户的字数限制增加到 25,000 字,而 ChatGPT 的免费版本(基于 GPT-3.5 构建)的限制为 8,000 字。最后,GPT-4 还更好地理解了多达 26 种语言,包括来自世界各地的主要语言和区域语言。
也就是说,它对世界事件的了解仅限于 2021 年 9 月。尽管如此,GPT-4 标志着 AI 发展的转折点,许多专有和开源的 LLM 仍在努力超越 GPT-4。
ChatGPT 插件首次亮相
正如我们上面提到的,GPT-4 具有许多令人兴奋的功能,但它的知识仍然仅限于 2021 年 9 月。此外,它是一个孤立的黑匣子,无法与外界互动。对于具有无限潜力的人工智能聊天机器人来说,这是一个巨大的限制。
因此,OpenAI 在 3 月份推出了对 ChatGPT 插件的支持,从而找到了解决这个问题的方法。这些插件允许LLM与第三方服务甚至Internet进行交互,以获取实时数据。
在插件的帮助下,ChatGPT 可以使用由 Microsoft Bing 提供支持的 Web 浏览器插件(后来更名为 Browse with Bing)访问最新信息。此外,它可以使用 Code Interpreter 插件运行计算。
Code Interpreter 特别有用,因为您终于能够将文件上传到 ChatGPT 并要求 ChatGPT 使用沙盒 Python 解释器运行各种任务。它还为 ChatGPT 带来了数据分析和可视化,每个人都疯了。使用此工具,您可以在 ChatGPT 中生成图形、图表和图表。
除此之外,在发布期间,OpenAI 还推出了 11 个第三方插件,包括 Zapier、Expedia、Instacart、OpenTable 等,目前托管了数百个插件。使用这些插件,您可以查找和预订航班、在餐厅预订餐桌以及做更多事情。
基本上,借助 ChatGPT 插件、网页浏览和代码解释器,OpenAI 能够朝着扩展 LLM 的多功能性迈出第一步。此外,它让我们看到了这个聊天机器人的真正潜力,它现在正在它上面构建一个功能插件商店。
ChatGPT 聊天记录泄露
3 月是 OpenAI 最繁忙的月份。该公司推出了令人印象深刻的 GPT-4 模型,并通过插件、网页浏览和代码解释器扩展了其实用性。然而,除了炫耀其所有闪闪发光的新功能外,OpenAI 还因泄露用户在 ChatGPT 上的聊天记录的错误而将 ChatGPT 下线。
是的,这是 OpenAI 的第一个重大安全错误。该公司进一步指出,一些与支付相关的信息也可能对其他用户可见,但受影响的用户仅为1.2%。它很快修复了这个错误,并在博客中解释了技术细节。
在 ChatGPT 中管理您的数据
事件发生后,OpenAI采取了一些隐私保护措施来保护用户的利益。它为 ChatGPT 添加了一个选项,可以完全关闭聊天记录。关闭聊天记录后,您的聊天将不会用于训练和改进 OpenAI 模型。
也就是说,即使您关闭了历史记录切换,它也没有真正关闭。OpenAI 在其博客文章中表示,即使在禁用聊天记录后,“我们也会将新对话保留 30 天,并仅在需要时审查它们以监控滥用行为,然后再永久删除。
OpenAI 推出适用于 iOS 的 ChatGPT 应用程序
ChatGPT的飙升引发了另一个巨大的问题。模仿者和低质量的克隆。由于 ChatGPT 到目前为止仅限于网络浏览器,它让不良行为者有机会敲诈用户并快速赚钱。
这个问题在移动设备上尤为猖獗,用户搜索和下载可疑的应用程序和恶意软件感染的克隆。为了解决这个问题,2023 年 5 月,OpenAI 首次发布了适用于 iOS 的原生、从头开始构建的 ChatGPT 应用程序。
值得庆幸的是,它不是一个网络包装器。相反,该应用程序为使用 iPhone 的 ChatGPT Plus 用户带来了对聊天记录、语音输入和 GPT-4 模型的支持。虽然 Android 应用程序没有同时推出,但该公司表示它很快就会推出。最后,该公司于 2023 年 7 月发布了适用于 Android 手机的 ChatGPT 应用程序。
现在,适用于 Android 和 iOS 的 ChatGPT 应用程序具有功能奇偶校验,并支持 GPT-4、DALL-E 3、数据分析、图像分析和网页浏览。
OpenAI 禁用使用 Bing 插件浏览
2023 年 7 月初,OpenAI 再次面临重大挑战,因为其“使用 Bing 浏览”插件在 ChatGPT 上显示来自付费网站的内容。由于担心出版物的诉讼,OpenAI迅速禁用了该功能,并透露它“偶尔会以我们不想要的方式显示内容”。
禁用这个必不可少的插件意味着 ChatGPT+ 用户没有访问互联网并向聊天机器人提供实时信息的官方选择。但是,使用第三方插件,用户仍然可以将 ChatGPT 连接到互联网。最后,三个月后,即 2023 年 9 月,“使用 Bing 浏览”在 ChatGPT 上返回,并进行了所需的修复。
自定义说明来到 ChatGPT
经过两个月的休息,OpenAI 在 7 月继续为 ChatGPT 添加新功能,并提供自定义说明。它基本上可以让 ChatGPT 更多地了解你,以及它应该产生什么样的回应。您可以输入您的偏好,ChatGPT 会在回复您的查询之前牢记它们。
例如,如果您要求聊天机器人以低于 100 美元的价格找到一款好的耳机,它可以从自定义说明中考虑您的位置,并根据您的位置和可用性给出量身定制的回复。你也可以要求它减少绒毛,并给出一个简洁、切中要害的回应。
ChatGPT 可以看、听和说话
2023 年 9 月,OpenAI 发布了对 ChatGPT 的重大更新。新更新首次在 iOS 应用程序上亮相,允许您与模型进行语音对话。此外,您现在可以将图像上传到 ChatGPT 并询问有关图像的问题。
基本上,早在 3 月份展示的多模态功能终于使用其 Whisper(语音识别模型)和 GPT-4V(GPT-4 Vision 模型)添加到 ChatGPT 中。该更新于 2023 年 11 月的某个时候向所有 iOS 和 Android 用户广泛发布。
即使是网络用户也可以在 ChatGPT 上进行图像分析。不过,语音聊天功能仍然仅限于移动应用程序。
GPT-4V(Vision)发布
9 月,OpenAI 发布了一篇单独的研究论文,详细介绍了他们的新 GPT-4V 系统是如何工作的。具有视觉能力的 GPT-4 模型可以分析上传到 ChatGPT 的图像,并以自然语言推断视觉信息。其培训于 2022 年完成,OpenAI 采取了严厉措施驯服视觉模型,使其无法评估有害内容,包括验证码破解、人员识别、性别和种族识别、非法行为等。
GPT-4V 模型被大力吹捧为医学图像诊断的前沿模型,但 OpenAI 在其研究论文中表示,“鉴于该模型在该领域的不完美性能以及与不准确相关的风险,我们认为当前版本的 GPT-4V 不适合执行任何医疗功能或替代专业医疗建议, 诊断,或治疗,或判断。
Dall-E 3 发布到 ChatGPT
DALL-E 一直是 OpenAI 专有的文本到图像模型,但在初始状态下,它无法与 Midjourney 竞争。然而,随着 10 月发布的最新 DALL-E 3 模型,OpenAI 已经非常接近理解文本的细微差别和抽象概念,并将它们转化为准确的图像。
最好的部分是,您不再需要访问其他网站来使用它。DALL-E 3 已集成到 ChatGPT 中。它可以生成令人难以置信的 AI 图像,最好的部分是它与 ChatGPT Plus 订阅捆绑在一起。
此外,通过这种集成,消除了对详细提示的需求。ChatGPT 可以获取您的基本提示,并将它们转换为详细的提示,以使用 DALL-E 3 生成多样化和独特的图像。按照我们的分步指南了解如何使用 DALL-E 3 生成图像。
GPT-4 Turbo 模型和 GPT 发布
2023 年 11 月 6 日,OpenAI 在旧金山举行了首次开发者大会 DevDay。该公司发布了几项重大公告,包括具有更多功能、更大上下文窗口和更便宜定价的新 GPT-4 Turbo 模型。
首先,Turbo 模型了解截至 2023 年 4 月的世界事件。接下来,它有一个 128K 的上下文窗口——高于 GPT-4 的 8K 和 32K 最大令牌。最重要的是,它比 GPT-4 模型的输入令牌便宜 3 倍,考虑到 GPT-4 的运行成本非常高,这真是太棒了。
GPT-4 Turbo 模型尚未添加到 ChatGPT 中,但 OpenAI “计划在未来几周内发布稳定的生产就绪模型”。此外,GPT-3.5 Turbo 模型也进行了升级,现在支持 16K 上下文窗口。
此外,ChatGPT 网站已经过彻底改造,使用 GPT-4 模型时,您无需为不同的任务手动选择不同的选项。您可以使用 DALL-E 3、网页浏览和数据分析,而无需在选项之间切换。它们都处于活动状态,并将根据需要被调用。
最后,来到 DevDay 的亮点,我们有 GPT。您现在可以使用自定义说明创建自定义版本的 ChatGPT,通过 PDF 和其他文档创建自定义知识,并为机器人分配特殊技能。这是一个强大的新工具,可让您为特定任务创建量身定制的 ChatGPT 版本,您可以在此处了解如何创建个性化的 GPT。
OpenAI 正在推出一个 GPT 商店,您可以在其中找到用于各种目的的公开可用的 GPT。
OpenAI 停止新的 ChatGPT Plus 注册
就在 DevDay 之后,OpenAI 宣布将暂停 ChatGPT Plus 的新注册。最初,该公司表示,流量激增是巨大的,尤其是在DevDay活动之后。然而,后来证实 ChatGPT 正面临来自恶意行为者的激烈 DDoS 攻击。
结果,ChatGPT 面临长达数小时的大规模中断。OpenAI在一份声明中表示:“我们正在处理由于反映DDoS攻击的异常流量模式而导致的周期性中断。我们将继续努力缓解这种情况。最后,在 11 月 9 日,该服务在解决问题后恢复。
在一年内,ChatGPT 发生了令人难以置信的变化,现在拥有世界上最强大的大型语言模型。此外,它还获得了令人印象深刻的功能,例如插件、网页浏览、代码解释器、自定义指令、多模态功能、更大的上下文窗口、GPT 等等。我们对 OpenAI 接下来对 ChatGPT 及其下一代模型所做的工作感到兴奋,尤其是在 Sam Altman 重新掌舵的情况下。是的,回来,在下面链接的文章中阅读更多关于过去几周 OpenAI 混乱的信息。
ChatGPT 的未来会怎样?
虽然 ChatGPT 已经变得非常强大,但让我们明确一点,在下一次 AI 爆炸之前,这只是“一个开始”。许多专家认为,基于对话的对话式聊天机器人并不是与生成式人工智能交互的唯一界面。
未来,我们可能会拥有非常强大的多模态人工智能系统,可以理解文本、语音、视觉元素、环境数据和人脑活动的感官数据,从而得出上下文推断并实时执行操作。
人工智能可以紧密集成到 AR 和 VR 界面中,以创造高度互动和身临其境的体验。此外,除了将 AI 聊天机器人集成到应用程序中之外,智能手机和设备还将在操作系统级别运行 AI 系统,以自动理解和执行量身定制的操作。
从管理电子邮件到根据您的使用情况和优先级创建时间表,AI 可以自动为您做事。高通公司已经解释了个性化的设备端人工智能在未来将如何工作。
OpenAI 和许多其他公司已经在努力 AGI公司(通用人工智能)可以超越人类需要智力输入和推理的能力。
事实上,ChatGPT 制造商已经在研究一种解决方案,通过生成高质量的合成数据来克服训练数据的限制。它是否与正在进行的关于“Q*项目”的讨论有关,还有待确定。
ChatGPT 作为一个对话式聊天机器人,已经从受限到拥有相当多的应用程序,像国王一样坐在顶部。尽管如此,如果我们缩小范围,从大局来看,它可能会感到有限,我们可能会在未来看到无数新形式的人工智能体验。