GPT-4 with Calc
美国
AI平台

GPT-4 with Calc

GitHub Next调查软件开发的未来

标签:

GPT-4 在用数字计算时有问题。我们研究一种技术来解决这个问题。

阅读报告 – 配备数值计算的 GPT-4

阅读评估

注意:运行此代码时使用的默认模型是OpenAI的文本-davinci-003,而不是GPT-4。可以通过更改 src/engine/options.ts 和 src/engine/settings.ts 中的设置来调整代码以针对任何完成 API 运行。

在撰写此报告时,我们使用 GPT-4 私有版本的完成 API 评估了该技术。GPT-4 的公开版本目前仅提供“聊天”API。因此,所描述技术的某些方面可能需要因此而返工,但是我们提供代码和我们的调查以供参考。我们认为,尽管预计数字会有所不同,但评估结果仍然有效。

要求

sudo apt-get install npm
npm install
npm run build

例子

定义 API 密钥:

export OPENAI_API_KEY=...

尝试您自己的问题:

./gpte ask --question "What is sin(13.31) where the input is in degrees?"
./gpte ask --question "What is sin(13.31) where the input is in degrees?" --arith

./gpte ask --questionfile test/samples/number-years-grow-30.txt
./gpte ask --questionfile test/samples/number-years-grow-30.txt --arith

这些示例需要 GPT-4 令牌窗口大小、代码生成和推理:

./gpte ask --questionfile test/samples/msft-report-snippet.txt
./gpte ask --questionfile test/samples/msft-report-snippet.txt --arith

./gpte ask --questionfile test/samples/msft-goog-report-snippets-compared.txt
./gpte ask --questionfile test/samples/msft-goog-report-snippets-compared.txt --arith

./gpte ask --questionfile test/samples/gap-lulemon-financial-reports-compared.txt
./gpte ask --questionfile test/samples/gap-lulemon-financial-reports-compared.txt --arith

使用适当的模型,可以使用 评估整个问题集。./gpte eval

GPT-4 和其他 LLM(大型语言模型)正在推动应用人工智能创新的浪潮。然而,在没有增强的情况下使用,它们的计算能力非常有限,并且在用数字计算时会出错。在本项目中,我们描述了一种简单的通用技术来解决这个问题,将其应用于基于 GPT-4 的 AI 的一些广泛报道的真实故障,进行一些评估并讨论相关问题。

这些模型在编写涉及数字的比较逻辑的文本时也会犯错误。例如,GPT-4 非常愉快地写出这样的句子(强调):

用户

对这两个报告进行数字比较,得出新的有趣数字作为比较的一部分。

GPT-4

两家公司都报告了与同季度相比的净销售额增长 去年,但Gap Inc.的绝对和相对增长要大得多。 (4.04亿美元,增长2%)比lululemon(1亿美元,增长9%)。

不幸的是,2 不大于 28,所写的文本正确一半,但包含一个严重的错误,使其毫无意义。

希望

希望在于这个观察:

  1. LLM在数字计算方面较弱,但擅长编写数字计算代码
  2. Python和许多其他工具非常适合评估数字计算代码

答案很明显:让 GPT-4 编写与问题相关的数字计算代码,并让 Python 或其他工具来评估它,其余部分使用 GPT-4。我们的目标是用数字计算器“装备”“增强”GPT-4。在实践中,我们使用的方法很简单,可用于增强任何LLM调用。此外,计算代码和结果可以作为补充输出显示给用户,以及单独检查、审计、解释和保存以保存记录。

数据统计

数据评估

GPT-4 with Calc浏览人数已经达到2,235,如你需要查询该站的相关权重信息,可以点击"5118数据""爱站数据""Chinaz数据"进入;以目前的网站数据参考,建议大家请以爱站数据为准,更多网站价值评估因素如:GPT-4 with Calc的访问速度、搜索引擎收录以及索引量、用户体验等;当然要评估一个站的价值,最主要还是需要根据您自身的需求以及需要,一些确切的数据则需要找GPT-4 with Calc的站长进行洽谈提供。如该站的IP、PV、跳出率等!

关于GPT-4 with Calc特别声明

本站ChatGPT大全提供的GPT-4 with Calc都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由ChatGPT大全实际控制,在2023年5月22日 下午6:34收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,ChatGPT大全不承担任何责任。

相关导航

天猫U特购  京东优惠购        京东优惠    天猫优惠