GPT-4 with Calc

GPT-4 在用数字计算时有问题。我们研究一种技术来解决这个问题。

注意：运行此代码时使用的默认模型是OpenAI的文本-davinci-003，而不是GPT-4。可以通过更改 src/engine/options.ts 和 src/engine/settings.ts 中的设置来调整代码以针对任何完成 API 运行。

在撰写此报告时，我们使用 GPT-4 私有版本的完成 API 评估了该技术。GPT-4 的公开版本目前仅提供“聊天”API。因此，所描述技术的某些方面可能需要因此而返工，但是我们提供代码和我们的调查以供参考。我们认为，尽管预计数字会有所不同，但评估结果仍然有效。

要求

sudo apt-get install npm
npm install
npm run build

例子

定义 API 密钥：

export OPENAI_API_KEY=...

尝试您自己的问题：

./gpte ask --question "What is sin(13.31) where the input is in degrees?"
./gpte ask --question "What is sin(13.31) where the input is in degrees?" --arith

./gpte ask --questionfile test/samples/number-years-grow-30.txt
./gpte ask --questionfile test/samples/number-years-grow-30.txt --arith

这些示例需要 GPT-4 令牌窗口大小、代码生成和推理：

./gpte ask --questionfile test/samples/msft-report-snippet.txt
./gpte ask --questionfile test/samples/msft-report-snippet.txt --arith

./gpte ask --questionfile test/samples/msft-goog-report-snippets-compared.txt
./gpte ask --questionfile test/samples/msft-goog-report-snippets-compared.txt --arith

./gpte ask --questionfile test/samples/gap-lulemon-financial-reports-compared.txt
./gpte ask --questionfile test/samples/gap-lulemon-financial-reports-compared.txt --arith

使用适当的模型，可以使用评估整个问题集。./gpte eval

GPT-4 和其他 LLM（大型语言模型）正在推动应用人工智能创新的浪潮。然而，在没有增强的情况下使用，它们的计算能力非常有限，并且在用数字计算时会出错。在本项目中，我们描述了一种简单的通用技术来解决这个问题，将其应用于基于 GPT-4 的 AI 的一些广泛报道的真实故障，进行一些评估并讨论相关问题。

这些模型在编写涉及数字的比较逻辑的文本时也会犯错误。例如，GPT-4 非常愉快地写出这样的句子（强调）：

用户

对这两个报告进行数字比较，得出新的有趣数字作为比较的一部分。

GPT-4

两家公司都报告了与同季度相比的净销售额增长去年，但Gap Inc.的绝对和相对增长要大得多。（4.04亿美元，增长2%）比lululemon（1亿美元，增长9%）。

不幸的是，2 不大于 28，所写的文本正确一半，但包含一个严重的错误，使其毫无意义。

希望

希望在于这个观察：

LLM在数字计算方面较弱，但擅长编写数字计算代码
Python和许多其他工具非常适合评估数字计算代码。

答案很明显：让 GPT-4 编写与问题相关的数字计算代码，并让 Python 或其他工具来评估它，其余部分使用 GPT-4。我们的目标是用数字计算器“装备”或“增强”GPT-4。在实践中，我们使用的方法很简单，可用于增强任何LLM调用。此外，计算代码和结果可以作为补充输出显示给用户，以及单独检查、审计、解释和保存以保存记录。

数据统计

数据评估

GPT-4 with Calc浏览人数已经达到3,065，如你需要查询该站的相关权重信息，可以点击"5118数据""爱站数据""Chinaz数据"进入；以目前的网站数据参考，建议大家请以爱站数据为准，更多网站价值评估因素如：GPT-4 with Calc的访问速度、搜索引擎收录以及索引量、用户体验等；当然要评估一个站的价值，最主要还是需要根据您自身的需求以及需要，一些确切的数据则需要找GPT-4 with Calc的站长进行洽谈提供。如该站的IP、PV、跳出率等！

特别声明

本站ChatGPT大全提供的GPT-4 with Calc都来源于网络，不保证外部链接的准确性和完整性，同时，对于该外部链接的指向，不由ChatGPT大全实际控制，在2023年5月22日下午6:34收录时，该网页上的内容，都属于合规合法，后期网页的内容如出现违规，可以直接联系网站管理员进行删除，ChatGPT大全不承担任何责任。

ChatGPT大全致力于优质、实用的网络站点资源收集与分享！本文地址https://chatgpt.yundongfang.com/sites/222298.html转载请注明

要求

例子

希望

数据统计

数据评估

相关导航

最新文章