标签：准确率

C-Eval是全面的中文基础模型评估套件

C-Eval是全面的中文基础模型评估套件，涵盖了52个不同学科的13948个多项选择题，分为四个难度级别，如下所示。更多详情，请访问我们的网站或查看我们的论文。...

工具软件

3年前 (2023)

MM-Navigator，一种基于GPT-4V的智能代理 MM-Navigator，一种基于GPT-4V的智能代理，用于智能手机用户界面（GUI）导航任务。 MM-Navigator可以像人类用户一...

工具软件

3年前 (2023)