微软关于 GPT-4V 图象识别能力详细评估

308 0 0

相对于 Open AI 那个论文的藏着噎着微软这个166 页的 GPT-4V 图象识别能力的评估显然要全面的多。定性探讨了 GPT-4V 的功能和用法。描述视觉+文本提示技巧、小样本学习、推理等。几乎穷尽了可以想到的所有用法，强烈推荐自己过一遍。

论文地址：https://arxiv.org/pdf/2309.17421.pdf

这几天 X 上也有各种脑洞大开的用法，@saana_ai整理了一个 GPT-4V 用例合集，可以来这里看看：https://x.com/saana_ai/status/1707843326777634922?s=20

比如下面这个小姐姐就把产品图和介绍发给 ChatGPT 让他给出圣诞节宣传图的拍摄策略，最后她根据 GPT 建议搞出来的确实非常好。

https://x.com/Salmaaboukarr/status/1707824188495421505?s=20
微软关于 GPT-4V 图象识别能力详细评估
这个老哥测试的把团队开会手绘的架构图发给 ChatGPT，GPT 给他输出的对应的代码。

https://x.com/mckaywrigley/status/1707101465922453701?s=20
微软关于 GPT-4V 图象识别能力详细评估
还有这个 ChatGPT 可以准确的读出这个漫画里面“表示沟通非常重要的隐喻”我看了好一会才看懂。

https://x.com/skirano/status/1706874309124194707?s=20
微软关于 GPT-4V 图象识别能力详细评估

文章版权归作者所有，未经允许请勿转载。

AI观察员

484

AI观察员

390

AI观察员

410

AI观察员

705

AI观察员

674

AI观察员

557

天猫U特购 京东优惠购 京东优惠天猫优惠