微软关于 GPT-4V 图象识别能力详细评估

微软关于 GPT-4V 图象识别能力详细评估

相对于 Open AI 那个论文的藏着噎着微软这个166 页的 GPT-4V 图象识别能力的评估显然要全面的多。定性探讨了 GPT-4V 的功能和用法。描述视觉+文本提示技巧、小样本学习、推理等。几乎穷尽了可以想到的所有用法,强烈推荐自己过一遍。

论文地址:https://arxiv.org/pdf/2309.17421.pdf

这几天 X 上也有各种脑洞大开的用法,@saana_ai整理了一个 GPT-4V 用例合集,可以来这里看看:https://x.com/saana_ai/status/1707843326777634922?s=20

比如下面这个小姐姐就把产品图和介绍发给 ChatGPT 让他给出圣诞节宣传图的拍摄策略,最后她根据 GPT 建议搞出来的确实非常好。

https://x.com/Salmaaboukarr/status/1707824188495421505?s=20
微软关于 GPT-4V 图象识别能力详细评估
这个老哥测试的把团队开会手绘的架构图发给 ChatGPT,GPT 给他输出的对应的代码。

https://x.com/mckaywrigley/status/1707101465922453701?s=20
微软关于 GPT-4V 图象识别能力详细评估
还有这个 ChatGPT 可以准确的读出这个漫画里面“表示沟通非常重要的隐喻”我看了好一会才看懂。

https://x.com/skirano/status/1706874309124194707?s=20
微软关于 GPT-4V 图象识别能力详细评估

© 版权声明

相关文章

天猫U特购  京东优惠购        京东优惠    天猫优惠