Donut：无需 OCR 理解文档内容

工具软件3年前 (2023)发布 AI观察员

501 0 0

Donut：无需 OCR 理解文档内容

Donut是一种新的文档理解方法，使用无OCR端到端Transformer模型，在各种视觉文档理解任务上显示出最先进的性能。此外，SynthDoG是一种合成文档生成器，帮助模型预训练在各种语言和领域上具有灵活性。预训练模型和Web演示可用于文档解析、文档分类、文档VQA和（伪）文本阅读任务。代码和数据集在MIT许可下在GitHub上可用。

Donut：无需 OCR 理解文档内容

# 工具软件 # ocr # 文档 # 模型

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

Jina AI 推出全球首个开源 8K 文本嵌入，与 OpenAI 相媲美

AI观察员

371

Meta将使用新的AI系统来对抗OpenAI的GPT-4，该系统比Llama 2更强大

AI观察员

511

LLaMA Factory 可让您轻松微调和训练大型语言模型（LLM）

AI观察员

743

Samsung 停用 ChatGPT 改为自行研发 AI 模型

AI观察员

543

Github：现代大语言模型架构

AI观察员

603

GPT-4 API 现在可供所有付费 API 客户使用

AI观察员

494

天猫U特购 京东优惠购 京东优惠天猫优惠