概览¶

MMOCR 是一个基于 PyTorch 和 MMDetection 的开源工具箱，支持众多 OCR 相关的模型，涵盖了文本检测、文本识别以及关键信息提取等多个主要方向。它还支持了大多数流行的学术数据集，并提供了许多实用工具帮助用户对数据集和模型进行多方面的探索和调试，助力优质模型的产出和落地。它具有以下特点：

全流程，多模型：支持了全流程的 OCR 任务，包括文本检测、文本识别及关键信息提取的各种最新模型。
模块化设计：MMOCR 的模块化设计使用户可以按需定义及复用模型中的各个模块。
实用工具众多：MMOCR 提供了全面的可视化工具、验证工具和性能评测工具，帮助用户对模型进行排错、调优或客观比较。
由 OpenMMLab 强力驱动：与家族内的其它算法库一样，MMOCR 遵循着 OpenMMLab 严谨的开发准则和接口约定，极大地降低了用户切换各算法库时的学习成本。同时，MMOCR 也可以非常便捷地与家族内其他算法库跨库联动，从而满足用户跨领域研究和落地的需求。

随着 OpenMMLab 家族架构的整体升级， MMOCR 也相应地进行了大幅度的升级和修改。在这个大版本的更新中，MMOCR 中大量的冗余代码和重复实现被移除，多个关键方法的运行效率得到了提升，且整体框架设计上变得更为统一。考虑到该版本相较于 0.x 存在一些后向不兼容的修改，我们准备了一份详细的迁移指南，并在里面列出了新版本所作出的所有改动和迁移所需的步骤，力求帮助熟悉旧版框架的用户尽快完成升级。尽管这可能需要一定时间，但我们相信由 MMOCR 和 OpenMMLab 生态系统整体带来的新特性会让这一切变得尤为值得。😊

接下来，请根据实际需求选择你需要阅读的章节。

我们推荐初学者通过【快速运行】来熟悉 MMOCR 的基本用法，并从【用户指南】提供的案例中逐步掌握 MMOCR 的用法。
中高级开发者则可以从【基础概念】中了解各个组件的背景、约定和推荐实现。
请阅读 FAQ 来查找常见问题的答案。
同时，如果你在文档中未能找到需要的答案，欢迎通过 issue 进行反馈。
我们也欢迎每一位用户成为贡献者！请阅读贡献指南来了解如何为 MMOCR 做出贡献。