دانلود کتاب
جزییات کتاب
1.人工智能领域的技术工程师,尤其是从事图像识别和NLP的技术工程师;
2.专门研究OCR的专业人士或院校师生等。
这是一部融合了企业界先进工程实践经验和学术界前沿技术和思想的OCR著作。
本书由阿里巴巴本地生活研究院算法团队技术专家领衔,从组件、算法、实现、工程应用等维度系统讲解基于深度学习的OCR技术的原理和落地。书中一步步剖析了算法背后的数学原理,提供大量简洁的代码实现,帮助读者从零基础开始构建OCR算法。
全书共10章:
第1章从宏观角度介绍了ORC技术的发展历程、概念和产业应用;
第2章讲解了OCR的图像预处理方法;
第3~4章介绍了传统机器学习方法和深度学习的相关基础知识;
第5章讲解了基于传统方法和深度学习方法的OCR的数据生成;
第6章讲解了与OCR相关的一些高级深度学习方法,方便读者理解后续的检测和识别部分;
第7章讲解了文字的检测技术,从通用的目标检测到文字的检测,一步步加深读者对文字检测问题的认识;
第8章讨论了文字识别的相关技术,定位到文字的位置之后,需要对文字的内容进行进一步的解析;
第9章介绍了一些OCR后处理的方法;
第10章介绍了一些版面分析方法。