本书读者对象
欢迎阅读本书。本书主要面向软件工程师、机器学习工程师以及初级、中级和高级数据科学家。本书的结构较为合理,相信每一位读者都能有所收获并进一步了解深度学习。
本书也可以说是专为具有一定水平的机器学习工程师和数据科学家设计的。对于那些追求数据科学方向的人,我建议你们补充学习统计学相关的内容。此外,本书还要求读者至少了解Python的基础知识。
本书组织结构
本书分为3个部分:基础知识、设计模式以及用于生产训练和部署的设计模式。
第Ⅰ部分“深度学习基础知识”为读者提供重温深度学习的机会,包括对卷积神经网络的介绍,以及对当今所有领域的主流概念和术语的讨论,涉及计算机视觉、自然语言处理和结构化数据。
第Ⅱ部分“基本设计模式”介绍模型的设计模式。第5~7章介绍现代设计模式以及如何将它们应用于许多当前和以前最先进的深度学习模型。其中介绍了过程重用设计模式,这是人工设计模型的主流方法。
● 第5章介绍卷积神经网络的过程设计模式,以及具有恒等链接的残差块的开发,它类似于自然语言理解的Transformer模型中的注意力机制。
● 第6章进一步介绍卷积神经网络的过程设计模式,以及研究人员如何用宽层替代深层。其中展示了ResNeXt,它实现了与深层相当的准确度。该章还探讨了宽卷积神经网络与结构化数据的宽深度和TabNet模型发展之间的关系。
● 第7章介绍可替代连接模式,以在层中更深或更宽,提高准确度,减少参数数量,并且提高模型内中间潜在空间的信息增益。
● 第8章研究移动卷积神经网络的独特设计思考和特殊约束。由于这些设备的内存限制,因此必须在内存大小和准确度之间进行权衡。该章将介绍这些权衡的进展、优缺点,以及为适应这些权衡导致的移动网络的设计与大型模型设计的不同之处。
● 第9章介绍用于无监督学习的自动编码器。作为独立的模型,自动编码器的实际应用范围非常狭窄。但是,自动编码器的出现促进了预训练模型的发展。这些模型可以更好地泛化到分布外服务。该章还探讨了自动编码器可类比为自然语言理解中的嵌入。
第Ⅲ部分“使用管线”介绍了生产管线的设计模式和实践。
● 第10章介绍超参数调优,包括手动和自动方式。其中讨论指定搜索空间的设计决策、优缺点和最佳实践,以及搜索空间的模式。
● 第11章讨论迁移学习,并且介绍处理类似和不同任务的权重迁移和调优的概念和方法。
● 第12~14章从高层次上介绍生产管线。第12章和第13章深入研究数据方面。第12章介绍数据分布,这是详细介绍统计信息的唯一章节。第13章和第14章的内容从数据端转到部署端。这两章介绍构建生产管线的数据端和训练端的概念和最佳实践。