基于大数据分析实战,图文并茂,系统讲解Spark内核的原理,有助于读者快速掌握Spark开源集群计算框架的使用方法,涵盖Spark 3.0新特性。
本书结合大量原理图和流程图,系统介绍Spark内核的相关技术。本书注重实战,图文并茂,系统讲解了Spark内核的原理、Spark实战应用、Spark 数据源、Spark流式计算、Spark性能调优和数据湖等内容。通过本书,读者不仅可以深入理解解Spark的原理、应用、运维、监控等,还可以快速编写出性能更好、可靠性更高的大数据应用。
公众号
关注微信公众号