《Hadoop数据分析》高质量pdf+源代码

《Hadoop数据分析》高质量pdf+源代码

我真的很喜欢这本书。这是一个伟大的概述,围绕着做可伸缩的数据分析和数据科学的主题。它是最新的,通过了很多年来已经存在的技术,比如MapReduce,还有一些更新的系统,比如Spark,所有这些都是在Hadoop生态系统的背景下实现的。他们将学习机器学习技术、数据管理,并全面描绘数据科学是什么,以及为什么数据产品很重要,同时教你如何制作它们!

每一个概念都以清晰简洁的方式进行解释,无论哪里省略了细节,都会有一个引文,读者可以继续阅读有关它的更多信息,我认为这很好。虽然我不会把自己归类为初学者,但我相信它对专业人士和初学者都很友好,因为它以python为中心,这使得大多数示例(可以方便地上传到一个漂亮的github存储库中)非常容易运行和使用。在描述了一些东西之后,无论是数据分析的技术,还是一些分析平台(如HBase、Hive等)的内部和外部工作原理,作者提供了一些示例,以便您在阅读这些东西的同时,也可以运行它,玩玩它,真正探索这些系统是如何工作的;我相信这是让自己熟悉新平台的关键部分。

我最喜欢的另一件事是这本书的结尾。当你真正深入到所有这些系统中,并把每一个系统都弄湿之后,作者们会退一步,描述整个端到端的流程,如何有效地利用从本书中获得的知识来构建数据分析工作流程,从而将其包括在一个漂亮的蝴蝶结中!

我强烈推荐这本书给那些既想学习如何部署可伸缩分析工作流程的人,也推荐给那些仅仅对数据科学感兴趣的读者;这本书会吸引你的!

相关文件下载地址
注意:当按钮点击无效或不显示提取码时请刷新页面等待载入完毕再点击

为您推荐