本书直接讲解Hadoop核心知识,包括Hadoop的核心构成和工作机制、配置存储策略和UE、集成Hadoop和Kafka和Sto...
2017.
本书分为12章,从Spark基础开始,依次介绍MLLib程序设计基础、MLLib的数据对象构建、MLLib中RDD使用介绍,...
2017.
本书在第1版的基础上面,进行了Storm版本、插图、理论知识等的更新。本书详细介绍Storm,以Storm官方网站最...
2016.
本书分为六部分,共16章。第一部分(第1~4章)讨论对数据质量和数据管理意义重大的一组术语,涉及数据的扩...
2016.4
本书从实用的角度较为全面地展现了数据科学的主要内容,并结合大量的实际项目案例,利用R语言详细地讲解了...
2016.3
本书从零开始着手数据科学工作,基于易于理解且具有数据科学相关的丰富的库的Python语言环境。具体内容包括...
2016.3
本书一共11章:其中第1~3章,主要介绍了Spark的基本概念、编程模型、开发与部署的方法;第4~11章,详细详...
2015.12
网络数据量迅速增大的时代,亟需能高效迅捷分析处理数据的工具,Spark应运而生。本书由Spark开发者及核心成...
2015.9
本书由世界顶级安全专家亲笔撰写,深入剖析了安全领域中的数据分析及可视化方法,包含大量真实案例和数据。...
2015.8
本书共11章,分为三篇。基础篇(第1~3章),介绍了Storm背景、基本原理、安装部署、核心概念和数据流模型。...
2015.6