Hadoop大数据解决方案

本书直接讲解Hadoop核心知识,包括Hadoop的核心构成和工作机制、配置存储策略和UE、集成Hadoop和Kafka和Sto...

2017.

Spark MLlib机器学习实践

本书分为12章,从Spark基础开始,依次介绍MLLib程序设计基础、MLLib的数据对象构建、MLLib中RDD使用介绍,...

2017.

从零开始学Storm

本书在第1版的基础上面,进行了Storm版本、插图、理论知识等的更新。本书详细介绍Storm,以Storm官方网站最...

2016.

数据质量测量的持续改进

本书分为六部分,共16章。第一部分(第1~4章)讨论对数据质量和数据管理意义重大的一组术语,涉及数据的扩...

2016.4

数据科学

本书从实用的角度较为全面地展现了数据科学的主要内容,并结合大量的实际项目案例,利用R语言详细地讲解了...

2016.3

数据科学入门

本书从零开始着手数据科学工作,基于易于理解且具有数据科学相关的丰富的库的Python语言环境。具体内容包括...

2016.3

Spark大数据分析实战

本书一共11章:其中第1~3章,主要介绍了Spark的基本概念、编程模型、开发与部署的方法;第4~11章,详细详...

2015.12

Spark快速大数据分析

网络数据量迅速增大的时代,亟需能高效迅捷分析处理数据的工具,Spark应运而生。本书由Spark开发者及核心成...

2015.9

数据驱动安全

本书由世界顶级安全专家亲笔撰写,深入剖析了安全领域中的数据分析及可视化方法,包含大量真实案例和数据。...

2015.8

Storm企业级应用

本书共11章,分为三篇。基础篇(第1~3章),介绍了Storm背景、基本原理、安装部署、核心概念和数据流模型。...

2015.6