点击选择搜索分类

书韵坊 -Hapdoop MapReduce v2参考手册(第2版,影印版) 东南大学出版社

Hapdoop MapReduce v2参考手册(第2版,影印版) 东南大学出版社下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线

Hapdoop MapReduce v2参考手册(第2版,影印版) 东南大学出版社精美图片

Hapdoop MapReduce v2参考手册(第2版,影印版) 东南大学出版社电子书下载地址

》Hapdoop MapReduce v2参考手册(第2版,影印版) 东南大学出版社电子书籍版权问题请点击这里查看《

Hapdoop MapReduce v2参考手册(第2版,影印版) 东南大学出版社书籍详细信息

ISBN：9787564160890
作者：暂无作者
出版社：暂无出版社
出版时间：2016-01
页数：暂无页数
价格：40.90
纸张：胶版纸
装帧：平装-胶订
开本：16开
语言：未知
丛书：暂无丛书
TAG：暂无
豆瓣评分：暂无豆瓣评分
豆瓣短评：点击查看
豆瓣讨论：点击查看
豆瓣目录：点击查看
读书笔记：点击查看
原文摘录：点击查看

寄语：

新华书店正版，关注店铺成为会员可享店铺专属优惠，团购客户请咨询在线客服！

内容简介：

开篇介绍了HadoopYARN,MapReduce,HDFS以及其它Hadoop生态系统组件的安装。在本书的指引下，你很快就会学习到很多激动人心的主题，例如MapReduce模式，使用Hadoop从事分析、归类、在线销售、推荐、数据索引及搜索。

书籍目录：

Preface

Chapter 1：Getting Started with Hadooo v2

IntrOductiOn

Setting up Hadoop v2 on your local machine

Writing a WordCount MapReduce application，bundling it

and running it using the Hadoop local mode

Adding a combiner step to the WordCount MapReduce program

Setting up HDFS

Setting up Hadoop YARN in a distributed cluster environment

using Hadoop v2

Setting up Hadoop ecosystem in a distributed cluster environment

using a Hadoop distribution

HDFS command—line file operations

Running the WordCount program in a distributed cluster environment

Benchmarking HDFS using DFSIO

Benchmarking Hadoop MapReduce using TeraSort

Chapter 2：Cloud Deployments—Using Hadoop YARN on

Cloud Environments

Introduction

Running Hadoop MapReduce v2 computations using Amazon

Elastic MapReduce

Saving money using Amazon EC2 Spot Instances to execute EMR job flows

Executing a Pig using EMR

Executing a Hive using EMR

Creating an Amazon EMR job flow using the AWS Command Line Interface

Deploying an Apache HBase cluster on Amazon EC2 using EMR

Using EMR bootstrap actions to configure VMs for the Amazon EMR jobs

Using Apache Whirr to deploy an Apache Hadoop cluster in a

cloud environment

Chapter 3：Hadoop Essentials—C0nfigurations，Unit Tests，and Other APIs

Introduction

Optimizing Hadoop YARN and MapReduce cOnfiguratiOns for

cluster deployments

Shared user Hadoop clusters——using Fair and Capacity schedulers

Setting classpath precedence to user—provided JARs

Speculative execution of straggling tasks

Unit testing Hadoop MapReduce applications using MRUnit

Integration testing Hadoop MapReduce applications using

MiniYarnCluster

Adding a new DataNode

Decommissioning DataNodes

Using multiple disks／volumes and limiting HDFS disk usage

Setting the HDFS block size

Setting the file replication factor

Using the HDFs Java API

Chapter 4：Develooin～ComDlex Hadooo MaoReduce Aoolications

IntrOductiOn

Choosing appropriate Hadoop data types

Implementing a custom Hadoop Writable data type

Implementing a custom Hadoop key type

Emitting data of different value types from a Mapper

Choosing a suitable Hadoop InputFormat for your input data format

Adding support for new input data formats——implementing

a custom InputFormat

Formatting the results of MapReduce computations——using

Hadoop OutputFormats

Writing multiple outputs from a MapReduce computation

Hadoop intermediate data partitioning

Secondary sorting——sorting Reduce input values

BrOadcasting and distributing shared resources to tasks in a

MapReduce job—Hadoop DistributedCache

Using Hadoop with legacy applications——Hadoop streaming

Adding dependencies between MapReduce jobs

Hadoop counters to report custom metrics

Chapter5：Analvtics

Introduction

Simple analytics using MapReduce

Performing GROUP BY using MapReduce

Calculating frequency distributions and sorting using MapReduce

Plotting the Hadoop MapReduce results using gnuplot

Calculating histograms using MapReduce

Calculating Scatter plots using MapReduce

Parsing a complex dataset with Hadoop

Joining two datasets using MapReduce

Chapter6：Hadooo Ecosystem—Apache Hive

Introduction

Getting started with Apache Hive

Creating databases and tables using Hive CLI

Simple SQL—style data querying using Apache Hive

Creating and populating Hive tables and views using Hive query results

Utilizing different storage formats in Hive.storing table data

using ORC files

Using Hive built—in functions

Hive batch mode—using a query file

Performing a join with Hive

Creating partitioned Hive tables

Writing Hive User·defined Functions（UDF）

HCatalog—·performing Java MapReduce computations on

data mapped to Hive tables

HCatalog——writing data to Hive tables from Java

MapReduce computations

Chapter7：HadooD Ecosystem II—Pig.HBase.Mahout.and Sannn

Introduction

Getting started with Apache Pig

Joining two datasets using Pig

Accessing a Hive table data in Pig using HCatalog

Getting started with Apache HBase

Data random access using Java client APIs

Running MapReduce jobs on HBase

Using Hive to insert data into HBase tables

Getting started with Apache Mahout

Running K—means with Mahout

Importing data to HDFS from a relational database using Apache Sqoop

Exporting data from HDFs to a relational database using Apache Sqoop

Tahie OrContencs

Chapter8：Searching and Indexine

Introduction

Generating an inverted index using Hadoop MapReduce

Intradomain web crawling using Apache Nutch

Indexing and searching web documents using Apache Solr

Configuring Apache HBase as the backend data store for Apache Nutch

Whole web crawling with Apache Nutch using a HadooP／HBase cluster

Elasticsearch for indexing and searching

Generating the in—links graph for crawled web pages

Chapter 9：CIassmcatiOns。Recommendations，and Findineg RelationshipS

Introduction

Performing content—based recommendations

Classification using the naive Bayes classifier

Assigning advertisements to keywords using the Adwords

balance algorithm

Chapter 10：Mass Text Data processing

Introduction

Data preprocessing using Hadoop streaming and Python

De—duplicating data using Hadoop streaming

Loading large datasets to an Apache HBase data store—importtsv

and bulkload

Creating TF and TF—IDF vectors for the text data

Clustering text data using Apache Mahout

Topic discovery using Latent Dirichlet Allocation（LDA）

Document classification using Mahout Naive Bayes Classifier

Index

作者介绍：

Thilina Guna rathne是KPMG LLP的不错数据科学家。在进入KPMG LLP之前，他在Link AnglytiCS负责Hadoop的关研究。他对于Apache Hadoop以及大规模数据密集计算的相关技术有着丰富的经验。他还和srinath Perera博士合著了本书的靠前版。

出版社信息：

暂无出版社相关信息，正在全力查找中！

书籍摘录：

暂无相关书籍摘录，正在全力查找中！

在线阅读/听书/购买/PDF下载地址：

在线阅读地址：Hapdoop MapReduce v2参考手册(第2版,影印版) 东南大学出版社在线阅读

在线听书地址：Hapdoop MapReduce v2参考手册(第2版,影印版) 东南大学出版社在线收听

在线购买地址：Hapdoop MapReduce v2参考手册(第2版,影印版) 东南大学出版社在线购买

原文赏析：

暂无原文赏析，正在全力查找中！

其它内容：

暂无其它内容！

书籍真实打分

故事情节：3分
人物塑造：3分
主题深度：5分
文字风格：9分
语言运用：6分
文笔流畅：4分
思想传递：8分
知识深度：7分
知识广度：3分
实用性：6分
章节划分：3分
结构布局：8分
新颖与独特：7分
情感共鸣：9分
引人入胜：9分
现实相关：7分
沉浸感：7分
事实准确性：8分
文化贡献：4分

网站评分

书籍多样性：7分
书籍信息完全性：6分
网站更新速度：6分
使用便利性：6分
书籍清晰度：4分
书籍格式兼容性：4分
是否包含广告：8分
加载速度：4分
安全性：5分
稳定性：4分
搜索功能：7分
下载便捷性：7分

下载点评

中评(79+)
无颠倒(221+)
值得下载(470+)
txt(405+)
二星好评(225+)
还行吧(554+)

下载评价

网友权***颜：
下载地址、格式选择、下载方式都还挺多的
网友芮***枫：
有点意思的网站，赞一个真心好好好哈哈
网友常***翠：
哈哈哈哈哈哈
网友曾***玉：
直接选择epub/azw3/mobi就可以了，然后导入微信读书，体验百分百！！！
网友訾***晴：
挺好的，书籍丰富
网友蓬***之：
好棒good
网友索***宸：
书的质量很好。资源多
网友田***珊：
可以就是有些书搜不到
网友师***怡：
说的好不如用的好，真心很好。越来越完美
网友郗***兰：
网站体验不错

喜欢"Hapdoop MapReduce v2参考手册(第2版,影印版) 东南大学出版社"的人也看了

全格式电子版 - 免费下载

Hapdoop MapReduce v2参考手册(第2版,影印版) 东南大学出版社

【点击查看】直接下载文件

Hapdoop MapReduce v2参考手册(第2版,影印版) 东南大学出版社分类索引数据信息

ISBN：9787564160890
出版社：暂无出版社
出版日期：2016-01
作者：暂无作者
TAGS：暂无

随机推荐

Hapdoop MapReduce v2参考手册(第2版,影印版) 东南大学出版社下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线

Hapdoop MapReduce v2参考手册(第2版,影印版) 东南大学出版社电子书下载地址

Hapdoop MapReduce v2参考手册(第2版,影印版) 东南大学出版社书籍详细信息

寄语：

内容简介：

书籍目录：

作者介绍：

出版社信息：

书籍摘录：

在线阅读/听书/购买/PDF下载地址：

原文赏析：

其它内容：

书籍真实打分

网站评分

下载点评

下载评价

喜欢"Hapdoop MapReduce v2参考手册(第2版,影印版) 东南大学出版社"的人也看了

高等学校英语应用能力考试B级模拟试题下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线

环境科学及其特殊对象的哲学与伦理学问题研究,叶平,中国环境科学出版社,9787511112019 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线

小学教材帮三年级下册语文数学2本人教版2024春教材帮小学3年级下册2024新版天星教育下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线

启东黄冈大试卷九年级语文上(人教版适用) 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线

2023新版5年中考满分作文大全初中生通用学生五年中考作文一本全初中生作文写作课升学参考资料下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线

Hapdoop MapReduce v2参考手册(第2版,影印版) 东南大学出版社 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线

Hapdoop MapReduce v2参考手册(第2版,影印版) 东南大学出版社电子书下载地址

Hapdoop MapReduce v2参考手册(第2版,影印版) 东南大学出版社书籍详细信息

寄语：

内容简介：

书籍目录：

作者介绍：

出版社信息：

书籍摘录：

在线阅读/听书/购买/PDF下载地址：

原文赏析：

其它内容：

书籍真实打分

网站评分

下载点评

下载评价

喜欢"Hapdoop MapReduce v2参考手册(第2版,影印版) 东南大学出版社"的人也看了

高等学校英语应用能力考试B级模拟试题 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线

环境科学及其特殊对象的哲学与伦理学问题研究,叶平,中国环境科学出版社,9787511112019 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线

小学教材帮三年级下册语文数学2本人教版2024春教材帮小学3年级下册2024新版天星教育 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线

启东黄冈大试卷九年级语文上(人教版适用) 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线

2023新版5年中考满分作文大全 初中生通用 学生 五年中考作文一本全 初中生作文写作课 升学参考资料 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线

Hapdoop MapReduce v2参考手册(第2版,影印版) 东南大学出版社下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线

高等学校英语应用能力考试B级模拟试题下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线

小学教材帮三年级下册语文数学2本人教版2024春教材帮小学3年级下册2024新版天星教育下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线

2023新版5年中考满分作文大全初中生通用学生五年中考作文一本全初中生作文写作课升学参考资料下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线