Cloudera Manager简介

https://yq.aliyun.com/articles/60759

 

Hadoop家族

整个Hadoop家族由以下几个子项目组成:

Hadoop Common:

Hadoop体系最底层的一个模块,为Hadoop各子项目提供各 种工具,如:配置文件和日志操作等。[……]

继续阅读

从关系型Mysql到Nosql HBase的迁移实践

http://cio.it168.com/a2013/1122/1564/000001564020_all.shtml

https://github.com/xiaomi/Minos

 

手把手教你玩转小米Minos-小米-武泽胜-Minos

How to Install and Configure Apache Hadoop on a Single Node in CentOS 7

How to Install and Configure Apache Hadoop on a Single Node in CentOS 7

 

Apache Hadoop is an Open Source framework build for distributed B[……]

继续阅读

HADOOP ON MAC OSX YOSEMITE PART 2

Hadoop on Mac OSX Yosemite part 2

 

This is a continuation from Installing Hadoop on Mac where we installed Hadoop, Yarn, and HDFS, we[……]

继续阅读

INSTALLING HADOOP ON MAC PART 1

Installing Hadoop on Mac part 1

 

A step by step guide to get your running with Hadoop today! In Hadoop on Mac part 2 we actually walk[……]

继续阅读

Hadoop (CDH4发行版)集群部署

前言

折腾了一段时间hadoop的部署管理,写下此系列博客记录一下。

为了避免各位做部署这种重复性的劳动,我已经把部署的步骤写成脚本,各位只需要按着本文把脚本执行完,整个环境基本就部署完了。部署的脚本我放在了开源中国的git仓库里(http://git.oschina.net/snake13[……]

继续阅读

用 Hadoop 进行分布式数据处理,第 3 部分: 应用程序开发

此系列的前两篇文章 专注于单节点和多节点集群的 Hadoop 安装及配置。最后这篇文章探索了 Hadoop 编程 — 特别是在 Ruby 语言中 map 和 reduce 应用程序开发。我之所以选择 Ruby,首先是因为,它是一个您应该知道的很棒的面向对象的脚本语言,其次,您将在 参考资料 部分发现[……]

继续阅读

用 Hadoop 进行分布式数据处理,第 2 部分: 进阶

Hadoop 分布式计算架构的真正实力在于其分布性。换句话说,向工作并行分布多个节点的能力使 Hadoop 能够应用于大型基础设施以及大量数据的处理。本文首先对一个分布式 Hadoop 架构进行分解,然后探讨分布式配置和使用。

分布式 Hadoop 架构

根据 用 Hadoop 进行分布[……]

继续阅读

用 Hadoop 进行分布式数据处理,第 1 部分: 入门

尽管 Hadoop 是一些大型搜索引擎数据缩减功能的核心部分,但是它实际上是一个分布式数据处理框架。搜索引擎需要收集数据,而且是数量极大的数据。作为分布式框架,Hadoop 让许多应用程序能够受益于并行数据处理。

本文并不打算介绍 Hadoop 及其架构,而是演示一个简单的 Hadoop 设置[……]

继续阅读

用 Hadoop 进行分布式并行编程, 第 3 部分

一 前言

在本系列文章的第一篇:用 Hadoop 进行分布式并行编程,第 1 部分: 基本概念与安装部署中,介绍了 MapReduce 计算模型,分布式文件系统 HDFS,分布式并行计算等的基本原理, 并且详细介绍了如何安装 Hadoop,如何在单机及伪分布式环境 (在一台单机中用多进程模拟)[……]

继续阅读