EasyHadoop实战手册 让你的Hadoop应用飞起来


EasyHadoop实战手册 让你的Hadoop应用飞起来


EasyHadoop集群部署入门

1. 文档概述

2. 背景

3. 名词解释

4. 服务器结构

#Hadoop试验集群的部署结构

#系统和组建的依赖关系

#生产环境的部署结构

5. Red hat Linux基础环境搭建

#linux 安装 (vm虚拟机)

#配置机器时间同步

#配置机器网络环境

#配置集群hosts列表

#下载并安装 JAVA JDK系统软件

#生成登陆密钥

#创建用户账号和Hadoop部署目录和数据目录

#检查基础环境

6. Hadoop 单机系统 安装配置

#Hadoop 文件下载和解压

#配置 hadoop-env.sh 环境变量

#Hadoop Common组件 配置 core-site.xml

#HDFS NameNode,DataNode组建配置 hdfs-site.xml

#配置MapReduce - JobTracker TaskTracker 启动配置

#Hadoop单机系统,启动执行和异常检查

#通过界面查看集群部署部署成功

#通过执行 Hadoop pi 运行样例检查集群是否成功

#安装部署 常见错误

7. Hadoop 集群系统 配置安装配置

#检查node节点linux 基础环境是否正常,参考 [ linux 基础环境搭建]一节。

#配置从master 机器到 node 节点无密钥登陆

#检查master到每个node节点在hadoop用户下使用密钥登陆是否正常

#配置master 集群服务器地址 stop-all.sh start-all.sh 的时候调用

#通过界面查看集群部署部署成功

#通过执行 Hadoop pi 运行样例检查集群是否成功

8. 自动化安装脚本

#master 服务器自动安装脚本

Hive仓库集群部署入门

1. 名词解释

2. Hive的作用和原理说明

#数据仓库结构图

#Hive仓库流程图

#hive内部结构图

3. Hive 部署和安装

#安装Hadoop集群,看EasyHadoop安装文档。

#安装Mysql,启动Mysql,检查gc++包。

#解压Hive包并配置JDBC连接地址。

#启动Hive thrift Server。

#启动内置的Hive UI。

4. Hive Cli 的基本用法

#登陆查询

#查询文件方式

#命令行模式

5. HQL基本语法 (创建表,加载表,分析查询,删除表)

#创建表

6. 使用Mysql构建简单数据集市

#Mysql的两种引擎介绍

#创建一个数据表使用Hive cli 进行数据分析

#使用shell 编写Hsql 并使用HiveCli导出数据,使用Mysql命令加载到数据库中。

#使用crontab 新增每日运行任务定时器

7. 使用FineReport 数据展现数据

#安装FineReport,使用注册码!

#使用FineReport,快速展现数据报表。

#FineReport 的问题和局限

立 即 下 载

相关资源

发表评论

点 击 提 交