← 返回首页
Hadoop基础教程(三)
发表时间:2022-05-29 00:23:37
大数据生态体系

1.数据来源层

2.数据传输层

3.数据存储层

4.资源管理层

YARN资源调度:将数据存储下来,就需要对数据进行分析,分析就需要资源、CPU、内存、磁盘, 这些都由Yarn来调度。

5.数据计算层

数据计算,又分为:实时计算、离线计算 两部分。

实时计算

离线计算 离线计算:主要来统计日活、月活、年统计、本月消费情况等,并不是实时的数据。

6.任务调度层

Oozie :Oozie属于偏重量级的,功能是这三个调度中最复杂的。 Azkaban :Azkaban,使用起来比较简单 crontab :crontab 是 Linux自带的一个调度工具。

7.数据平台配置

Zookeeper:Zookeeper是Google的Chubby一个开源的实现。它是一个针对大型分布式系统的可靠协调系统,提供的功能包括:配置维护、名字服务、 分布式同步、组服务等。ZooKeeper的目标就是封装好复杂易出错的关键服务,将简单易用的接口和性能高效、功能稳定的系统提供给用户。

8.业务模型层

主要来解决企业问题,使用到的都是 JavaEE 相关技术,包括业务指标,数据可视化、BI报表等等。