大数据处理的关键架构层

news/2024/7/8 2:38:53

大数据处理的关键架构层

文件系统层:在这一层里,分布式文件系统需具备存储管理、容错处理、高可扩展性、高可靠性和高可用性等特性。

数据存储层:由于目前采集到的数据,十之有七八为非结构化和半结构化数据,数据的表现形式各异,有文本的、图像的、音频的、视频的等,因此常见的数据存储也要对应有多种形式,有基于键值(Key-Value)的,有基于文档(Document),还有基于列(Column)和图表(Graph)的。如果采用单一的数据库引擎,“一刀切式”的满足所有类型的数据存储需求,通常会严重降低数据库管理的性能。因此,我们需要“兵来将挡,水来土掩”式的、多元的(Polyglot)数据库解决方案(这就好比,如果“兵来了”和“水来了”,都要“将”去挡,遇到“兵”时,“将”可以“酣畅淋漓”,而遇到“水”时,还用“将”去挡,那这个“将”估计就要“舍生取义”了。文献是一本有关NoSQL数据处理的图书)

资源管理层:这一层是为了提高资源的高利用率和吞吐量,以到达高效的资源管理与调度目的。

资源协调层:在本层的系统,需要完成对资源的状态、分布式协调、一致性和资源锁实施管理。

计算框架层:在本层的计算框架非常庞杂,有很多高度专用的框架包含其内,有流式的,交互式的,实时的,批处理和迭代图的(Batch and Iterative Graph,BSP)等。为这些计算框架提供支撑的是运行时引擎,如BDAS(Spark) 和 Flink等(注:这里的BDAS是指“Berkeley Data Analytics Stack”,即伯克利数据分析栈。为Spark核心作者Ion Stoica的讲座幻灯片文档)。

数据分析层:在这一层里,主要包括数据分析(消费)工具和一些数据处理函数库。这些工具和函数库,可提供描述性的、预测性的或统计性的数据分析功能及机器学习模块。

数据集成层:在这一层里,不仅包括管理数据分析工作流中用到的各种适用工具,除此之外,还包括对元数据(Metadata)管理的工具。

操作框架层:这一层提供可扩展的性能监测管理和基准测试框架。


http://www.niftyadmin.cn/n/4083969.html

相关文章

PyInstaller库基本介绍

将.py源代码转换成无需源代码的可执行文件 .py文件通过PyInstaller转换为Windows系统可以直接运行的(.exe文件),Linux系统,Mac OS X系统可以运行的。 将py扩展名的任何python的源代码转变成Windows、Linux系统,Mac OS X系统的可…

科赫雪花小包裹实例详解

高大上的分形几何 分形几何是一种迭代的几何图形,广泛存在于自然界中(树叶,菜花)(这个东西的整体与他的局部具有很相似的特点) 分形几何中有一种特殊的曲线叫做科赫曲线,也叫雪花曲线 科赫曲…

Step by Step SharePoint 2010 Install RTM

http://blogs.architectingconnectedsystems.com/blogs/cjg/archive/2010/05/27/Step-by-Step-SharePoint-2010-Instal-RTM.aspx转载于:https://www.cnblogs.com/joe-yang/archive/2010/06/05/1752379.html

组合数据类型(集合)

组合数据类型包括集合类型及操作、序列类型及操作(元组类型和列表类型)、字典类型及操作 集合是多个元素的无序组合 集合类型与数学中的集合概念一致,数学中的集合是指具有某种特定性质的对象汇总而成的集体,其中组成集合的对象…

浏览器本身自带的下载管理器和专用下载软件的区别

最近,需下载Solaris操作系统的iso文件,我先后使用了好几个浏览器来下载该文件,最后都会在下载的中途停止,显示的细致速度为0。我之所以没有采用专用的下载软件,如FlashGet等下载,是因为我浏览器本身自带的下…

数据存储层

宽泛地讲,据对一致性(consistency)要求的强弱不同,分布式数据存储策略,可分为ACID和BASE两大阵营。ACID是指数据库事务具有的四个特性:原子性(Atomicity)、一致性(Consis…

keygen文件被小红伞自动删除的解决办法

我需要安装一个破解的软件,要用keygen.exe文件产生license文件,可是当我解压出文件keygen.exe后,小红伞 (Avira Free Antivirus)将该文件自动识别为病毒文件,同时启动扫描程序,对电脑系统进行扫描。我就根本不能使用文…

C++ const的用法和作用

地方转载于:https://www.cnblogs.com/DswCnblog/p/6489880.html