四虎国产精品永久地址998_chinesexxx少妇露脸_日本丁香久久综合国产精品_一区二区久久久久_四虎av影视_久久久久国产一区二区三区不卡

中培偉業(yè)IT資訊頻道
您現(xiàn)在的位置:首頁 > IT資訊 > 大數(shù)據(jù) > 分布式存儲引擎采用MapReduce模型

分布式存儲引擎采用MapReduce模型

2018-05-07 11:56:08 | 來源:中培企業(yè)IT培訓(xùn)網(wǎng)

9-2所示為數(shù)據(jù)分布式存儲與并行處理框架。

分布式存儲引擎采用MapReduce模型,并基于Hadoop的HBase和HDFS實(shí)現(xiàn)。它的主要功能是基于四面體數(shù)據(jù)模型提取非結(jié)構(gòu)化數(shù)據(jù)的基本屬性、語義特征和底層特征信息,并將這些信息連同原始數(shù)據(jù)存儲在HDFS和HBase中。

存儲引擎由Namenode和Datanode構(gòu)成。Namenode通過Map操作將存儲數(shù)據(jù)分成若干子塊,并將這些子塊分配給各個Datanode進(jìn)行特征提取和數(shù)據(jù)永久保存的操作。同時,Namenode會開啟一項任務(wù)來追蹤處理過程,并在各子塊存儲完成后執(zhí)行Reduce操作對結(jié)果進(jìn)行合并。Namenode和Datanode的這種協(xié)同工作方式,實(shí)現(xiàn)了大量數(shù)據(jù)的并行與分布式存儲。

并行化檢索引擎主要負(fù)責(zé)數(shù)據(jù)的快速查詢,是基于.MapReduce模型建立的Master-Slave并行化框架。Master負(fù)責(zé)管理所有Slave可分解和分配具體檢索任務(wù),并對檢索結(jié)果進(jìn)行有效整合;Slave模塊負(fù)責(zé)對本地數(shù)據(jù)實(shí)行具體的檢索任務(wù)并將結(jié)果返回給Master。通過Master的有效調(diào)度,多個Slave可并行化執(zhí)行檢索任務(wù),從而實(shí)現(xiàn)檢索并行化的處理架構(gòu)。

由于Master可以實(shí)現(xiàn)任務(wù)的靈活分發(fā)和結(jié)果的有效整合,多個Slave可以并行化執(zhí)行任務(wù)且可靈活擴(kuò)展,因此該引擎具有很好的可擴(kuò)展性和高效性。

標(biāo)簽: 分布式存儲
主站蜘蛛池模板: 边坝县| 兴山县| 渑池县| 尉犁县| 长乐市| 黑龙江省| 阿瓦提县| 廊坊市| 台州市| 屏东县| 巴青县| 惠来县| 卢氏县| 侯马市| 万宁市| 乌拉特中旗| 奇台县| 兰溪市| 囊谦县| 泰来县| 蕲春县| 工布江达县| 大冶市| 易门县| 拉孜县| 利川市| 景德镇市| 黎平县| 永康市| 苗栗市| 茶陵县| 郑州市| 尚义县| 和田县| 新干县| 松阳县| 满城县| 长沙县| 平阴县| 台安县| 西城区|