四虎国产精品永久地址998_chinesexxx少妇露脸_日本丁香久久综合国产精品_一区二区久久久久_四虎av影视_久久久久国产一区二区三区不卡

中培偉業(yè)IT資訊頻道
您現(xiàn)在的位置:首頁 > IT資訊 > 數(shù)據(jù)庫 > 數(shù)據(jù)庫與數(shù)據(jù)倉庫和大數(shù)據(jù)是什么關(guān)系?

數(shù)據(jù)庫與數(shù)據(jù)倉庫和大數(shù)據(jù)是什么關(guān)系?

2020-07-24 14:01:12 | 來源:中培企業(yè)IT培訓(xùn)網(wǎng)

都說如今是互聯(lián)網(wǎng)大數(shù)據(jù)時代,很多事情都是可用大數(shù)據(jù)來解釋的。與之相對應(yīng)的還有數(shù)據(jù)庫和數(shù)據(jù)倉庫也出現(xiàn)在大眾面前。這不免讓很多不了解的人有些暈。那么數(shù)據(jù)庫與數(shù)據(jù)倉庫和大數(shù)據(jù)是什么關(guān)系?有的人說數(shù)據(jù)庫就是儲藏大數(shù)據(jù)的地方唄,其實這只是其中的一部分,并不是全面的介紹,下面我們就來詳細(xì)了解一下三者之間的關(guān)系。

  數(shù)據(jù)處理的起源

人類的發(fā)展,離不開數(shù)據(jù)的處理。最早的數(shù)據(jù)處理方式是什么?可能是結(jié)繩記事——這種古老的數(shù)據(jù)處理方式,包含了現(xiàn)代計算機(jī)擁有的數(shù)據(jù)存儲、查詢、分析等全部功能。

這個方法貌似可以,但是數(shù)據(jù)量稍微大一點的話……

后來,人類創(chuàng)造出了文字后,數(shù)據(jù)處理能力就大多了。一個典型的“應(yīng)用”是,從舊石器時代開始,人們就通過甲骨文進(jìn)行記賬。

到新石器時代中晚期,母系氏族社會經(jīng)濟(jì)高度發(fā)展,人們開始創(chuàng)造并廣泛采用成套的刻劃符號進(jìn)行記錄、計量。

  數(shù)據(jù)庫的誕生

現(xiàn)代數(shù)據(jù)處理革命性的進(jìn)展,要等到1960年。為了解決零件管理問題。一款叫做ICS的軟件被研發(fā)出來了,專門用來管理這些零件信息。

后來以此為基礎(chǔ)誕生了大名鼎鼎的IMS(Information Management System)數(shù)據(jù)庫。這是現(xiàn)代數(shù)據(jù)庫的祖先。

  如何理解數(shù)據(jù)庫呢

可以把它想象為加強(qiáng)版的EXCEL,在一個表格中記錄數(shù)據(jù)。例如學(xué)生的成績單,記錄有姓名、學(xué)科、成績信息。想要查詢下學(xué)生的平均成績,只需要按順序遍歷這個表格,加和取平均數(shù)。

如果學(xué)生很多,對于EXCEL來說那就比較麻煩,但對于數(shù)據(jù)庫來說則比較簡單,可使用一種叫SQL的語言,通過描述性的交互取得數(shù)據(jù),非常方便。

  數(shù)據(jù)倉庫的誕生

數(shù)據(jù)庫的誕生,很好地解決了保存、使用數(shù)據(jù)的問題,大量類似的產(chǎn)品涌現(xiàn)出來。

但到了上世紀(jì)70、80年代,企業(yè)管理的內(nèi)部數(shù)據(jù)發(fā)生了一些變化,一方面數(shù)據(jù)量越來越大,另一方面使用復(fù)雜度提高很多。各種復(fù)雜報表令人非常頭疼,要在其中挖掘出數(shù)據(jù)背后的價值,當(dāng)時的數(shù)據(jù)庫已經(jīng)跟不上需求。

于是,專門用于數(shù)據(jù)分析的數(shù)據(jù)庫誕生了——1988年數(shù)據(jù)倉庫(Data Warehouse)的概念第一次被提出了。

數(shù)據(jù)倉庫之于數(shù)據(jù)庫就如同F(xiàn)1跑車與普通轎車的區(qū)別。

普通轎車突出功能性、舒適性、安全性等等,可滿足通用化的全面需求;而F1跑車則強(qiáng)調(diào)極致性能,而犧牲了舒適性等。數(shù)據(jù)倉庫就是針對數(shù)據(jù)分析類場景,有特殊定制優(yōu)化的產(chǎn)品。

  大數(shù)據(jù)的沖擊

到了上世紀(jì)90年代,隨著互聯(lián)網(wǎng)的興起,數(shù)據(jù)量爆炸式增長,數(shù)據(jù)處理規(guī)模已經(jīng)從MB(1首MP3)、發(fā)展到TB(20萬首歌)乃至EB級(2億首歌)的驚人規(guī)模。

此外,數(shù)據(jù)處理還產(chǎn)生了實時性等新要求,基于傳統(tǒng)架構(gòu)的數(shù)據(jù)倉庫也面臨巨大挑戰(zhàn)。

就在這個時候,大數(shù)據(jù)概念被首次提出了,拉開了“大數(shù)據(jù)”時代的大幕。原來令人困擾的問題,似乎一夜之間找到答案。

不同于今天大家耳熟能詳?shù)拇髷?shù)據(jù),這里的大數(shù)據(jù)可以理解為一種數(shù)據(jù)處理技術(shù),簡單說,就是在單臺計算機(jī)簡單計算的基礎(chǔ)上,通過堆積計算機(jī)這樣的線性擴(kuò)展方式來處理數(shù)據(jù)。

數(shù)據(jù)庫和數(shù)據(jù)倉庫當(dāng)時處理不了的海量數(shù)據(jù),在這種分布式處理思路下迎刃而解,數(shù)據(jù)庫幾十年的積累,一夜之間被大數(shù)據(jù)吊打。

  回歸數(shù)據(jù)庫

然而,大數(shù)據(jù)的狂野架構(gòu),從誕生之日起就決定其短板:分布式的方式固然很方便擴(kuò)展,但是,作為大數(shù)據(jù)技術(shù)的基本單元,單機(jī)技術(shù)設(shè)計很粗糙,因此很快暴露出計算效率不高、精確性、準(zhǔn)確度不足等問題。

而大數(shù)據(jù)技術(shù)的短板,正式數(shù)據(jù)庫的強(qiáng)項。

事實上,后來大數(shù)據(jù)體系中引入SQL、MPP引擎、列存等等,正是吸取了數(shù)據(jù)庫幾十年來積累的一點點精華。但是大數(shù)據(jù)技術(shù)的基礎(chǔ)過于野蠻,因此很難改進(jìn)。

而此時,因為分布式協(xié)議的成熟,為數(shù)據(jù)庫解決此前無力承受的海量數(shù)據(jù)、多模異構(gòu)等問題提供了技術(shù)方案。數(shù)據(jù)庫的春天,又回來了!

通過上述介紹,我們知道數(shù)據(jù)庫與數(shù)據(jù)倉庫和大數(shù)據(jù)是什么關(guān)系了吧,想了解更多關(guān)于數(shù)據(jù)庫的信息,請繼續(xù)關(guān)注中培偉業(yè)。

主站蜘蛛池模板: 永川市| 柞水县| 南通市| 汶上县| 盐源县| 松滋市| 安岳县| 巧家县| 杨浦区| 平乡县| 澳门| 湘潭县| 弥渡县| 健康| 金寨县| 海阳市| 台前县| 陆河县| 威信县| 红安县| 湘乡市| 南平市| 达尔| 安阳县| 阿拉善右旗| 伊通| 广安市| 盐山县| 同德县| 内乡县| 子长县| 南澳县| 清水河县| 新安县| 长兴县| 尚志市| 兴仁县| 哈尔滨市| 唐山市| 铜梁县| 马公市|