技術(shù)
導(dǎo)讀:當(dāng)互聯(lián)網(wǎng)進(jìn)入下半場(chǎng):工業(yè)互聯(lián)網(wǎng)or產(chǎn)業(yè)互聯(lián)網(wǎng)時(shí)代后,聯(lián)所能連,萬物互聯(lián),同一時(shí)間,諸多因素爭(zhēng)相進(jìn)入指數(shù)級(jí)發(fā)展軌道,形成了互聯(lián)網(wǎng)不能承受又不能不承受之重。
時(shí)間是公平的,時(shí)間也是不公平的。
公平在于時(shí)間對(duì)于所有人都是一樣,不偏不倚;不公平在于隨著時(shí)間的推移,事物發(fā)展的結(jié)果有可能大不相同。摩爾定律告訴我們,當(dāng)事物進(jìn)入正常軌道后,其發(fā)展的速度將呈現(xiàn)出指數(shù)級(jí)的增長(zhǎng)。芯片如此,網(wǎng)絡(luò)如此,數(shù)據(jù)亦如此。
于是,當(dāng)互聯(lián)網(wǎng)進(jìn)入下半場(chǎng):工業(yè)互聯(lián)網(wǎng)or產(chǎn)業(yè)互聯(lián)網(wǎng)時(shí)代后,聯(lián)所能連,萬物互聯(lián),同一時(shí)間,諸多因素爭(zhēng)相進(jìn)入指數(shù)級(jí)發(fā)展軌道,形成了互聯(lián)網(wǎng)不能承受又不能不承受之重。
人生若只如初見,何事秋風(fēng)悲畫扇。
對(duì)于格創(chuàng)東智所處的工業(yè)互聯(lián)網(wǎng)領(lǐng)域來說,一個(gè)非常明顯的特點(diǎn)就是匯聚大量工業(yè)數(shù)據(jù),而工業(yè)數(shù)據(jù)的一個(gè)非常明顯的特點(diǎn)就是和時(shí)間有關(guān)。
一般而言,工業(yè)數(shù)據(jù)的典型特點(diǎn)包括:
產(chǎn)生頻率快
工業(yè)數(shù)據(jù)采集基本為秒級(jí),部分高頻數(shù)據(jù)采集為毫秒or微秒級(jí),每一個(gè)采集點(diǎn)一秒鐘內(nèi)可產(chǎn)生多條數(shù)據(jù)
嚴(yán)重依賴于采集時(shí)間
每一條數(shù)據(jù)均要求對(duì)應(yīng)唯一的時(shí)間
測(cè)點(diǎn)多、信息量大、數(shù)據(jù)結(jié)構(gòu)相對(duì)簡(jiǎn)單
常規(guī)的實(shí)時(shí)監(jiān)測(cè)系統(tǒng)均有成千上萬的監(jiān)測(cè)點(diǎn),監(jiān)測(cè)點(diǎn)每秒鐘都產(chǎn)生數(shù)據(jù),每天產(chǎn)生幾十GB的數(shù)據(jù)量
工業(yè)數(shù)據(jù)是IT界“只如初見”的新問題,但是,在工業(yè)界,這早就不是問題。
在傳統(tǒng)的工業(yè)數(shù)據(jù)采集和工業(yè)監(jiān)控領(lǐng)域(SCADA),都需要對(duì)聯(lián)網(wǎng)的設(shè)備進(jìn)行監(jiān)控,并對(duì)監(jiān)控采樣到的數(shù)據(jù)進(jìn)行持久化。在工業(yè)領(lǐng)域早就有專門的數(shù)據(jù)庫(kù)來完成這個(gè)任務(wù)了。
這個(gè)專門的數(shù)據(jù)庫(kù)就叫做:實(shí)時(shí)數(shù)據(jù)庫(kù)(此處應(yīng)有掌聲)。工業(yè)領(lǐng)域的實(shí)時(shí)數(shù)據(jù)庫(kù)具有數(shù)據(jù)采集、實(shí)時(shí)數(shù)據(jù)緩存、數(shù)據(jù)回寫(向設(shè)備發(fā)送指令)、采樣數(shù)據(jù)歸檔存盤等主要功能。目前工業(yè)領(lǐng)域?qū)崟r(shí)數(shù)據(jù)庫(kù)基本上被國(guó)外廠家所壟斷,價(jià)格昂貴。以著名的PI數(shù)據(jù)庫(kù)為例,基礎(chǔ)版本(只有5000個(gè)測(cè)點(diǎn))就需要大約10萬美元,每個(gè)數(shù)據(jù)采集接口需要6000美元。于是,不知道有多少工業(yè)版的IoT項(xiàng)目都被扼殺在“搖籃中”,被“秋風(fēng)悲畫扇”了……
上帝關(guān)門,必然開窗。
所幸,接物聯(lián)網(wǎng)的東風(fēng),時(shí)序數(shù)據(jù)庫(kù)(Time Series Database,TSDB)應(yīng)運(yùn)而“升”。
先看看維基百科上的解釋:
勉強(qiáng)翻譯一下:“時(shí)序列數(shù)據(jù)庫(kù)就是用來存儲(chǔ)時(shí)序列(time-series)數(shù)據(jù)并以時(shí)間(時(shí)間點(diǎn)或時(shí)間區(qū)間)建立索引的軟件?!?/p>
簡(jiǎn)而言之,時(shí)序數(shù)據(jù)庫(kù)全稱為時(shí)間序列數(shù)據(jù)庫(kù)。時(shí)間序列數(shù)據(jù)庫(kù)主要用于指處理帶時(shí)間標(biāo)簽(按照時(shí)間的順序變化,即時(shí)間序列化)的數(shù)據(jù),帶時(shí)間標(biāo)簽的數(shù)據(jù)也稱為時(shí)間序列數(shù)據(jù)。
規(guī)范言之,時(shí)間序列數(shù)據(jù)(Time Series Data,TSD)可以用一個(gè)二元函數(shù)來表示:
TSD =Metric(Timestamp,Measurement),其中:
Metric代表可以唯一標(biāo)識(shí)的數(shù)據(jù)序列;
Timestamp代表時(shí)間戳;
Measurement代表被測(cè)量;
簡(jiǎn)單的說,就是這類數(shù)據(jù)描述了某個(gè)被測(cè)量的主體在一個(gè)時(shí)間范圍內(nèi)的每個(gè)時(shí)間點(diǎn)上的測(cè)量值。它普遍存在于電力、化工行業(yè)等行業(yè)以及IT基礎(chǔ)設(shè)施、運(yùn)維監(jiān)控系統(tǒng)和物聯(lián)網(wǎng)等各類型實(shí)時(shí)監(jiān)測(cè)中。
用來存儲(chǔ)、管理、查詢、處理上述二元函數(shù)數(shù)據(jù)的數(shù)據(jù)庫(kù),則可以稱之為時(shí)序數(shù)據(jù)庫(kù)。
時(shí)序數(shù)據(jù)庫(kù)主要以解決下面幾個(gè)問題:
時(shí)序數(shù)據(jù)的寫入:如何支持每秒鐘上千萬上億數(shù)據(jù)點(diǎn)的寫入。
時(shí)序數(shù)據(jù)的查詢:又如何支持在秒級(jí)對(duì)上億數(shù)據(jù)的分組聚合運(yùn)算。
時(shí)序數(shù)據(jù)的存儲(chǔ):解決由海量數(shù)據(jù)存儲(chǔ)帶來的成本敏感問題。
時(shí)序數(shù)據(jù)的生命周期管理:工業(yè)數(shù)據(jù)的價(jià)值主要體現(xiàn)在及時(shí)性,因此,工業(yè)數(shù)據(jù)的生命周期管理是時(shí)序數(shù)據(jù)庫(kù)的核心使命。
各位看官,麻煩度娘一下,關(guān)鍵字:互聯(lián)網(wǎng)監(jiān)控系統(tǒng),大家就會(huì)發(fā)現(xiàn)小米、餓了嗎等互聯(lián)網(wǎng)巨頭也都在用時(shí)序數(shù)據(jù)庫(kù)實(shí)現(xiàn)企業(yè)級(jí)的互聯(lián)網(wǎng)監(jiān)控系統(tǒng)。更別提目前所有國(guó)內(nèi)外主流工業(yè)互聯(lián)網(wǎng)平臺(tái)了,幾乎都是采用時(shí)序數(shù)據(jù)庫(kù)來承接海量涌入的工業(yè)數(shù)據(jù)。
看到這里,估計(jì)已經(jīng)有很多“杠精”躍躍欲試了:憑什么強(qiáng)大的Oracle、PostgreSQL 等傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)搞不定時(shí)序數(shù)據(jù)?憑什么不用HBase、MongoDB、Cassandra等先進(jìn)的分布式數(shù)據(jù)庫(kù)來解決工業(yè)數(shù)據(jù)問題?有什么深刻技術(shù)理由非要用這個(gè)2017年才火爆起來的時(shí)序數(shù)據(jù)庫(kù)呢?請(qǐng)繼續(xù)關(guān)注格物匯的后續(xù)精彩文章!