如果想要清晰大數(shù)據(jù)的技能,我們就需要明白分析什么數(shù)據(jù),也就是要了解大數(shù)據(jù)要分析的數(shù)據(jù)類型,總的來講主要有四大類:
交易數(shù)據(jù)(TRANSACTION DATA)
大數(shù)據(jù)平臺能夠獲取時間跨度更大、更海量的結構化交易數(shù)據(jù),這樣就可以對更廣泛的交易數(shù)據(jù)類型進行分析,不僅僅包括POS或電子商務購物數(shù)據(jù),還包括行為交易數(shù)據(jù),例如Web服務器記錄的互聯(lián)網點擊流數(shù)據(jù)日志。
人為數(shù)據(jù)(HUMAN-GENERATED DATA)
非結構數(shù)據(jù)廣泛存在于電子郵件、文檔、圖片、音頻、視頻,以及通過博客、維基,尤其是社交媒體產生的數(shù)據(jù)流,這些數(shù)據(jù)為使用文本分析功能進行分析提供了豐富的數(shù)據(jù)源泉。
移動數(shù)據(jù)(MOBILE DATA)
能夠上網的智能手機和平板越來越普遍。這些移動設備上的App都能夠追蹤和溝通無數(shù)事件,從App內的交易數(shù)據(jù)(如搜索產品的記錄事件)到個人信息資料或狀態(tài)報告事件(如地點變更即報告一個新的地理編碼)。
機器和傳感器數(shù)據(jù)(MACHINE AND SENSOR DATA)
這包括功能設備創(chuàng)建或生成的數(shù)據(jù),例如智能電表、智能溫度控制器、工廠機器和連接互聯(lián)網的家用電器。這些設備可以配置為與互聯(lián)網絡中的其他節(jié)點通信,還可以自動向中央服務器傳輸數(shù)據(jù),這樣就可以對數(shù)據(jù)進行分析。機器和傳感器數(shù)據(jù)是來自新興的物聯(lián)網(IoT)所產生的主要例子。來自物聯(lián)網的數(shù)據(jù)可以用于構建分析模型,連續(xù)監(jiān)測預測性行為(如當傳感器值表示有問題時進行識別),提供規(guī)定的指令(如警示技術人員在真正出問題之前檢查設備)。