有人認為將人工智能與大數據結合在一起是一個很自然的錯誤,部分原因是兩者實際上是一致的。但它們是完成相同任務的不同工具。首先要做的事是先弄清二者的定義。
人工智能與大數據一個主要的區(qū)別是大數據是需要在數據變得有用之前進行清理、結構化和集成的原始輸入,而人工智能則是輸出,即處理數據產生的智能。這使得兩者有著本質上的不同。
人工智能是一種計算形式,它允許機器執(zhí)行認知功能,例如對輸入起作用或作出反應,類似于人類的做法。傳統(tǒng)的計算應用程序也會對數據做出反應,但反應和響應都必須采用人工編碼。如果出現任何類型的差錯,就像意外的結果一樣,應用程序無法做出反應。而人工智能系統(tǒng)不斷改變它們的行為,以適應調查結果的變化并修改它們的反應。
支持人工智能的機器旨在分析和解釋數據,然后根據這些解釋解決問題。通過機器學習,計算機會學習一次如何對某個結果采取行動或做出反應,并在未來知道采取相同的行動。
大數據是一種傳統(tǒng)計算。它不會根據結果采取行動,而只是尋找結果。它定義了非常大的數據集,但也可以是極其多樣的數據。在大數據集中,可以存在結構化數據,如關系數據庫中的事務數據,以及結構化或非結構化數據,例如圖像、電子郵件數據、傳感器數據等。
它們在使用上也有差異。大數據主要是為了獲得洞察力,例如Netflix網站可以根據人們觀看的內容了解電影或電視節(jié)目,并向觀眾推薦哪些內容。因為它考慮了客戶的習慣以及他們喜歡的內容,推斷出客戶可能會有同樣的感覺。
人工智能是關于決策和學習做出更好的決定。無論是自我調整軟件、自動駕駛汽車還是檢查醫(yī)學樣本,人工智能都會在人類之前完成相同的任務,但速度更快,錯誤更少。
雖然它們有很大的區(qū)別,但人工智能和大數據仍然能夠很好地協(xié)同工作。這是因為人工智能需要數據來建立其智能,特別是機器學習。例如,機器學習圖像識別應用程序可以查看數以萬計的飛機圖像,以了解飛機的構成,以便將來能夠識別出它們。
人工智能實現最大的飛躍是大規(guī)模并行處理器的出現,特別是GPU,它是具有數千個內核的大規(guī)模并行處理單元,而不是CPU中的幾十個并行處理單元。這大大加快了現有的人工智能算法的速度,現在已經使它們可行。
大數據可以采用這些處理器,機器學習算法可以學習如何重現某種行為,包括收集數據以加速機器。人工智能不會像人類那樣推斷出結論。它通過試驗和錯誤學習,這需要大量的數據來教授和培訓人工智能。
人工智能應用的數據越多,其獲得的結果就越準確。在過去,人工智能由于處理器速度慢、數據量小而不能很好地工作。也沒有像當今先進的傳感器,并且當時互聯網還沒有廣泛使用,所以很難提供實時數據。人們擁有所需要的一切:快速的處理器、輸入設備、網絡和大量的數據集。毫無疑問,沒有大數據就沒有人工智能。