第774章 馬芸:我還有話說!(1 / 2)

加入書籤

葉風講的雖然淺顯易懂,但確實精彩萬分。

「數據處理,必須經過這幾個步驟,完成之後才會有智慧。」

此時台前的葉風,像極了傳教老師。

下麵的眾人,像極了專心聽弟子。

「第一個步驟是數據收集。這裡有兩個方式,第一個方式是拿,專業點的說法叫抓取或者爬取,例如萬象搜索就是這麼做的,它把網上的所有的信息都下載到它的數據中心,然後你一搜才能搜出來。比如你去搜索的時候,結果會是一個列表,這個列表為什麼會在搜索引擎的公司裡麵呢,就是因為他把這個數據啊都拿下來了,但是你一點鏈接,點出來這個網站就不在搜索引擎它們公司了。」

「比如說網易有個新聞,你拿萬象搜出來,你不點的時候,那一頁在萬象數據中心,一點出來的網頁就是在網易的數據中心了。另外一個方式就是推送,有很多終端可以幫我們收集數據,比如說華風智能手機上麵的健康管理應用,可以將你每天跑步的數據、心跳的數據、睡眠的數據都上傳到數據中心裡麵。」

「第二個步驟是數據傳輸。一般會通過隊列方式進行,因為數據量實在是太大了,數據必須經過處理才會有用,可是係統處理不過來,隻好排好隊,慢慢的處理。」

「第三個步驟是數據存儲。現在數據就是金錢,掌握了數據就相當於掌握了錢。要不然別人怎麼知道你想買什麼呢?就是因為它有你歷史的交易的數據,這個信息可不能給別人,十分寶貴,所以需要存儲下來。」

「第四個步驟是數據分析。剛才說的存儲數據是原始數據,原始數據多是雜亂無章的,有很多垃圾數據在裡麵,因而需要清洗和過濾,得到一些高質量的數據。對於高質量的數據,就可以進行分析,從而對數據進行分類,或者發現數據之間的相互關係,得到知識。」

「比如90年代盛傳的沃爾瑪超市啤酒和尿布的故事。」

葉風剛剛舉了一個例子,還沒說完,大家就會心笑起來。

在坐的各位,都是精英,基本上都聽過這個故事。

尤其是紅旗大賣場的總裁曹世茹,她知道在美國有一個有趣的現象:尿布和啤酒赫然擺在一起出售。但是這個奇怪的舉措卻使尿布和啤酒的銷量雙雙增加了。這不是一個笑話,而是發生在美國沃爾瑪連鎖店超市的真實案例,並一直為她津津樂道,常常用來教育下麵的員工。

沃爾瑪擁有世界上最大的數據倉庫係統,為了能夠準確了解顧客在其門店的購買習慣,沃爾瑪對其顧客的購物行為進行購物籃分析,想知道顧客經常一起購買的商品有哪些。沃爾瑪數據倉庫裡集中了其各門店的詳細原始交易數據。在這些原始交易數據的基礎上,沃爾瑪利用數據挖掘方法對這些數據進行分析和挖掘。

一個意外的發現是:「跟尿布一起購買最多的商品竟是啤酒!經過大量實際調查和分析,揭示了一個隱藏在「尿布與啤酒「背後的美國人的一種行為模式:在美國,一些年輕的父親下班後經常要到超市去買嬰兒尿布,而他們中有30%~40%的人同時也為自己買一些啤酒。產生這一現象的原因是:美國的太太們常叮囑她們的丈夫下班後為小孩買尿布,而丈夫們在買尿布後又隨手帶回了他們喜歡的啤酒。

葉風笑道:「即然大家都知道,我就不多說了,這就是通過對購買數據進行分析,發現男人一般買尿布的時候,會同時購買啤酒,這樣就發現了啤酒和尿布之間的相互關係,獲得知識,然後應用到實踐中,將啤酒和尿布的櫃台弄的很近,就獲得了智慧,讓啤酒和尿布銷量雙雙大增。」

「第五個步驟就是對於數據檢索和挖掘。檢索就是搜索,分析後的數據放入搜索引擎,從而人們想尋找信息的時候,一搜就有了。另外就是挖掘,僅僅搜索出來已經不能滿足人們的要求了,還需要從信息中挖掘出相互的關係。比如財經搜索,當搜索某個公司股票的時候,該公司的高管是不是也應該被挖掘出來呢?如果僅僅搜索出這個公司的股票發現漲的特別好,於是你就去買了,其實其高管發了一個聲明,對股票十分不利,第二天就跌了,這不坑害廣大股民麼?所以通過各種算法挖掘數據中的關係,形成知識庫,十分重要。」

聽葉風說得很有邏輯性,眾人都點頭連連。

這時,又聽葉風講到重點,說起雲計算、大數據、人工智能的密切關係。

「當數據量很小的時候,很少的幾台機器就能解決。慢慢的當數據量越來越大,最牛的服務器都解決不了問題的時候,就想怎麼辦呢?要聚合多台機器的力量,大家齊心協力一起把這個事搞定,眾人拾柴火焰高。」

「所以說大數據平台,什麼叫做大數據,說白了就是一台機器乾不完,大家一起乾。隨著數據量越來越大,很多不大的公司都需要處理相當多的數據,這些小公司沒有這麼多機器可怎麼辦呢?」

「說到這裡,大家想起雲計算了吧。當想要乾這些活的時候,需要好多好多的機器一塊做,真的是想什麼時候要,想要多少就要多少。在以後,一個小公司需要大數據平台的時候,不需要采購一千台機器,隻要到晴風雲平台上一點,這一千台機器都出來了,並且上麵已經部署好了的大數據平台,隻要把數據放進去算就可以了。」

「雲計算需要大數據,大數據需要雲計算,兩個人就這樣結合了。」

「雖說有了大數據,人的**總是這個不能夠滿足。雖說在大數據平台裡麵有搜索引擎這個東西,想要什麼東西我一搜就出來了。但是也存在這樣的情況,我想要的東西不會搜,表達不出來,搜索出來的又不是我想要的。例如音樂軟件裡麵推薦一首歌,這首歌我沒聽過,當然不知道名字,也沒法搜,但是軟件推薦給我,我的確喜歡,這就是搜索做不到的事情。當人們使用這種應用的時候,會發現機器知道我想要什麼,而不是說當我想要的時候,去機器裡麵搜索。這個機器真像我的朋友一樣懂我,這就有點人工智能的意思了。」

「人們很早就在想這個事情了。最早的時候,人們想象,如果要是有一堵牆,牆後麵是個機器,我給它說話,它就給我回應,我如果感覺不出它那邊是人還是機器,那它就真的是一個人工智能的東西了。」

葉風繼續講了一些讓機器學會推理、教給機器知識等高深的人工智能見解,最後總結道:

「人工智能可以做的事情非常多,例如可以鑒別垃圾郵件,鑒別黃色暴力文字和圖片等。這也是經歷了三個階段的。第一個階段依賴於關鍵詞黑白名單和過濾技術,包含哪些詞就是黃色或者暴力的文字。隨著這個網絡語言越來越多,詞也不斷的變化,不斷的更新這個詞庫就有點顧不過來。第二個階段時,基於一些新的算法,一些基於概率的算法。第三個階段就是基於大數據和人工智能,進行更加精準的用戶畫像和文本理解和圖像理解。」

「由於人工智能算法多是依賴於大量的數據的,這些數據往往需要麵向某個特定的領域,例如電商,郵箱等等進行長期的積累,如果沒有數據,就算有人工智能算法也白搭。而雲計算廠商往往是積累了大量數據的,於是就需求在雲計算裡麵裝一個人工智能軟件即服務,就這樣,雲計算、大數據、人工智能三兄弟湊齊了。」

「所以將來,隻要在一個雲計算平台上麵,雲、大數據、人工智能都能找得到。對一個大數據公司,積累了大量的數據,也會使用一些人工智能的算法提供一些服務。對於一個人工智能公司,也不可能沒有大數據平台支撐。所以雲計算,大數據,人工智能就這樣整合起來,完成了相遇,相識,相知,過上了沒羞沒臊的美好生活。。

「哈哈哈哈!!!」

聽葉風說得基情四射,眾人哄然大笑。

說到這裡,不知不覺,已經快一個小時了。

就算葉風講得再精彩。

他也感覺到眾人的精神有些疲憊。

↑返回頂部↑

書頁/目錄

本章報錯

都市相关阅读: 諸天頂峰 一拳超人之無限進化 廢土崛起 仙武神煌 木葉之千夜傳說 男巫阿米妥 高能優質偶像 諸天獵手 重生之財源滾滾 信息時代之光