自動支票閱讀、影像辨識、語音辨識、語音輔助、汽車自動駕駛、策略遊戲、財務分析、詐欺偵測、搜尋引擎、醫療診斷輔助等。
人工智慧現在幾乎滲透到各個領域,讓我們的生活變得更輕鬆。目前最成功的技術是自動學習或「機器學習」(ML)技術。
當我們看到一輛自動駕駛汽車駛過時,當我們觀察國際象棋軟體或當我們聆聽語音助理時,我們有理由留下深刻的印象。然而,這些系統並不是很聰明。它們使它們能夠完成非常專業的任務,在這些任務中它們將輕鬆擊敗人類。但他們將無法做任何其他事情,因為他們不具備一般智力。
事實上,這些系統並不了解它們在做什麼,因為它們所做的一切主要是統計計算的結果。機器學習書籍充滿了「機率」技術、「距離」評估、線性或多項式「回歸」、「隨機梯度」等。這就是機器學習也被稱為統計學習的原因。
大數據和顯示卡點燃火藥
機器學習有三種主要形式:監督式、無監督式和強化式。但它顯然是第一個正在崛起的領域,這尤其要歸功於它的一個子類別,即深度學習。監督機器學習的目標是創建一個能夠識別事物的電腦系統。
為了實現這一目標,我們以「特徵」的形式對這些元素進行建模,我們為自己配備了大量標記的事物和學習演算法。然後,我們將「重量」與這些不同的特徵聯繫起來,例如,這將使得區分椅子和蘋果成為可能。為了找到正確的權重,我們要求演算法識別已知的事物。如果他犯了錯誤,我們會稍微調整權重並重新開始,直到錯誤最小。如果一切順利,系統將創建一個權重矩陣,一種視覺過濾器,使其能夠很好地識別事物,即使它以前從未見過它們。
但事物的初始建模及其特徵的定義是複雜的。這就是深度學習將提供解決方案。這項技術創建於 20 世紀 80 年代,它將學習細分為幾個可訓練的模組,並將它們排列在連續的層中。結果稱為多層神經網路。
這種系統的優點是它會自動建立事物的分層表示並顯示出特徵。不再需要手工建模。在多層神經網路中,卷積網路脫穎而出。它們由 Yann Lecun 發明,受到哺乳動物視覺皮層功能的啟發,特別適合圖像辨識。
但是深度學習沒有立即起飛。直到 2011-2012 年,研究人員才可以一方面依賴大型資料庫(ImageNet 資料庫中分佈在 1,000 個類別中的 120 萬張影像),另一方面依賴經濟實惠的圖形處理器(Nvidia Cuda GPU)這項技術已經真正開始流行。
「錯誤率的降低使得一場真正的革命以令人難以置信的速度發生了。一夜之間,大多數語音和視覺研究團隊放棄了他們喜歡的方法,轉而轉向卷積和其他神經網路。,Yann Lecun 解釋道在法蘭西學院,2016年。
如今,監督學習系統已經變得極為複雜。它們能夠處理數千個類別和數億個特徵。一些神經網路現在超過 150 層。監督學習領域最負盛名的進展是 Tesla 和 MobileEye 的自動駕駛儀。
獎勵學習
但其他形式的學習還沒結束。尤其是強化學習,也有它的輝煌時刻。該技術不依賴標記數據的評估,而是根據經驗獎勵過程進行工作。對此進行評估並反饋到學習演算法中,以改進決策規則並找到更好的問題解決方案。
這種技術在遊戲中被廣泛使用。 2017 年,Google子公司 DeepMind 公司成功創建了該程序阿爾法狗零式只知道圍棋規則的他,在40天的時間裡就在這門學科中所向披靡。他透過與自己對戰來學習遊戲,沒有添加外部數據。同年,馬盧巴微軟子公司推出的密集學習系統不僅能夠打破吃豆人女士的人類記錄(266,330 分),而且還能夠達到最高分(999,990 分)。
問題是強化學習需要很長時間。由於沒有標記數據,誤差評估比較困難。因此,您必須重複這些操作多次。環境的複雜性也放大了這種評估的難度。當許多因素都會影響實驗結果時,我們如何解釋實驗結果?以吃豆人女士為例,研究人員透過部署150 個不同的代理來解決這個問題,每個代理都專注於一個特定的問題:收集盡可能多的吃豆糖,避免來自右側、來自右側的鬼魂。每個代理人都會對下一步要採取的行動發表意見。最終的決定是所有這些意見的結果。
控制環境複雜性的另一種方法是整合卷積網路。這條道路尤其被探索Google2016 年,該技術表明深度學習使得更好地糾正工業機器人手臂的運動成為可能。最終,他們能夠比以前更流暢地抓取物體。
在眼前,人類雄心勃勃的榜樣
但聖杯仍然是無監督學習,這是人類和動物的自然學習模式。它不需要標記數據,並允許軟體自行識別遇到的事物。例如,當應用於簡單的問題時,它可以評估 Spotify 用戶的音樂品味或向亞馬遜客戶提供作品。
無監督學習依賴不同的技術,包括神經網路和演算法。聚類。在後一種情況下,想法通常是計算資料之間的統計距離並識別相似的元素組。
不幸的是,研究人員還不知道如何使用無監督學習來解決複雜問題。
這是一個尚未開發的廣闊領域。「人工智慧研究人員和物理學家處於同樣尷尬的境地;宇宙質量的 95% 具有完全未知的性質:暗物質和暗能量。人工智慧的暗物質是無監督學習””,法蘭西學院的 Yann Lecun 解釋道。簡而言之,機器掌權還不是明天。