為什麼機器學習這麼困難?

36氪 於 04/11/2016 發表 收藏文章
李彥宏説互聯網的下一幕就是人工智能。機器學習是其中熱門的分支之一,主要研究如何在經驗學習中改善具體算法的性能。機器學習有着光輝的願景,但眼下卻存在一些難以克服的障礙。TechRepubic網站撰文,從技術角度分析了為什麼會出現這些困難。以下是原文翻譯:

專家們紛紛炒作人工智能和機器學習就是未來的一切。可是每個對Siri喊過話的人都明白Siri在對我們提問的基本理解上還很欠缺。我們離實現人工智能的理想也還有很長的路要走。


人工智能和機器學習有哪些難以克服的難關呢?

第一個可以歸結為信任。Google研究主任Peter Norvig的一份聲明中表示,我們看不到機器內部來真正明白正在發生什麼:“機器學習產生的東西並不是代碼,而是被稱作一個黑盒。裏面發生的事情我們知道一點,但並不能把握全部。”
第二個原因是很難教會一個機器足夠多的東西,去理解語境和上下文。Facebook的人工智能研究員Yann LeCun稱,想要機器達到無障礙溝通,需要讓機器理解這個世界是如何運轉的,需要學習大量的背景知識,感受在任何給定的時刻裏這個世界所處的狀態,並且還要有理性和計劃。

這是個不小的壯舉。

以一種精確的方式去做這件事的麻煩在於,我們“喂”給機器的數據必然被人的主觀性所左右。但這一點很難避免。

最後,機器學習的困難之處還在於進入它的編程,Norvig指出:

“缺乏明確的抽象壁壘”,讓調試更加困難,因為它很難隔離一個bug;“非模塊性”(non-modularity),如果你改變了其中一部分,你最終就改變了一切;“不穩定性”——需要持續輸入新的數據;“這是誰的數據?“涉及到隱私、安全性和公平性的問題;缺乏足夠的工具和流程進行傳統軟件的開發。

儘管看起來困難重重,但是未來的曙光仍落在機器學習和人工智能上。

我們曾經生活的世界是一個相對有序、整齊的關係數據庫,現在的世界則是一團亂麻,一個鬆散的、半結構化的關係數據庫。但是我們缺乏數據基礎設施來構建。在用了Apache Hadoop, Apache Spark等等NoSQL數據庫,我們終於獲得了正確的工具,以一個合適的價格(免費、開源)來處理我們的數據。

但是我們還在努力尋找這個龐大混亂的數據庫中隱含的模式。在這方面,機器學習將變得無比重要。Nervana公司的聯合創始人和CEONaveen Rao説:“我的聰明之處大概是在數據中找出結構的能力。”這並不是説今天機器可以以人力難及的方式解釋這個世界。它們所做的事情是在看起來雜亂無章的海量數據中找出結構,而在同樣的時間裏人腦不可能發現其中的模式。

解決問題的訣竅在於讓機器和人類協同工作。這是未來十年人工智能和機器學習的挑戰所在。儘管機器學習有其內在的困難,人工智能和機器學習還是值得期待的。


資料來源:36Kr

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→