為什麼機器學習這麼困難？精選

由 36氪於 04/11/2016 發表收藏文章

圖片來源：pic.36krcnd.com

李彥宏説互聯網的下一幕就是人工智能。機器學習是其中熱門的分支之一，主要研究如何在經驗學習中改善具體算法的性能。機器學習有着光輝的願景，但眼下卻存在一些難以克服的障礙。TechRepubic網站撰文，從技術角度分析了為什麼會出現這些困難。以下是原文翻譯：
專家們紛紛炒作人工智能和機器學習就是未來的一切。可是每個對Siri喊過話的人都明白Siri在對我們提問的基本理解上還很欠缺。我們離實現人工智能的理想也還有很長的路要走。

人工智能和機器學習有哪些難以克服的難關呢？

第一個可以歸結為信任。Google研究主任Peter Norvig的一份聲明中表示，我們看不到機器內部來真正明白正在發生什麼：“機器學習產生的東西並不是代碼，而是被稱作一個黑盒。裏面發生的事情我們知道一點，但並不能把握全部。”
第二個原因是很難教會一個機器足夠多的東西，去理解語境和上下文。Facebook的人工智能研究員Yann LeCun稱，想要機器達到無障礙溝通，需要讓機器理解這個世界是如何運轉的，需要學習大量的背景知識，感受在任何給定的時刻裏這個世界所處的狀態，並且還要有理性和計劃。

這是個不小的壯舉。

以一種精確的方式去做這件事的麻煩在於，我們“喂”給機器的數據必然被人的主觀性所左右。但這一點很難避免。

最後，機器學習的困難之處還在於進入它的編程，Norvig指出:

“缺乏明確的抽象壁壘”，讓調試更加困難，因為它很難隔離一個bug；“非模塊性”（non-modularity），如果你改變了其中一部分，你最終就改變了一切；“不穩定性”——需要持續輸入新的數據；“這是誰的數據?“涉及到隱私、安全性和公平性的問題；缺乏足夠的工具和流程進行傳統軟件的開發。
儘管看起來困難重重，但是未來的曙光仍落在機器學習和人工智能上。

我們曾經生活的世界是一個相對有序、整齊的關係數據庫，現在的世界則是一團亂麻，一個鬆散的、半結構化的關係數據庫。但是我們缺乏數據基礎設施來構建。在用了Apache Hadoop, Apache Spark等等NoSQL數據庫，我們終於獲得了正確的工具，以一個合適的價格（免費、開源）來處理我們的數據。

但是我們還在努力尋找這個龐大混亂的數據庫中隱含的模式。在這方面，機器學習將變得無比重要。Nervana公司的聯合創始人和CEONaveen Rao説：“我的聰明之處大概是在數據中找出結構的能力。”這並不是説今天機器可以以人力難及的方式解釋這個世界。它們所做的事情是在看起來雜亂無章的海量數據中找出結構，而在同樣的時間裏人腦不可能發現其中的模式。
解決問題的訣竅在於讓機器和人類協同工作。這是未來十年人工智能和機器學習的挑戰所在。儘管機器學習有其內在的困難，人工智能和機器學習還是值得期待的。

資料來源：36Kr

留言

我要評論
請按此登錄後留言。未成為會員? 立即註冊

專欄簡介

36氪 36氪（36Kr.com）是中國領先的科技新媒體，我們報導最新的互聯網科技新聞以及最有潛力的互聯網創業企業。我們的目標是，通過對互聯網行業及最新創業企業的關注，為中文互聯網...

編輯簡介

36氪 36氪（36Kr.com）是中國領先的科技新媒體，我們報導最新的互聯網科技新聞以及最有潛力的互聯網創業企業。我們的目標是，通過對互聯網行業及最新創業企業的關注，為中文互聯網讀者提供一個最佳的了解互聯網...

快捷鍵：←

快捷鍵：→

為什麼機器學習這麼困難？ 精選

留言

專欄簡介

編輯簡介

下載 FanPiece 手機 App

為什麼機器學習這麼困難？精選