優步創造人工智能 為訓練其他人工智能模型生成數據
生成對抗網絡(GAN)是一個由兩部分組成的人工智能系統,它由一個生成樣本的生成器和一個試圖區分生成樣本和真實樣本的鑒別器組成 。它有無數的用途,其中之一是生成合成數據 。優步的研究人員最近在一篇題為“通過學習加速神經架構搜索”的論文中利用了這一點,提出了一種定制化的GAN(稱為生成式教學網絡(GTN)),它可以生成數據或訓練環境 , 模型可以在測試目標任務之前從中學習 。該論文指出,GTN與僅使用真實數據的方法相比,可以將搜索速度提高多達9倍,GTN與不使用“數量級”計算就可以實現最高性能的最新架構相比,具有競爭優勢 。

【優步創造人工智能 為訓練其他人工智能模型生成數據】正如投稿作者在他們的博客帖子中解釋的那樣,大多數模型搜索需要“大量”資源,因為他們通過在數據集上訓練模型來評估模型,直到模型的性能不再提高 。這個過程可以在一個循環中對數千個或更多的模型架構重復,這在計算上是昂貴且耗時的 。一些算法通過僅訓練少量時間并將獲得的性能作為真實性能的估計來避免成本,但是這種訓練可以通過使用機器學習(GTN)創建訓練數據來進一步加速 。
GTN通過創造對學習過程有用的不切實際的數據取得了成功 。他們可以組合關于許多不同類型對象的信息,或者將他們的訓練集中在最困難的例子上,并且基于實際數據評估訓練模型 。此外,他們使用學習課程(一組按特定順序排列的訓練樣本)來提高生成器的性能 , 生成器會產生一個無序的隨機分布的樣本 。
在實驗中,研究團隊表示,根據流行的開源MNIST數據集,GTN訓練的模型在32步(約0.5秒)內達到了98.9%的準確率 。在這個過程中 , 他們一次拍攝了4096張張和成圖像(不到圖像的10%)(在MNIST訓練數據集中) 。在用于測量模型搜索性能的另一個數據集CIFAR-10上對其進行了評估 。即使與優化后的真實數據學習算法相比,在同等性能水平下,模型的學習速度也比真實數據快4倍 。此外,事實證明,GTN數據的性能通常可以預測真實的性能——也就是說 , 要獲得與僅在GTN生成的數據上執行128步所獲得的相同的預測能力,需要在真實數據上執行1200步 。
“因為GTN可以更快地評估每個架構,他們可以在固定的計算預算內評估更多的整體架構 。在每一種情況下,我們都證明了由GTN生成的數據比真實數據更快,并且可以帶來更高的性能 。即使我們給實時數據控制十天的計算時間,結果還是一樣,而GTN只需要一天的三分之二 。”“通過我們的研究,我們證明了GTN生成的訓練數據創建了一個快速.方法與最新的算法競爭 , 但采用了完全不同的方法 。在我們的……工具箱中擁有這個額外的GTN工具,可以幫助優步、世界各地的所有公司和所有科學家提高深度學習在每個應用領域的性能 。”
猜你喜歡
- 麥當勞在為薯條提供人工智能服務方面面臨重大挑戰
- ?Airbnb房東應該依靠人工智能算法為他們編寫個人資料嗎
- 為人工智能數據科學和數字自動化帶來更多的人類智能
- 揭示人工智能如何刺激藥物開發
- ?人工智能研究為搜尋和救援任務提供了更多的耳目
- 亞馬遜網絡服務計劃其數據倉庫的人工智能友好版本
- 谷歌投入2500萬美元用于人工智能研究
- 微軟將向人工智能技術投資4000萬美元用于解決人道主義問題
- VantagePoint使用人工智能提前近一周預測市場
- 施耐德在人工智能物聯網和數據科學的進步獲得認可
