百度硅谷AI實驗室(SVAIL)近日宣布,百度已開源關鍵人工智能(AI)軟件Warp-CTC,并公開了關鍵代碼。百度硅谷實驗室已向GitHub上傳了Warp-CTCC代碼庫,鼓勵開發者試用這些代碼。百度表示,代碼將開放給所有從業者,包括但不限于創業者。百度此次開源人工智能軟件代碼,讓全球知識共享又邁出了一大步,知識共享領域將激發出更多創新,開發者能獲取更豐富的技術學習途徑,促進開發者進行技術開發,對全球人工智能行業發展有著極其重要的現實意義。
巨頭們的奉獻精神 百度開源人工智能代碼
Warp-CTC是百度前期為了在最新的計算機芯片上更快速運行而專門研發的一種改良版深度學習算法。CTC(鏈結式時間分類算法)方法始于2006年,在瑞士AI實驗室IDSIA的論文中有所描述。CTC結合了多個不同的神經網絡設計,以處理不完美的數據集。百度SVAIL工程師在打造端對端語音識別系統時,在CTC基礎上開發了Warp-CTC,該軟件可用于解決繪制輸入序列到輸出序列圖譜過程中的監督問題,改善培訓模型的可擴展性,目前百度已經將其運用在了語音識別的改進和優化上。
在此次正式開源之前,Warp-CTC已被用于開發一款強大的深度語音識別系統DeepSpeech2。對于一些簡短的句子,該系統甚至比大多數人類正確識別語音的能力強。該技術目前已幫助百度數億用戶在移動端更好的獲取相應的服務。百度也表示,希望此次開源能促使端到端的深度學習變得更簡單、速度更快,加快研究者的進度,進而對機器學習領域的進步做出貢獻。
近幾年來,包括深度學習、語音識別等在內的人工智能技術已經成為行業熱點。以深度學習為例,將這項技術應用到互聯網產品中之后,就可以實現各種“用腦”的學習型操作,如精致地轉錄語音或識別物體圖像,相當于將特定字詞的音頻或特定物體的圖像導入一個大型模擬神經網絡,隨著時間推移,此網絡將不斷“自我學習”,從而可以識別出更多的新目標。Warp-CTC技術的應用將有效改善用現有的方式應用CTC時對內存的龐大需求,提升速度數十甚至數百倍。
隨著百度、谷歌、Facebook等企業全面免費開放各自的深度學習技術,研究者和開發者們很快就可以使用這些國際頂尖的基礎技術平臺開發機器學習系統產品,從而推動整個人工智能生態的繁榮。作為一家技術驅動的公司,百度深知,公開技術源代碼將會引起業界更多的興趣和熱情,使得相關的技術發展進入良性發展的循環,為整個產業提供強大的技術驅動力。
(審核編輯: 智慧羽毛)
分享