關于人工智能(Artificial Intelligence,英文縮寫為AI),今年3月谷歌Alpha Go大戰李世石并取得五局四勝,相信很多人對此都已經不陌生了。除了Alpha Go這個人工智能棋手,谷歌在人工智能方面的探索還有很多,比如在今年5月19日的I/O開發者大會上,谷歌對外發布的智能家居的家庭智能終端Google Home。
“OK,Google,播放今天早晨的音樂”
“Hey,Google,把Kevin房間的燈打開”
……
是不是很炫酷?!當然了,實際上在Google Home之前,亞馬遜早在2014年11月就發布了Echo智能音箱,這款矮墩墩的圓柱形產品據估計已經售出約300萬臺。
蘋果也在今年6月14日的蘋果開發者大會上,首次將蘋果語音助手Siri向開發者開放。蘋果雖然在2012年就率先發布基于人工智能的Siri,但由于存在與許多第三方服務不兼容、缺乏可提取的用戶個人數據等弱點,用戶接受度并不理想。分析人士認為,蘋果沒有利用好在語音數字助手方面先聲奪人的優勢,如今開放Siri平臺正是希望與亞馬遜、谷歌等互聯網公司發力競爭,向開發者提供開發工具,以求搶占市場。
除了這些國際互聯網巨頭,不少中國公司其實也在人工智能、語音識別方面躍躍欲試,包括百度在2015年世界大會上全新推出的度秘(英文名duer)、科大訊飛以語言語音為入口的認知智能“訊飛超腦”、為智能硬件產品提供語音交互技術和解決方案的思必馳、擅長語義解析的蟲洞、做微信語音生活搜索的出門問問等。
在這其中,還有一家叫做“云知聲”的公司。
云知聲創立于2012年6月,專注在物聯網人工智能服務,2013年6月完成1億元A輪融資,2014年底完成5000萬美元B輪融資,2015年底完成了B+輪數千萬美金的融資。
近日,云知聲在中關村召開“認知世界,更強智能”技術引擎升級分享會,宣布云知聲已完成技術引擎3.0版本升級,并首次提出“語用計算”的技術理念。
何謂“語用計算”?國內外人工智能有什么差異?人工智能未來的發展趨勢會是怎樣?云知聲CEO黃偉在會后接受了有言的采訪。
云知聲的四年:免費開放 B2B2C
2004年,中科大博士畢業的黃偉加入了摩托羅拉中國研究中心(MCRC)。期間,他帶隊開發出世界上首個手機聲紋認證系統。后來語音識別系統開發商Nuance公司收購了黃偉所在的摩托羅拉語音業務團隊。
2009年,黃偉加入盛大創新院,并于次年創建語音分院,力圖將語音識別技術與盛大互動娛樂系統相結合,延展到用戶端。
2013年底,黃偉正式加入云知聲,并出任CEO。云知聲的創始人梁家恩在黃偉到任后,轉任公司的董事長兼CTO。
在云知聲創立之時,科大訊飛已經在市場上占據優勢地位,梁家恩因此強調互聯網思維,采取更靈活的手段去擴大合作伙伴。據了解,當時羅永浩做錘子手機的時候想加入語音控制,最初找的是科大訊飛,但找了 2個月對方沒拿出任何東西,后來云知聲迅速跟進并達成合作,錘子手機的發布會也才讓很多人知道了云知聲。除錘子外,搜狗和樂視也是很早就與云知聲達成合作的。
據了解,云知聲最初的數據庫是需要好幾千人,甚至上萬人去錄制的,必須要知道每一個特殊的發音是什么樣的。為了擴大語音數據來源及開拓市場,云知聲將其語音云平臺面向企業和個人開發者免費開放,去支持更多的中國用戶的語音交互。
2015年9月24日,樂視對外第3代超級電視,推出超級語音2.0功能,背后就采用了云知聲技術支持的語音助手。除樂視外,云知聲還為長虹、海爾等白電品牌提供了智能語音解決方案。
黃偉認為,相比可穿戴的智能終端,智能居家和車載將是會更好的載體,市場使用前景也更加豐富,也更能體現出語音技術在智能領域上的價值。因此云知聲采用B2B2C的模式,重點布局了智能家居、車載兩個類別,另外則是醫療和教育。
在產品層面,AI芯、AIUI、AIService三大解決方案支撐起云知聲核心技術的落地和實現,目前已經在家居、汽車、醫療和教育等領域有廣泛應用,形成了完整的“云端芯”生態閉環。4年間,云知聲的辦公地點從幾十平米的民宅,走到了幾千平米高大上的寫字樓;從10多人的小團隊,發展到了200人左右的中等規模企業。
據云知聲官方公布的數據顯示,云知聲已經覆蓋了476個城市,9000萬臺接入設備,年調用量增長率達到了375.3%。目前云知聲占有中國后裝車機市場60%的市場份額,同時云知聲還是白色家電領域唯一落地出貨的芯片供應商。云知聲的合作伙伴數量已超過2萬家,覆蓋用戶超過1.8億。
黃偉表示,云知聲接下來講將進一步通過布局物聯網來自動獲取數據,未來將從“以設備為中心”進步為“以用戶為中心”、“以數據為中心”。
至于未來會不會研發面向消費者的2C產品,黃偉表示短期內還沒有相關計劃。在他看來,人工智能是技術和數據驅動的,現在這個時間點還是用戶培養階段,并沒有到爆發的階段,任何產品做的再驚艷用戶量都不會很大。云知聲采用B2B2C的方式去過度,先輔佐客戶給他們提供方案,幫助他們把產品落地,但也不排除在未來會研發自己的終端產品。
什么是“語用計算”?
黃偉:語用計算是語義理解的下一階段,云知聲在基于語義理解的基礎上,加入了語言的現場環境和背景信息的因素——讓機器真正理解語言深層次的含義。
語用計算即應用多樣化的語境信息為對話式交互服務的技術。這一技術和學術界提的計算語用學的區別在于:
1、我們考慮了人機交互的特殊性。即人、設備、環境,而不是人與環境,語境信息中包含了和設備相關的內容,如設備的反饋、設備的顯示內容、設備的感知器獲取的信息、家居中控的設備信息庫等。
2、計算語用學主要研究會話語義的理解,而語用計算不僅僅包括語言理解,還包括在自然語言生成和人機交互框架中如何利用語境信息。
為什么云知聲不做2C產品?
黃偉:我們從成立的第一天起就是一個B2B2C的公司出現,當然現在也有很多公司在做2C產品,但我們認為現在2C的人工智能產品可能銷量都不會很好,反倒不如在背后給客戶提供好技術支撐,我有很多的技術要打磨,我們希望把技術做的更加完善。但如果我們把這些問題都做好了之后,可能也會推出自己的2C產品,這是不同階段的選擇。
技術創新的互聯網創業公司如何生存?
黃偉:過去幾年中國一直在強調模式創新和運營創新,模式創新是沒有壁壘的,運營創新是互聯網公司的一個強項,但可能只有BAT去做,因為必須要有強大資源去投入。技術創新需要長時間的一個積累,中國現在在海外做的最好的是華為,有技術有產品有品牌。技術創業要敬畏技術,但也不能把技術放大化,做好技術的同時也不能疏忽管理和運營。
在云知聲成立還不到一年的時候,BAT中的一家就曾經想要收購云知聲,但我們認為肯定沒必要賣。現在這個階段,人工智能BAT也都在做,但并不是說其他技術團隊就沒有生存空間了。
中文語音識別方面,現在競爭態勢如何?
黃偉:我認為在中文語音識別領域,云知聲是屬于第一陣營的,其他還有蘋果、谷歌、百度、訊飛等。云知聲的規模當然沒他們大,但是我們有自己的獨特優勢,細分方向不一樣,我們可能會更專注,單點突破。我相信在物聯網這個時間窗口,和其他公司比,云知聲雖然資源上有差距,但是從產出上來說的話,目前來說我們不僅沒有差距,反而正走在前面。
與科大訊飛這樣的巨頭相比呢?
黃偉:訊飛毋庸置疑是偉大的企業,但訊飛的主營業務集中在教育、運營商、金融、政府領域。另外訊飛是一家上市公司,要關注資源投入和收益產出比。坦率來講,今天物聯網的業務幾乎是賠本的,所以我們跟訊飛技術都很優秀,但是為了讓客戶買單的話,技術優化目標不一樣,提供的服務不一樣的,對客戶的服務水平也不一樣。整體而言就是資源投入上訊飛可能不會作為重點,但對云知聲來說物聯網是要全身心來做的事情,今天它的規模并不大,但我們更相信未來。
人工智能領域的全球競爭呢?
黃偉:業內一線的公司包括谷歌、百度、科大訊飛等使用的技術都差不多。因為現在學術、技術層面的溝通是相對非常充分的。不同在于,每家公司基于對算法的理解程度不一樣,加上面向的應用場景不同,針對不同場景的優化細節也會不太一樣。
(審核編輯: 智匯胡妮)
分享