伴随着物聯網時代的到來,語音交互已然成為人與機器“交流”的重要環節。以語音為切入口的布局端成為了許多科技公司的必争之地。
但語音賽道也有其鮮明的行業特征:首先,語音的交互流程、交互邏輯較之于圖像更為複雜,決定了其産品應用商業落地的複雜性與難度更高,用戶對于産品性能期待值更高;其次,從國内市場看,圖像相對于語音賽道而言,擁有更為确定性的場景應用,作為語音公司而言,要生存,也意味着更加考驗團隊的“市場刨食”能力。
與此同時,由于語音場景碎片化現狀,對于行業玩家,不僅需要在技術方面提前布局,反複打磨,更需具備靈敏的商業嗅覺,提前發現并布局市場機遇。
一個行業越是“紛繁複雜”,越能考驗身處行業中企業的定力和底氣。在語音賽道中,有這樣一家專注語音AI技術的公司——雲知聲,其曆經8年的打磨,在語音賽道上探索出自己的生存法則和市場嗅覺。
8年的時間,雲知聲也從曾經的默默無聞,逐漸成長為行業領軍企業,不僅在技術且在商業化道路方面,也呈領跑趨勢。而在近期,雲知聲正式向上交所提交IPO招股書材料,公司正向“科創闆AI語音第一股”發起沖擊。
敢為人先
如何判斷一家AI公司的路走的正确與否呢?雲知聲提供了一個很好的研究範本——看一家企業的路對不對,主要是看其在關鍵時刻的那幾步走的對不對,而不是看其大多數時間和其他人做了多少相同的事。
“算力、算法、數據”是構建人工智能核心技術的基礎要素,其中帶領AI産業駛離深水區,實現真正産業落地的關鍵之一就在于算法側供給提升。在這一方向上,雲知聲于2012年率先将深度神經網絡(DNN)應用于商業語音識别系統,并在後續的人工智能浪潮中持續進行前沿算法的商業實踐。
基于公司先人一步将DNN引入語音領域,在後續的人工智能浪潮中持續進行前沿算法的商業實踐,例如,後來湧現的卷積神經網絡(CNN)、回歸神經網絡(RNN)、端到端序列建模、生成對抗網絡(GAN)、注意力轉換模型(Transformer)、雙向編碼表征轉換模型(BERT)、知識蒸餾(KD)、自監督學習(SSL)等主流技術方法,雲知聲都是業界最早的産業實踐者之一。
而從現在絕大多數企業的選擇來看,DNN已經成為了主流選擇。也就是說,雲知聲當時超前的技術預判後來被證實是正确的。
除了率先擁抱DNN外,雲知聲的另一個關鍵一步就是2015年啟動自主造芯。
據了解,為了進一步降低智能語音交互方案的功耗、提升其喚醒的靈敏性,進而滿足更多物聯網設備加載語音交互功能的需求,雲知聲自2015年起,前瞻性布局人工智能語音芯片,着手開發uDSP處理器和DeepNet IP技術。
在此基礎上,雲知聲于2018年率先交付人工智能語音芯片——“雨燕”,後于2019年陸續推出車規級芯片“雪豹”和面向家居領域的第二款升級版芯片“蜂鳥”系列,并啟動具備“圖像+語音”多模态交互功能的芯片“海豚”的研發,持續領跑同業。
需要注意的是,當前越來越多的AI語音公司不約而同地闖入造芯新賽道,從算法出發“軟硬兼施”已然成為一條必走之途,但也顯得語音AI市場變得異常競争激烈。與之相比,雲知聲所推出的芯片又是否具備在這場競争中“脫穎而出”的品質?
芯片性能優越
以雲知聲當前的主力芯片産品之一“蜂鳥”為例,根據灼識咨詢研究結果,其與同期其他市場參與者主力産品相比,“蜂鳥”在語音處理效率和商用成本方面均具有明顯優勢。
具體而言,“蜂鳥”芯片采用先進的DSP+神經網絡+MCU的異構設計,異構設計相較傳統的通用CPU架構,一方面可以大幅度提高芯片的運行效率,另一方面可以減少芯片面積以及功耗。其浮點運算能力和定點運算能力可分别達到16MAC/時鐘周期、32MAC/時鐘周期,均領先于相同面積下同類芯片的性能。
此外,“蜂鳥”芯片内部集成1.5MBSRAM,搭載雲知聲自有語音識别算法,可實現遠場5m距離,準确率>98%的遠場語音識别,相比相同競争對手所需RAW容量減少近一半,這在對成本敏感競争激烈的語音芯片市場是至關重要的。
同時為了最大限度提高芯片的集成度,“蜂鳥”芯片在芯片内部集成了FLASH,實現了真正意義上的單芯片語音解決方案。
今年上半年,得益于規模化推廣“蜂鳥”,并放棄毛利率較低的産品,雲知聲智能語音交互産品直接硬件采購成本占比降至26.17%,毛利率顯著回升。
另外,雲知聲還結合自主産權的人工智能加速器IP,設計并開發出了車規級語音AI芯片——“雪豹”,該款芯片與雲知聲的人工智能軟件引擎和車聯網人工智能解決方案進行垂直整合,形成完整的雲端芯一體解決方案。
目前,車規級芯片“雪豹”已進入吉利汽車的産品穩定性測試以及車規級測試階段,通過後即可在吉利汽車的主流平台上線。
通過“唯快不破”的造芯發展思路,雲知聲很快在語音識别風口中比肩行業頭部公司。
此次科創闆IPO中,雲知聲拟投入3.17億元用于“面向物聯網邊緣計算的人工智能芯片研發平台建設”項目。該項目旨在通過人工智能芯片研發,提升物聯網終端的邊緣計算能力,提高應用領域内的芯片設計水平。
獨特的雲端芯一體化
雲知聲董事長/CTO梁家恩博士曾指出,雲知聲很早就搭建了被譽為雲知聲版“TensorFlow GKE (Google Kubernetes Engine)”的 Atlas機器學習計算平台。基于該平台,向上支撐起信号(AEC/SSP/ISP)、語音(ASR/TTS/VPR/CALL)、語言與認知(NLU/NMT/SDS/ICI)、圖像(FID/OD/OCR)等多技術領域的橫向擴展和縱向疊代。
通過将能力封裝在自研 AI芯片之上,雲知聲率先打磨出了獨特的“雲端芯”産品中台,對核心技術進行了模塊化梳理和整合,從而具備面向市場需求的快速産品化能力,支撐公司以豐富的産品組合為衆多知名企業提供服務。
據了解,雲知聲的“雲-端-芯”産品中台落地“AI生活(家居、車載、機器人等)”與“AI服務(醫療、教育、政務、酒店等)”兩大核心場景,繼而貫通雲知聲從 AI技術到産業應用的生态閉環。
在家電領域,公司智能語音交互方案已被格力等家電龍頭采用;在酒店、商業地産和住宅領域,雲知聲與世茂集團達成戰略合作,成立合資公司,面向世茂集團下屬的衆多酒店批量交付智慧物聯解決方案,帶來銷售收入的快速增長。
在醫療領域,雲知聲通過與北京協和醫院合作,率先在國内落地醫療病曆轉寫解決方案,并在行業内被快速推廣,目前已在100多家醫院上線使用,超過500多家醫院在測試使用。此外,公司與平安好醫生成立合資公司,試水醫療領域智能硬件産品的開發。
在汽車領域,雲知聲還與億咖通成立合資公司,為戴姆勒奔馳等整車廠提供車載語音解決方案,并攜手探索基于自研車規級人工智能語音芯片“雪豹”的車載語音解決方案的應用。
依托“雲-端-芯”産品中台,雲知聲已形成了三大系列、數十個産品相輔相成、高度融合的産品矩陣。此外,受益于獨特的産品中台體系,雲知聲的技術能力到産品落地周期被顯著縮短,驗證有效的前沿算法通常可在3-6個月時間内應用于終端産品,确保了公司産品的開發效率和競争力,增強了雲知聲的市場競争力。
結語
當前,人工智能公司們正迎來企業發展的黃金時代,一方面,自2015年以來,人工智能就成為了市場熱點,相關産業正式被提上國家層面戰略,比如十四五規劃建議稿指出,“要瞄準人工智能、量子信息、集成電路、生命健康、腦科學等前沿領域,實施一批具有前瞻性、戰略性的國家重大科技項目。
按照中央規劃,未來人工智能核心産業、人工智能與傳統産業融合均是戰略發展重點。平安證券預計,到2020年我國人工智能核心産業市場規模将超過1600億元,帶動相關産業市場規模将超過萬億元。
另一方面,科創闆采取更靈活的上市機制,有利于一批AI企業加速登陸資本市場。目前雲知聲的科創闆審核狀态變更為“已問詢”,IPO進程正在穩步推進中,公司有望成為科創闆AI語音第一股。