/朝聞社/2022年05月27日廣州消息——近年來,随着“一帶一路”倡議的推進,擁有極其豐富資源的新疆作為“絲綢之路經濟帶”核心地區,已經成為我國西部地區經濟增長重要支點,與其他民族之間的交融與日俱增,越來越多的人開始了解新疆。
新疆,近50%的人口是維吾爾族,以維吾爾語為其主要使用語言,其中有很大一部分人不懂得漢語。
随着AI的飛速發展,應用場景不斷擴展,智能語音設備無處不在,對于方言語音識别的需求也在日漸增加。為了讓維吾爾族民衆也能夠享受人工智能、大數據、雲計算等新技術為工作生活所帶來的便利,标貝科技基于深度學習平台以及維吾爾語大量詞彙,推出維吾爾語語音識别服務,助力維漢之間商業文化的交流,推動當地經濟社會全面發展。
标貝維語語音識别能力
語音識别是解決讓機器聽得懂的問題,但是受複雜的外部因素影響,如環境噪聲、多人對話、方言口音等,都會對識别結果造成一定幹擾,一旦識别錯誤,就可能影響溝通雙方對信息的理解。
标貝科技基于自研的深度神經網絡訓練聲學模型,并采用大量維語語料數據進行模型和系統的疊代調優,最終輸出可以商業化的維語語音識别服務能力,整體識别速度和準确率可以滿足多種語音交互場景的個性化需求。
例如,在智能客服領域,針對人工坐席與客戶的通話錄音進行智能話務質檢,幫助客服提升服務質量;在政務應用方面,可以為新疆的公安、司法等機構提供智能會議語音轉寫方案,為法院提供智能庭審實時語音轉寫系統,讓信息溝通變得順暢,有效提升政法機構業務效率;在線教育場景中,精準識别維語學習者的口語發音、表達能力并進行分析,快速提高口語能力。
标貝維語語音數據庫
衆所周知,基于機器學習的各種技術,往往都離不開算法和數據的積累。而想要提高語音識别的準确率,就需要大量的優質語音數據作為模型訓練支撐。
維吾爾語是新疆維吾爾自治區的官方語言之一,目前我國境内使用人口約有1,500萬。由于其黏着性語言的特征,利用豐富的詞綴可以産生超大詞彙,讓維吾爾語語音在采集、标注上的難度高于國内其他語言,導緻維語的語音識别訓練語料始終稀缺,給語音識别帶來很大困難。
面對以上難題,标貝科技在上線維語語音識别服務前,就已經推出800小時、1000多人參與錄音的成人維語朗讀及自由交談數據庫,已經完成标注,數據質量達到商業化的要求。
成人維吾爾語朗讀數據庫
數據庫特點:朗讀類語音
錄音環境:安靜室内
數據時長:600 h
錄音人數:605人
錄音語料:通用
文件格式:WAV
語音參數:16kHz/16bits
錄音設備:手機
适用領域:可應用于智能客服、智能家居等語音識别場景
成人維語自由交談數據庫
數據庫特點:自由交談類語音
錄音環境:安靜室内
數據時長:200 h
錄音人數:450人
錄音語料:通用
文件格式:WAV
語音參數:16kHz/16bits
錄音設備:手機
适用領域:可應用于智能會議系統、輸入法、社交等語音識别場景
歡迎對以上數據集感興趣的行業夥伴聯系我們~
伴随此次維語語音識别能力的上線,當前标貝科技可以支持漢字、英文;方言中的粵語、維語的語音識别,廣泛應用于工作、生活、學習多種場景。未來,标貝科技将在技術創新和數據服務的基礎上,持續為AI産業打造更準确、更高效的語音識别服務。