在智慧交通的整體體系中,車牌識别無疑是基礎性的應用之一。車牌識别應用要求将靜止或運動中的汽車牌照從複雜背景中提取并識别出來,通過車牌提取、圖像預處理、特征提取、車牌字符識别等技術,識别車輛牌号、顔色等信息。車牌識别是自動化交通控制的基礎應用,其識别成功率以及準确率會對交通運行效率、收費、違規行為處罰等帶來較大影響。
北京智芯原動科技有限公司*(以下簡稱:智芯原動)是中國領先的人工智能及解決方案提供商,專業從事人工智能算法和算法芯片的技術研發,智能化産品、解決方案的開發交付,以及智能雲服務的集成,緻力于加快人工智能技術在各個行業中的應用,以提升用戶體驗和工作效率。為了滿足車牌識别的要求,智芯原動推出了深雲識車* 平台,該平台可準确識别各類車牌。此外,智芯原動還推出了海外車牌識别解決方案,能夠在少量(>1K)車牌樣本條件下快速疊代,僅需2-4周的交付周期即可實現新國家車牌的開發任務,且綜合準确率可高達90%-95%。
為了進一步提升車牌識别平台的推理性能,加速面向海外車牌場景的算法訓練速度,智芯原動搭載了第二代英特爾® 至強® 可擴展處理器與英特爾® OpenVINO™ 的組合解決方案,并使用了針對英特爾® 架構進行優化的 Caffe* 應用,實現了數十倍的性能提升。
挑戰:海外市場給車牌識别帶來嚴峻考驗
在互聯網停車領域,智芯原動除了出入口車牌識别外,還陸續推出了路邊停車、停車場内車位相機,同時智芯原動也開始進入海外停車市場,已經在香港、台灣、澳門、馬來西亞、印尼、泰國、新加坡、越南等多地開始部署,預計未來3年車牌識别相機部署量接近百萬台。在海外車牌識别市場,一個重要的特征是每個國家或地區在車牌的長寬度、顔色和字符組成上都有着一定的差異,同樣的一套算法無法适用于每個國家與地區。
要對每個國家與地區的車牌識别算法進行針對性訓練,無疑需要本地化的數據作為支撐。如果通過傳統的車牌算法,将需要海量的車牌樣本,同時需要長達數月的交付周期,才能将車牌識别的準确率提升到可用的水平。而這一速度,顯然無法滿足快速的市場競争需求,智芯原動希望能夠基于少量的車牌樣本完成快速的産品部署,這要求其對于算法進行不斷創新,同時也要部署更高效的基礎設施平台與深度學習加速工具。
此外,車牌識别系統本身也對于深度學習性能帶來要求。根據智芯原動的工程師測算,目前單核處理器做一次車款識别需要40ms,按照停車高峰期每10秒一輛車計算,深雲識車服務總共需要1000個4核處理器。一旦再提供公安警用服務的話,壓力更會成倍增加,因此需要實現更高效的深度學習計算能力。
智芯原動面向海外市場的領先算法平台
面向海外市場的車牌識别需求,智芯原動推出了海外車牌識别解決方案,在技術上,海外車牌算法的實現是通過車牌提取、字符分割和字符識别三個步驟來搭配完成,即從背景複雜的含有車牌的圖像中提取出車牌圖像,然後對提取圖像進行必要的預處理、分離出單個字符,接着提取字符的特征并與标準字符進行比對,輸出待識别車牌的車牌号碼。智芯原動針對不同的車牌類型會采用不同的車牌定位和字符分割算法,以确保識别的準确率。
方案最大的亮點即基于自研車牌算法框架,能夠在少量(>1K)車牌樣本條件下快速疊代,僅需2-4周的交付周期即可實現新國家車牌的開發任務,且綜合準确率可高達90%-95%。目前,該方案已經在全球二十幾個國家和地區實現了規模化商用。此外,方案還具備以下特點:
● 支持二十多個國家與區域的車牌識别
● 适用卡口、出入口、停車位等場景
● 算法框架采用靈活模型匹配策略和模塊化設計,在少量樣本下能夠實現新國家車牌的開發和實現
● 算法支持跨平台設計,滿足前端相機、後端服務器不同方案需求
● 中國團隊原廠研發支持,問題疊代高效,項目需求響應及時
在該方案中,智芯原動使用了基于卷積神經網絡深度學習的車款識别方法,并通過MobileNet*、GoogleNet* 等拓撲結構來實現分類推理優化。在智芯原動對車牌識别算法進行優化之後,有助于在小樣本的前提下實現應用的快速開發及部署。
解決方案:基于英特爾® 架構加速推理性能
在基礎設施架構方面,智芯原動面向不同國家及地區的實際應用環境,推出了不同的參考方案,車牌識别的工作負載可以靈活的由雲數據中心,或是邊緣設備來承載,可以滿足用戶對于延遲、部署成本、網絡等方面的不同要求。
在服務器端,智芯原動搭載了第二代英特爾® 至強® 可擴展處理器與英特爾® OpenVINO™的組合解決方案。第二代英特爾® 至強® 可擴展處理器采用矢量神經網絡指令 (VNNI) 的全新英特爾® 深度學習加速功能,提高了人工智能推理的表現,與上一代産品相比,性能有了顯著提升,第二代英特爾® 至強® 可擴展處理器有助于在整個數據中心到邊緣之間實現充分的 AI 支持。
相較于智芯原動之前所使用的第一代英特爾® 至強® 可擴展處理器,第二代英特爾® 至強® 可擴展處理器進一步提升了性能表現,特别是其支持的 VNNI 等技術提高了将推理性能提升到新的層次。在具體的應用實例中,性能的提升将允許用戶部署更少的節點,同時支撐更多的推理負載,實現更低的總體擁有成本 (TCO)。
英特爾® OpenVINO™ 工具套件分發版則支持開發人員使用行業标準人工智能框架、标準或自定義層,将深度學習推理輕松集成到應用中。通過在底層的英特爾® 至強® 可擴展處理器上運行,英特爾® OpenVINO™ 工具套件分發版可實現具有競争力的推理速度和極低的精度損失。同時,借助 AVX-512 和 MKL/MKL-DNN boost 庫的支持,這一解決方案還可實現卓越的計算性能。
效果:實現接近30倍的性能提升
為了驗證第二代英特爾® 至強® 可擴展處理器與英特爾® OpenVINO™ 在不同拓撲結構中的推理性能,智芯原動搭建了測試平台,測試平台的配置如表1所示2:
在視頻圖像分析推理性能的測試中,測試人員分别測試了在MobileNet、MobileNet-V2、GoogleNet、VGG-16等多個拓撲結構中,使用公共版Caffe*、英特爾優化版本Caffe,以及OpenVINO™ 的推理性能。測試數據如圖1所示,與英特爾優化版本 Caffe 相比,使用OpenVINO™ 在 MobileNet 中實現了28.4倍的性能提升1。
同時,在SSD、RPN 檢測推理優化的測試中(測試數據如圖2所示),相比帶有 FP32 的英特爾優化 Caffe,帶有 SSD-VGG、RPN-VGG 拓撲結構且使用 Int8 量化的英特爾優化 Caffe 可分别實現 2.58 倍和 2.09 倍的性能提升。
未來:為車輛識别應用負載提供靈活、高效的算力支持
除了車牌識别之外,基于人工智能與深度學習技術的檢測推理還廣泛應用于車輛識别的其它場景之中,并用于檢測車輛型号、顔色、大小、位置等用途。這些應用負載在依賴先進算法的同時,也對于平台的算力提出了一定的要求。智芯原動的雲端車款識别平台可識别1600種左右車款,車款信息包括:品牌、型号、年代,識别準确率超過99%,該平台同時也可應用于警用安防系統、高速公路收費等領域的車款識别。
通過與英特爾進行合作,智芯原動能夠為車輛識别深度學習應用提供更加靈活的基礎設施平台,如在數據中心通過CPU、GPU、FPGA的組合實現深度學習異構計算,或是在邊緣端部署統一的邊緣計算服務器,承載車輛、車牌的識别負載,滿足用戶對于檢測精度、速度等方面的需求,助力智慧交通的實現。
1. 基于英特爾和智芯原動内部測試結果
2. 測試配置:平台 1 – 英特爾® 至強® 金牌 6140處理器;BIOS 版本(包括微代碼版本:cat /proc/cpuinfo | grep microcode –m1):SE5C620.86B.00.01.0012.021320180053,總内存96 GB(6 個插槽/16 GB/2666MHz);1 個英特爾 960GB 固态盤操作系統盤;CentOS 7.4.1708,3.10.0-957.10.1.el7.x86_64;平台 2 -英特爾® 至強® 鉑金 8260處理器;BIOS 版本(包括微代碼版本:cat /proc/cpuinfo | grep microcode –m1):SE5C620.86B.02.01.0008.031920191559,總内存96 GB(6 個插槽/16 GB/2666MHz);1 個英特爾 960GB 固态盤操作系統盤;Ubuntu 16.04.3 LTS,4.10.0-28-generic