相關推薦

阿里AI視頻識別算法新突破:可幀級解讀視頻

手機裡存了大量的視頻,想剪輯其中的精彩片段卻猶如大海撈針?視頻網站擁有海量視頻,如何嚴格審核避免問題發生?

近日,在德國慕尼黑舉辦的計算機視覺國際頂會ECCV(European Conference on Computer Vision)上,阿里安全圖靈實驗室高級算法專家析策展示了最新的AI視頻識別算法,其識別精度超越目前主流方法,有效提升了視頻自動標籤的行業精度,這一新算法已被ECCV收錄。

阿里安全圖靈實驗室高級算法專家析策表示,為提升AI技術在實際場景中針對視頻識別的精度,提出一種新的基於圖(Graph)的視頻建模方法,能表達含有復雜事件內容的長視頻。

析策表示,這一方法的主要思路是通過“深度卷積圖神經網絡”(下稱“DCGN”)對視頻的幀、鏡頭、事件進行多級的建模,逐漸地從幀級、鏡頭級,一直到視頻級進行抽象,從而獲得視頻全局的表達,進而進行分類。

他舉例稱,“比如一段美食節目視頻中,包含廚師長、主持人聊天、食物、觀眾等內容,AI在學習視頻內容時會先根據內容對視頻進行逐幀的語義表達,形成特徵序列,用不用的標籤進行打標,隨後在通過多層次的網絡對這些不同打標的內容進行關係表達,深度理解這些內容之間的關聯度,將相似的節點銜接起來,最終組合出對整個視頻的理解。”

阿里AI視頻識別算法新突破:可幀級解讀視頻
烹飪節目中包含各種內容,不同內容用不同演示邊框表示,最終組合出對整個視頻的理解

析策表示,一個視頻包含幀、鏡頭、場景、事件等,幀與幀、鏡頭與鏡頭間的關係十分複雜,不僅僅是前後幀的順序關係,而目前公開的建模方法一般都無法表達如此複雜的關係,DCGN因對複雜內容的深度學習和理解進而提升識別精度。

據悉,阿里安全圖靈實驗室已將AI能力在內容治理、知識產權、身份認證驗證和新零售安防等領域進行運用,覆蓋阿里生態的淘寶、支付寶、優酷、UC等核心業務線。

近期刷爆社交網絡的網紅“AI鑑黃師”,每天可審核數億張圖片,識別準確率高於99.5%,技術能力便來自阿里安全圖靈實驗室。連視頻內容都能理解了,解讀一張圖片豈不是小菜一碟?

阿里AI視頻識別算法新突破:可幀級解讀視頻

为您推荐

發佈留言

联系我们

联系我们

工作时间:周一至周五,9:00-17:30,节假日休息

返回顶部