一分鐘了解視頻內(nèi)容分析
2018.06.05
當(dāng)前的視頻內(nèi)容分析技術(shù)主要是指對網(wǎng)站中視頻進(jìn)行語音、文字、人臉、物體、場景多維度分析,輸出視頻泛標(biāo)簽,提升搜索推薦效果。
我們通常會(huì)從以下幾個(gè)方面提取視頻當(dāng)中的內(nèi)容:
「1」看到聽到的內(nèi)容: 視頻中包含的色彩、外形、聲音等內(nèi)容
「2」認(rèn)識的內(nèi)容: 視頻中包含的一些我們認(rèn)識的東西,事情,它們可能在運(yùn)動(dòng),它們之間的關(guān)系以及運(yùn)動(dòng)軌跡。
「3」體會(huì)到的內(nèi)容: 視頻中包含的能讓我們體會(huì)到的感情方面的影響,需要結(jié)合心理學(xué)等方面的知識進(jìn)行分析。
視頻內(nèi)容分析技術(shù)當(dāng)中的重點(diǎn)應(yīng)用模塊
「1」解析視頻,對于視頻中包含的圖形和音頻進(jìn)行分析,對分析結(jié)果理解后形成分類標(biāo)簽
「2」基于人臉識別技術(shù)和龐大的名人庫,識別視頻中出現(xiàn)的明星、名人
「3」通過語音識別技術(shù),識別視頻中的音頻內(nèi)容
「4」對于特定場景,針對特定物品獨(dú)立建模,可以在識別視頻中識別出該物品
「5」除了人工根據(jù)內(nèi)容定義標(biāo)簽之外,我們可以識別視頻文件中的彈幕、字幕,以及通過OCR技術(shù)識別視頻圖像中的文字內(nèi)容,自動(dòng)為視頻進(jìn)行標(biāo)注