讀古今文學網 > 刷臉背後:人臉檢測 人臉識別 人臉檢索 > 第1章 人臉檢測、人臉識別與人臉檢索概述 >

第1章 人臉檢測、人臉識別與人臉檢索概述

視頻和圖像中人臉的檢測、識別和檢索,這些圖像處理技術和應用在當今的科技發展中發揮著越來越重要的作用。例如,在公安、交通應用中,人群密度高的區域、城市的道路上都已部署了大量的監控攝像頭(分辨率多為200萬像素的高清數字攝像機),實現對目標人物(如可疑人物、犯罪嫌疑人)及其活動軌跡的全自動識別和檢索,在公安和交通等應用中具有極其強烈的現實需求(目前主要通過人眼對視頻進行人工分析,即辦案人員用眼睛盯著視頻、逐幀查看、反覆比對,這一過程通常極為耗時)。要想實現對這些視頻的全自動、智能分析,就需要準確地對人臉進行檢測、識別和檢索。而人臉檢測、人臉識別和人臉檢索,是當今智能識別的商業應用中迫切需要解決的現實問題。本書以實例為驅動,從應用的角度全面介紹、講解、分析人臉檢測、人臉識別和人臉檢索問題中的經典算法及其應用。

「人臉檢測」和「人臉識別」是兩個容易混淆的概念。通俗地講,人臉檢測是根據膚色等特徵定位人臉區域;人臉識別是識別這個人到底是誰。換句話說,需要首先在圖像中檢測出人臉的區域,即人臉檢測,然後再使用人臉識別的算法,識別出圖像中的人到底是誰。而人臉檢索,指給定一個或多個包含人臉的輸入圖像,從圖像庫或視頻庫中檢索包含所輸入圖像中的人臉的那些圖像。人臉檢測和人臉檢索通常都是非監督學習的過程,即圖像一般都沒有標籤/分類;而人臉識別是有監督學習的過程,需要使用一定數量的有標籤的圖像訓練分類模型。近年來,隨著深度學習的發展,使用大量有標記的人臉圖像訓練的人臉識別模型,能夠更加準確地提取人臉特徵,用於人臉的檢索、檢測中。

需要說明的是,儘管現有算法在LFW等公開數據集上取得了96%甚至更高的準確度,但人臉檢測、人臉識別與人臉檢索仍然是一個尚未很好解決的實際問題。事實上,儘管LFW數據集比原有的公開數據集更加有挑戰性、更加接近真實應用,但其仍然只是一個非常簡單和初級的數據集,遠不能代表真實應用場景。由於表情、年齡變化、光線變化、不同姿態、不同圖像分辨率等因素,現有的技術還達不到完全好用的程度。事實上,多數相關產品都要求正臉照,很多商業軟件還需要手動採集不同光照、有無眼鏡時人的圖像。