该技术主要包括人脸检测、人脸对齐、人脸验证/识别三个方面-社会新闻视频
点击关闭

学习方法-该技术主要包括人脸检测、人脸对齐、人脸验证/识别三个方面-社会新闻视频

  • 时间:

姜滨探班鹿晗

與此同時,深度學習對人臉對齊、多姿態人臉檢測、人臉表情特徵提取與降維、表情分類與表情識別應用等問題有創造性貢獻,人臉檢測與人臉對齊等多任務相結合的方法,後面章節會有詳細介紹。

深度學習:目標檢測算法 + 人臉多任務級聯算法

Adaboost(Adaptive Boosting)是一種學習模型,它的核心思想是將弱學習方法通過學習反饋提升成強學習算法,也就是「三個臭皮匠頂一個諸葛亮」。

使用更深的網絡結構進行人臉識別,大約用到了200個CNN結構,模型非常的複雜。

二、人臉對齊人臉對齊任務即根據輸入的人臉圖像,自動定位出面部關鍵特徵點,如眼睛、鼻尖、嘴角點、眉毛以及人臉各部件輪廓點等,如下圖所示。

本文首發於微信公眾號:數據猿。文章內容屬作者個人觀點,不代表和訊網立場。投資者據此操作,風險請自擔。

具体细分则包含以下步骤:

FacenetFaceNet是谷歌研發的人臉識別系統,是一個基於百萬級人臉數據訓練的深度卷積神經網絡的通用系統,可以用於人臉驗證(是否是同一人)、識別(這個人是誰)和聚類(尋找類似的人)。FaceNet採用的方法是通過卷積神經網絡學習將圖像映射到歐幾里得空間。空間距離直接和圖片相似度相關:同一個人的不同圖像在空間距離很小,不同人的圖像在空間中有較大的距離。只要該映射確定下來,相關的人臉識別任務就變得很簡單。

深度習得的人臉表徵具有稀疏性、選擇性和魯棒性,在全連接層前面使用不同的CNN結構。

人臉識別到底是什麼?人臉識別,是視覺模式識別的一個細分問題,也大概是最難解決的一個問題。我們無時無刻不在進行人臉識別,我們每天生活中遇到無數的人,我們能辨別他們的長相,把不同的人區分開來。

数据猿

人臉識別是一項既有科學研究價值,又有廣泛應用前景的研究課題。該領域研究成果豐碩,理論和研發日新月異,並在某些限定條件下得到了成功應用。這些成果更加深了我們對於自動人臉識別這個問題的理解,尤其是對其挑戰性和可能性的認識。儘管在海量人臉數據比對速度甚至精度方面,現有的自動人臉識別系統可能已經超過了人類,但對於複雜變化條件下的一般人臉識別問題,自動人臉識別系統的魯棒性和準確度還遠不及人類。這種差距產生的本質原因現在還不得而知,畢竟我們對於人類自身的視覺系統的認識還十分膚淺。但從模式識別和計算機視覺等學科的角度判斷,這既可能意味着我們尚未找到對面部信息進行合理採樣的有效傳感器(考慮單目攝像機與人類雙眼系統的差別),更可能意味着我們採用了不合適的人臉建模方法(人臉的內部表示問題),還有可能意味着我們並沒有認識到自動人臉識別技術所能夠達到的極限精度。但無論如何,賦予計算設備與人類似的人臉識別能力是眾多該領域研究人員的夢想。相信隨着研究的繼續深入,我們的認識應該能夠更加準確地逼近這些問題的正確答案。

三、人臉驗證/識別人臉驗證做的是1比1的比對,即判斷兩張圖片里的人是否為同一人。最常見的應用場景便是人臉解鎖,終端設備(如手機)只需將用戶事先註冊的照片與臨場採集的照片做對比,判斷是否為同一人,即可完成身份驗證。

該方法主要有兩個步驟:1. LBF特徵提取通過在特徵點附近隨機選擇點做殘差來學習LBF特徵,每一個特徵點都會學到由好多隨機樹組成的隨機森林,因此,一個特徵點就得用一個隨機森林生成的0,1特徵向量來表示,將所有的特徵點的隨機森林都連接到一起,生成一個全局特徵。

與之相對地,人臉識別做的是1比N的比對,即判斷系統當前見到的人,為事先見過的眾多人中的哪一個。要回答的是「我是誰?」,相比於人臉校驗採用的一一匹配,它在識別階段更多的是採用分類的手段。應用場景包括疑犯追蹤、小區門禁、會場簽到,以及新零售概念里的客戶識別。這些應用場景的共同特點是:人臉識別系統都事先存儲了大量的不同人臉和身份信息,系統運行時需要將見到的人臉與之前存儲的大量人臉做比對,找出匹配的人臉。

我們生存的這個星球上,居住着70多億人。每個人的面孔組成部分相同,它們之間的大體位置關係也是固定的,並且每張臉的大小差異也不大。然而,它們居然就形成了那麼複雜的模式——即使是面容極其相似的雙胞胎,也能由微妙的差別區分出來。人臉特徵如同指紋一樣,無法找到完全相同的存在。那麼,區分如此眾多的不同人臉的「特徵」到底是什麼?是否可以設計出與人類一樣能夠自動識別人臉的機器?這是近幾十年來被廣泛研究着的熱門問題。隨着AI技術的發展,也取得了顯著的突破。

一、人臉檢測所謂人臉檢測,就是給定任意一張圖片,找到其中是否存在一個或多個人臉,並返回圖片中每個人臉的位置和範圍。自動人臉檢測技術是所有人臉影像分析衍生應用的基礎。

傳統實現方法:Haar-like + adaboost算法

2.全局線性回歸用訓練好的模型對提取的LBF特徵做回歸,它是一個不斷迭代的過程,越往下,所選擇的隨機點的範圍就越小,特徵點定位精度就越好。

接下來詳細介紹其主要步驟的內容和方法。

然而這項看似簡單的任務,對機器來說卻並不那麼容易實現。對計算機來講,一幅圖像信息表示為一個由眾多像素點組成的矩陣。機器需要在這些數據中,找出某一部分數據代表了何種概念:哪一部分數據是人臉,哪一部分是非人臉,並且在人臉的那部分數據中,區分這個人臉屬於誰。如果想要機器認出每個他看到的人,則這世界上有多少人,人臉就可以分為多少類,而這些類別之間的區別是非常細微的。由此可見人臉識別問題的難度。

人臉識別技術如何實現?該技術主要包括人臉檢測、人臉對齊、人臉驗證/識別三個方面。

基於深度學習的多類目標檢測算法發展迅速,將其應用到人臉檢測中,具有通用性。具體包括以Faster-RCNN為代表的基於Region Proposal的目標檢測算法,以及以YOLO,SSD為代表的基於回歸的深度學習目標檢測算法。

DeepIdDeepFace的工作後來被進一步拓展成了DeepId系列,主要改進的方面有:

Haar-like特徵有多種表示方法(圖示),應用時將任意一個矩形放到人臉區域上,然後將白色區域的像素和減去黑色區域的像素和,得到的值可認為是人臉特徵值;把這個矩形放到一個非人臉區域計算出的特徵值則與人臉特徵值不同。所以這些方塊的目的就是把人臉特徵量化,以區分人臉和非人臉。

兩者相結合,利用 Adaboost優秀的數據挖掘能力從海量的Haar-like特徵中訓練得出強分類器,大大提高了檢測的速度和檢測的精確率。

主要方法:Deepface:Deepface在實現時需要使用3D對齊技術將人臉圖像校準到典型姿態下,然後將對齊的結果送入一個深層CNN網絡進行處理。該模型訓練所使用的數據集數目為四百萬,共包含4000個人的人臉。DeepFace在LFW (Labelled Faces in the Wild)和在YFW (Youtube Faces in the Wild)人臉數據庫上都取得了最好的結果。經過拓展后,其訓練圖庫比原來的圖庫大了兩個量級,包括100萬個人的臉(identities),每個identity有50張圖像,提高了識別的效率和精確度。

深度學習:多任務級聯卷積網絡(MTCNN)

相比于DeepFace,DeepID沒有使用3D的校準,而是使用了一種更簡單的2D仿射校準,所用的訓練圖庫是由CelebFaces和WDRef兩個人臉圖像庫混合而成的。

MTCNN(Multi-task Cascaded Convolutional Networks)算法是用來同時實現人臉檢測和對齊的。該框架採用級聯結構,包含三個階段精心設計的深度卷積網絡,以實現由粗到精的面部預測與部位標記。三個子網絡分別為:Proposal Network(P-Net)、Refine Network(R-Net)、Output Network(O-Net),如圖所示,這3個階段對人臉的處理遵循一種由粗到細的方式。一開始選取了不同尺寸的圖像範圍,構成了圖像金字塔,然後分別輸入這些規模不同的圖像進行3個階段的訓練,以檢測人臉的各個特徵。由於姿勢、光照或遮擋等原因,在非強迫環境下的人臉識別和對齊是一項具有挑戰性的問題。這種算法可以很好的解決上述的兩個問題。能利用檢測和校準之間固有的相關性在深度級聯的多任務框架下來提升它們的性能。

從一萬個分類預測中進行人臉表徵深度學習將多個CNNs結構聯合起來。

傳統實現方法:局部二進制特徵(LBF)回歸

通過聯合識別與驗證進行人臉表徵深度學習,在分類和驗證中使用多任務處理。

今日关键词:爱国留学生唱国歌