A. 支付寶刷臉登錄匹配哪裡的數據
做刷臉登錄抄前,支付寶會採集個人的頭像數據。一般在支付寶或者其他的app上開通人臉識別的時候,都會通過攝像頭錄入你的臉孔相關信息,包括瞳距,顴骨,眉毛等五官相對位置距離等,這些數據通過攝像頭拍攝後會轉換成數據存在支付寶資料庫里。當然現在也有一些公司是專門做人臉識別的,很多小公司互聯網或者第三方支付公司自己沒有這個技術實力去搞就會直接接專業做人臉識別的公司去弄,背後貌似接有公安部的數據
B. 現在國內的人臉識別監控達到什麼水平了
分幾個方面分別的論述一下人臉識別的技術和產業發展的相關狀況。
第一,人臉識別技術的價值在哪裡。我們把人臉作為一個生物學特徵,作為一個商業化運用,只是備選的一個方案之一。生物學當中,唯一的判斷的標准,其實識別從精準度的角度和不可替代的角度來講,最精準的是虹膜,但是虹膜的識別採集成本非常高,識別的效率相對不是很高,需要等待的時間。所以這兩個條件約束了整個的產業化運用只能局限在相對小眾的,對識別要求極高的軍工、國防等安全性非常高的遠的投入,不適合大范圍的推廣。
第二,指紋。我們知道指紋的唯一性比較強,指紋同時採集成本是比較低的,比對成本也不高。但是為什麼指紋沒有成為一個特別大的可供支付、刷臉可替代的方案呢?實際上主要的原因是因為指紋的可復制性,是一個靜態圖像之間的比對,現在我們可以看到淘寶也好,各種各樣的大量的指紋貼,指紋膜,可復制的特徵,不適合支付。所以指紋現在也大致上被pass了。
第 三和第四分別是人臉識別和聲音識別技術。這兩個在現在橫向來相比,採集成本和比對的效率,以及生命特徵的唯一性來講,性價比比較高。所以現階段來看,人臉識別浮出水面,是有它的道理的,這是它的價值。商業特徵的應用場景到底在哪裡。
人臉識別的應用場景是非常寬泛的,現在主要兩塊,一個是金融行業,一個是安保行業。金融行業,已經從馬雲的螞蟻金服演示中看到了場景,通過刷臉進行支付,顯然刷臉可以付錢了,為什麼不可以簽收快遞呢,下一步淘寶應該會把淘寶簽收快遞的功能打通。我相信有一天,我們會收到無人機送來的快遞,無人機在你的面前拍一張照片,進行對比,就知道這個用戶就是需要的用戶,完成整個的支付過程。實際上這種場景,是經過多方面的討論和認證的。基於這樣的場景,是跟第三方的支付認證相關的,包括我們看到的騰訊的銀行,第一張遠程開卡,就是通過人臉識別的技術,把人證合一進行認證,這樣遠程開戶,遠程開卡的功能,在我們的券商,在我們的網路銀行上面,應該有廣泛的應用。
對於安保行業來說,刷臉開門,現階段,人臉識別的應用應該說達到了一個可具備商業化的水平,我們舉個例子,在去年的時候,香港有一個導演叫許鞍華,他在南京地鐵中丟了一個他的皮包,這個案件的破獲,只花了5個小時。視頻監控裡面獲取了一張照片截圖,截到了嫌疑人的照片,是極其模糊的,側臉的照片,如果肉眼比對,發現不了什麼。但是有一家非上市公司,在這里不能提供他的公司名稱,他們通過一個圖像還原技術,把那個照片還原出可能嫌疑人的樣子,清晰照,用這個照片到圖庫當中比對,鎖定嫌疑人的身份,把嫌疑人抓獲,只需要了5個小時的時間。現在安防領域的監控,我們可以看到各個省市以及地級市,都在上大量的視頻監控,人臉識別的大平台。在整個安防的投入當中,上一代的安防只是靜態的記錄下來數據,但是下一代的安防,是對實時數據的採集、辨認,就是一個核心的技術,這個技術,人臉識別在其中發揮的作用是很大的。
我 們再拓展一下,未來的商業用途,到底有沒有第二代人臉識別技術的潛在的應用的場景呢。我們說在未來,應該說原來整個確定身份的身份證,但是證和人的比對需要人工來完成。如果我們直接界定,達到了這樣的一個標准,實際上每個人所對應的唯一的ID就是臉部的生物特徵。這個識別了以後,所有的地方都可以用刷臉的方式,所有的地方都可以用刷臉去開門,用刷臉去做各種各樣的事情。你刷臉的數據,包括你去坐火車、坐飛機、去哪兒吃飯、購物、收快遞等等,這些數據都會掌握到人臉識別中,刷臉的數據將取代現在線上的點擊量.
現在信用卡、銀行卡消費的數據,其實有助於知道用戶消費習慣和消費數據,做大數據的營銷和徵信,但是刷臉時代來臨之後,這個的價值更大了。有很多張卡,但是只有一張臉,這是唯一的。刷臉數據是2.0時代當中,我們重點看到的。
為什麼在這個時間段,人臉識別的技術會大范圍的爆發出來,大范圍的應用起來,成熟度到底怎麼樣呢?我們首先要界定一下人臉識別技術要達到產品化的應用,是兩階段的過程。第一階段,需要獲取大量的樣本數據,這些數據是用於訓練的,訓練的是學習演算法,這個是深度學習演算法,把這些數據和相互人之間的關系提取出來,進行一個特別的比對。耦合度高,超過一定的水平之後,我們會認定這兩個人是一個人,但是這個模型是需要投入大量的成本,這個成本包括優化的成本,包括數據訓練的成本,包括運算的成本,我們當時人臉識別的一個業內的公司,這家公司的創始人,曾經說,人臉識別的技術意味著什麼呢?太上老君的煉丹爐,有了這個爐之後,大數據是爐子煉的原料,解決計算能力資源的稀缺。因此這些合在一起,形成了現在人臉識別大爆發的時代,就是我們說的技術上的突破。
但是在產業上面的應用來看,目前我們可以看到,美國和以色列的人臉識別,特別是動態識別的水平是國際領先的。全網的實時監控當中,FBI在去年推出了他們的下一代的電子識別系統,總的投入是超過10億美金的。在美國將來無論是在什麼地方犯了事,監控鎖定犯罪嫌疑人,進行全網追捕。
國內是什麼水平呢?頂尖的學術水平,就代表著國內產業發展的階段。目前主要是三種力量,一個是清華大學的蘇光大教授,他是中國的人臉識別之父。第二個是中科院的自動化所的李教授,他早年在微軟的亞洲研究院當中獲得了非常高的成就,後來到了中科院的自動化所,專攻人臉識別。在奧運會當中,以及後來很多的人臉識別的應用當中,提供了比較好的技術。第三支就是香港中文大學的湯曉鷗教授的團隊,每年會進行學術界的比賽,他是高記錄的保持者。目前的識別率是超過了人類的臉部識別的總體水平,湯教授幫助訊飛在語音識別領域之後,在人臉識別的領域當中,建立了自己的行業地位。所以國內基本上目前是這樣的發展階段,我們去推導下面的階段,我們怎麼去甄別人臉識別的技術,到底哪一家靠譜,哪一家不靠譜,我們可以提出一些關鍵的甄別的關鍵點。這些點在哪裡呢?
第一,我們要區分的,動態和靜態配合式的識別還是非配合式的識別。配合式的就是像螞蟻金服那樣的,需要數據的比對方進行配合,可以很好的去採集正臉的二維的數據。另外,就是非配合式的,非配合式的沒有辦法對排除方的配合,是需要隨機採集的圖片進行比對,這個識別的效果會差一些,但是識別的時效性會很高。
這兩種模式當中,我們關注三點。
第一點,你的人臉建模當中到底提取了多少個特徵點進行比對,這個跟我們人臉上面的一些特徵是關鍵節點,每個人的差異很大,而你選取的特徵點的數據越多,比對的准確率就會越高。我們也采訪了一些專家,他們目前能夠做到的特徵點的比對,應該是在700個點以上。目前大部分做刷臉的門禁這樣系統產品的公司,特徵點的選取大概是在50個左右。所以我們去做調研和交流,可以問一下整個公司人臉識別建模當中特徵點的數量。
第二點,人臉識別資料庫的數據樣本和大小,這是一個非常重要的指標。樣本及大小,是我們可供的數據集,這些必須要對人臉,比如說一個人有500張照片,拍的都是他的臉,不同的角度和位置、光線,把這些數據進行合理的清洗,供機器去訓練包括比對和識別之後,可以告訴你是識別對了還是識別錯了,這樣的樣本數非常重要,有助於訓練,提高模型的准確率。因此可標簽的數據樣本集的大小,這個大小目前至少是百萬以上的級別,才會使得現在識別率能夠提升到世界領先的水平,這個也是可以甄別的關鍵點之一。
第三點,是不是你的商業模式能夠對你的整個的數據的獲取,我們說人臉數據的比對,形成一個正循環的模式。實際上數據來源,人臉的樣本來源,是來源於兩個非常重要的渠道,美圖秀秀和美顏照相機,這是一個商業的互換,這個數據,因為考慮到做一個脫敏的處理,剩下的只有幾百個關鍵的特徵點的數據,其他的都被略去,用脫敏的技術之後,形成了從獲取數據到訓練模型,再到優化模型,持續的反饋結果,獲取新的數據,這樣的一個正循環的過程。有了這個以後,你的模型的數據就會獲取的很好了,這是商業模式上非常重要的一個指標。
如果有了這三個指標之後,應當說同時具備了這三個,可能是在人臉識別領域當中有非常大的領先優勢,或者是未來發展潛力的東西。同時我們在直觀的性能方面去分析,直觀的到底識別的表現上有兩個非常重要的指標,一個是識別的准確率,我們界定了剛才說的學術界當中,每年一比的人臉識別大賽,現在基本上測試水平都在95%以上,但是是人和圖片之間相互比對,說明是這個人,這算一個,再比對一個,又對了,算第二個。所有的人和照片都是匹配好的,最後正確率在99.2%左右,這是我們說的目前的正常的比對方法。
還有一個非常重要的方法,我們看到商業銀行和淘寶在內的一些人臉識別的技術,會提出一個錯誤率的問題,這個數據,目前來看可以做到十萬分之一的錯誤率,別人拿著我的身份證去比對,如果機器能夠區分出來,是不通過,這是對的。如果機器把我的身份證給別人的時候也通過了,這可能就是一個錯誤的,錯誤率要在十萬分之一左右才可以,目前能達到這樣錯誤率的公司是屈指可數的,這是一個識別准確率的問題.
另外還是在多大樣本中可以實現這樣的准確率,這個是至關重要的。一個公司裡面也就是兩三百個人,在這些人當中,挑選出來通過,沒有什麼難度。但是在公安部的大平台當中,省級的平台當中,都是上億人的身份證照片中,要准確的挑出來十個或者是一百個候選人,這個范圍縮小到這個概率當中,你的准確率能有多大,這是一個很重要的指標。
第二點,識別的速度問題。同樣還是剛才我們說到的樣本集的大小決定了識別的速度。本身你在可供比對的樣本中,沒有很大的數據,比如說是成千上萬的,識別的數大家都是差不多,都是在1秒之內作出反映,但是如果在一個上億的大的樣本當中,去把照片准確的識別出來,這樣對時間的要求,對效率反映的要求就提高了。所以識別速度是一個很重要的指標。
以上我們說了五個指標,我們說這個確實是可以對公司的具體能力和技術進行綜合判斷的。
基於以上我們說的這些,關注的公司是有識別技術的公司,這個識別技術是人臉識別的技術。我們前面講了,本身國內發言的幾支學術界的力量大家非常清楚,來源於哪一支,背靠著哪一支強大的學術團隊,研究團隊的力量,使得這家公司是一個很好的位置。比如說我們前面講到的科大訊飛,在湯曉鷗教授的支持下,他們的團隊是學術界第一的力量在支持他們,這是一個資源性的優勢。比如說川大智勝,這個和李教授他們有密切的合作,同時他們自己在圖象識別領域當中,也有自己獨特的技術,承擔著國家大量的科研基金的項目,同時我們也特別強調一個就是川大智勝的人臉識別技術,是目前我們看到的人機交互,因為這個和二維的平面識別有很大的區別,優勢非常明顯,因為採集到了五官之間立體曲面之間的結合,所以採集到的數據量更豐富。可供比對的特徵也是更多的,我們之前在視頻當中找到拍到的側臉,不清晰的照片,很難去識別出來犯罪嫌疑人到底是誰,是因為我們二代身份證庫當中,本身就是只有正臉的可供比對的數據。三代或者是四代身份證採集數據的過程當中生物特徵肯定要被提取出來,首先是指紋,三維的人臉識別會更快,三代四代可能就會被提取。
一旦需要被提取到三維的人臉的數據,那麼這個時候川大智勝作為國內目前唯一一家有產品和技術的公司,面臨的是廣闊的市場。但是我們同時也要看到,三維人臉識別雖然有非常驚人的優勢,同時劣勢也是非常明顯的,特徵點的選取,包括側臉的選取,是有難度的。同時表情的因素,其實對於數據處理的影響,沒有在立體表情的因素那麼好,提取的時候效率是偏低的,消耗的數據也非常大。所以現在來看,我們能夠看到的應用場景目前還是小范圍的,包括像美國對犯罪的有案底的犯人,我們國內目前在監獄當中也逐步的推廣,將來全民都要採集,這肯定是一個非常巨大的市場。同時這家公司在人臉識別公司當中,技術特點和現在持續的對三維人臉識別加碼,有一個項目是1.8個億,要投入到研發當中,國家自然科學基金也已經持續的支持他們三維人臉識別的學術研究的項目,已經支持了很多年。所以在這個領域,應該是到了開花結果的地步。所以這一點,我們特別提示大家要關注這個公司,在技術上確實是有稀缺性的。
科大訊飛,就是典型的我們剛才講的商業模式,可以實現人臉識別數據正循環的公司,是擁有互聯網端的入口的。之前在語音的領域當中,訊飛語音雲走的就是這樣的模式,我獲取的是你語音的數據,用你的數據持續的訓練我後台的演算法,使得他們提升和保持和其他競爭對手的領先優勢。這樣的話,數據端的循環,從語音的這個領域當中,復制到圖像識別,就是人臉識別當中。大家如果關注訊飛,大家可以看到,在上個星期的時候,推出了雙重生物特徵的識別的因素,雙重是什麼呢?兩重加密以後,確實就是這個人,把出錯的概率降到非常低的水平。同時識別,雙重加密之後,這個身份驗證的過程可以做到數量級上面的提升。
有了這樣一種開放雲的平台之後,訊飛的數據正規化的過程也在逐步的建立,他下一步會和非常多的第三方的應用方合作,包括可以刷臉開鎖的智能硬體方面,包括和電話銀行,電話客服,還有郵箱去實現他的數據入口的正循環的過程。我們核心的問題就是以上的這樣的一些判斷的標准來去甄別的。我認為訊飛實際上是非常有希望的人臉識別的公司。我們在報告當中,也提到了訊飛是一個生態級的公司,不光是在人臉識別的這個領域當中有比較強的資源優勢和技術優勢,以及商業模式的優勢。同時在我們整個的人工智慧領域當中,訊飛超腦可以不斷的用它孵化,基於學習的模式,從語音遷移到現在的圖像,下一步遷移到語義當中,不斷的做技術的衍生,這樣的生態鏈一旦形成的話,在人工智慧產業的地位是不可動搖的。所以人工智慧整個的產業,我們想推的是科大訊飛。
人臉識別的領域當中,訊飛的優勢也是非常明顯的,同時我們也是看好川大智勝擁有的三維人臉識別的技術。其他的品牌公司,我們可以看到歐比特收購的公司,在安防領域的人臉識別當中,在監獄當中是超過50%的,在產品化方面也做的非常好。其他的兩家,剛剛推出了自己的識別技術,現在了解的信息當中,還沒有辦法很好的甄別他們現在是否擁有滿足我們以上的五個標准。在以後的調研和跟蹤當中,我們會對他們的標准進行梳理和進一步的分解。這是對識別類公司的分析.
下一個階段,我們覺得還有比較好的投資機會,除了第一類識別類的,第二類應該是數據資源類的,數據資源目前來看就是視頻資源,有比較好的視頻資源的公司,可以通過視頻資源進行持續的深度學習的演算法和優化,也許他自己沒有這個技術和能力,但是可以通過技術合作的方式,找到研發團隊或者是公司進行合作,共同開發優勢。目前在視頻資源當中的這些公司進行梳理的話,我覺得東方網力在這個當中步子邁的最前。目前產品端還是沒有關於人臉識別成型的產品推出來,但是他的應用是在於多年的視頻數據的積累。這個是和後期有密不可分的關系。先收購了廣州的安防領域的視頻監控的智能化的公司,這個步子一邁出去,布局的意圖非常的明顯。攝象頭公司會往視頻的公司侵佔,後面的公司將來可能會往存儲的環節去擠壓,有可能將來會把分析和存儲在一個環節當中就完成了,這個時候面臨的壓力是比較大的,所以轉型的動力也是最迫切的,意願也是最強烈的。
所以總體總結下來,現在人臉識別技術大爆發,並不是偶然的,應該說很好的滿足了我們講的人工智慧的三大條件。深度學習的演算法,大數據和雲計算,這三個條件成熟了以後,在拐點到來的時候,大規模的商業化應用是水到渠成的。下一個階段,基於計算機視覺的應用,在視頻監控領域當中,對人的行為模式的識別、跟蹤和分析,這些都會成為一個非常大的市場,成熟度還有待於進一步的檢驗。但是這個市場我們已經都看得到了,所以現在我跟大家探討人臉識別的產業的發展機會,我覺得其實大家需要關注的不僅僅在於人臉識別技術本身的發展,也不僅僅在於哪幾家上市公司擁有哪幾項技術,而是看到背後代表的是整個計算機視覺的興起。
人工智慧報告當中也提到過,計算機視覺的1.0版本,是對靜態圖像的識別,2.0版本,肯定是動態視頻內容的理解和學習,包括像谷歌的無人駕駛汽車,包括報告裡面提到過的以色列的那個公司,也是納斯達克上市的,他們用計算機視覺的技術實現了汽車的輔助的無人駕駛。在這個領域當中,實際上計算機視覺可供開發的應用非常豐富的。現在還有一個法律的問題,就是允許不允許無人駕駛的汽車上路,合法不合法的問題,大家不用擔心這個問題。因為這個公司IPO的時候,這個公司的CEO說過一句話,他說現在還在擔心無人駕駛的汽車上路合法不合法,但是我可以肯定的告訴你,十年以後,人開車上路是不合法的,這肯定是一個大的方向和趨勢。這就是我從人工智慧的領域延伸出來的,人臉識別只是一個點,更多的還有待於大家去一點一點的發掘。