2017年8月 – 读书品物悦心

引言

如今，基于人脸的技术和话题可以说是炙手可热，基于大数据和人工智能的人脸识别更是突破了我们的想象力的极限，如果应用中不能集成人脸识别，那就太跟不上潮流了。人脸识别是一个算法密集型的项目，如果自行开发，需要很深厚的数学功底和算法底蕴，成本较高，我一个做C#的，自问没有那么高的水平能够写出那么复杂的算法，即使能，我们的算法能和其它公司相比吗。不过好在现在是一个互联网时代，自己开发不行，那么使用其它现成的人脸识别引擎可行吗？答案当然是可行的。

本系列文章就将先从静态图片的人脸检测开始，逐步讲解C#是如何进行人脸识别的。共分为以下四篇

1.人脸识别入门—静态照片人脸检测

2.人脸识别入门—基于视频的人脸检测

3.人脸识别入门—人脸识别初应用

4.人脸识别入门—模拟简单的门禁系统应用

在开始之前，我们先来了解一些人脸识别的集成方式和基础知识，为下面的课程做准备。

选择人脸识别引擎的心路历程

通过搜索引擎，可以大致确定集成人脸识别的可选方式有以下几种

1. 集成WebAPI

目前以百度云，腾讯云为首的互联网公司提供了基于WEBAPI的集成方式，可以通过HTTP的方式提交识别请求，识别结果通过JSON串的方式返回。基于HTTP的方式识别人脸是比较慢的，慢的原因在于IO性能，相对来讲，离线版本的API则能够充分利用本机的机器资源，不用往返于所谓的算法云服务器，直接在本地就能完成人脸识别和标记工作。

2. 集成SDK

以Face++和讯飞语音为例，这些公司即提供了在线识别的方式也提供了基于SDK的本地识别方式。本地识别的优点是速度快，集成度高。而且，作为C#，我们还可以搭建自己的云识别平台。如果采用了WEBAPI的，每一笔请求都需要再经过WEBAPI中转，性能上会大打折扣。

因此，如果我们的项目不需要在互联网上访问，可以供选择的只有本地集成SDK一条路了。

集成成本：能免费最好。

软件的成本包括人力成本和采购成本，在考虑成本的时候，自然会想到，我们使用的引擎是否收费呢？即使收费再便宜，一旦流量上来了，也是一笔不小的开支。在做技术选型的时候，成本是一个必须要考虑的因素。有了成本因素，再搜索时，就会悲剧的发现，在百度排首页的那些人脸识别引擎都不是免费的。那么有没有免费的呢。有，网上搜索，这次使用Google搜索，可以发现，github上有一系列的的人脸识别开源代码，但经过试用，不太理想。

踏破铁鞋无觅处，得来全不费功夫

正在一筹莫展之际，突然今日头条推送了一条消息，“人脸识别技术从此免费！虹软一举颠覆人工智能“视”界”，踏破铁鞋无觅处，得来全不费功夫，这么好的机会，何不试试呢。

PS：由于当时并不了解虹软，就是看中了人脸识别和免费去的，后来重新百度了一下虹软，发现这个公司有点意意思，竟然同时拿下了OPPO和VIVO，SAMSUNG这三大手机巨头的单子，还是有两把刷子的。

下载引擎发现只C++

想到就要做到，于是赶紧打开电脑下载了SDK，吐槽下今日头条，做新闻不放链接太不厚道了。只能百度了，链接在这里http://www.arcsoft.com.cn/ai/arcface.html。

可是下载后，傻眼了，不得不说虹软的诚意，这次免费的SDK可真够厚道的，包括了人脸识别，人脸检测，人脸跟踪所有的API。不过美中不足的是，这SDK竟然只有C++版本的，Windows版本不出C#，这虹软有点不近人情啊。不过伤心归伤心，活得还做，没有C#，那我们就拿C++的包裹出C#来用。其实有了C++就等于有了C#，因为C#本身是兼容C++的，可以直接调用C++的库。

基础概念讲解

那么，如何使用C#调用C++的库呢，C#提供了两种技术调用C++的DLL，静态调用（DCOM+）和动态调用（P/Invoke）。我们可以将C或者C++的函数封装成COM组件，在C#中调用时比较方便，但是COM组件需要注册，而且多次注册可能也会导致一些问题，同时在处理C或者C++的类型与COM组件的类型转换的时候也可能有些麻烦，采用动态的方式就是直接用C#调用C或者C++已经写好的动态链接库,这几种方式相对而言，P/Invoke要方便一些。

P/Invoke是什么?

P/Invoke的全称是Platform Invoke (平台调用) 它实际上是一种函数调用机制，通过P/Invoke我们就可以调用非托管DLL中的函数，实际上很多NET基类库中定义的类型内部部调用了从Kernel32.dll，User32.dll，gdi32.dll等非托管DLL中导出的函数。

看一个最简单的例子

[DllImportAttribute(“user32.dll”, EntryPoint = “SetCursorPos”)]

[return: MarshalAsAttribute(UnmanagedType.Bool)] //可写可不写,定义如何封送返回参数

public static extern bool SetCursorPos(int X, int Y);

3) P/Invoke的过程

关于P/Invoke的过程，我找到了MSDN上的一张图，如下所示。

[ clip_image001 ][1]

在使用P／Invoke调用C/C++方法时，会依次执行以下操作

1 查找包含该函数的非托管DLL

2 将该非托管DLL加载到内存中

3 查找函数在内存中的地址并将其参数按照函数的调用约定压栈

4 将控制权转移给非托管函数

注意：只在第一次调用函数时，才会查找和加载非托管DLL并查找函数在内存中的地址。当非托管函数产生异常时，P/Invoke会将异常传递给托管调用方

看起来很复杂，但使用起来却很简单，只需要在C#中重新声明函数的定义就可以了，然后可以像其它函数一样调用。

但是，这里面最棘手的问题是处理要调用函数的签名，还有最难处理的指针和内存问题。我们需要根据SDK的提供方的函数说明来定义函数的签名。C#的自动内存管理机制让我们几乎忘记了C++中很司空见惯的琐碎细节，如果你以前没有玩过P/Invoke，也没有关系，我会给大家尽可能的讲解这里面需要注意的细节。

月度归档： 2017年8月

C#人脸识别入门篇-Step By Step人脸识别

引言