基于MATLAB,运用PCA+SVM的特征脸方法人脸识别

分手后的思念是犯贱 2022-08-13 13:44 310阅读 0赞

简介:

这是楼主的第一篇博客文章,下决心写博客也是希望大家在相互交流中得到进步,楼主重大研一学生,菜鸟一名,我希望从一个菜鸟的角度出发来看待一些问题的解决,很多东西也都是针对初学者而言的。文章中可能有许多的错误,希望能看到此文章的博友,无论是高手还是初学者,看到错误能指正,遇到问题能提问,大家在交流中进步,再者楼主文笔拙计,一些语句看上去并不专业,也都是自己的理解,希望通俗易懂的表达出来,望见谅。不废话了,进入正题。

概述:

此文章将要描述一种基于MATLAB平台,运用PCA主成分分析方法对图片数据进行降维,运用SVM支持向量机分类器对降维后的图片数据进行分类处理,从而达到人脸识别的目的。

首先要感谢以下几篇文章的作者(后面引用会标识文章标号)

1.Matlab PCA+SVM人脸识别(一)(A),matlab代码大部分都来自于A篇文章。并且其GUI界面值得借鉴,具体可参考Matlab PCA+SVM人脸识别(二)——GUI界面设计(B).

2.人脸识别经典算法一:特征脸方法(Eigenface)(C)与特征脸(Eigenface)理论基础-PCA(主成分分析法)(D),C篇对关于特征脸识别方法的步骤进行了详细的讲述,并且在一些关键细节问题中有着讲解,D篇对于PCA降维的原理有深入的剖析,都是非常不错的文章。

3.主成分分析PCA(E)与PCA (主成分分析)详解 (写给初学者) 结合matlab(F),E篇列出了具体的数据供大家检验,大家可以根据数据来验证数学过程,简单易懂。F篇与前篇有点相似,对初学者很有帮助。

4.浅谈协方差矩阵(G)此篇文章对于大家了解协方差矩阵以及matlab实现很有作用。

#

准备:

1.编程平台:MATLAB。

首先你得保证你的机器上安装有matlab,建议较高的版本。

2.libsvm工具箱。

本人在对第一篇文章中代码关于SVM分类的部分没有运行成功,所以运用了libsvm工具箱对样本训练,测试,并没有运用第一篇文章的代码,如果你能成功可忽略,但建议安装此工具箱,其对SVM分类有很大帮助。如果你一样没有成功,这里推荐一个链接,有关于libsvm工具箱的安装配置的视频。

3.数据:ORL人脸库。

这个数据为已经预处理的数据,格式为pgm,属于Linux格式,windows环境下无法直接打开,可以在matlab中打开,打开方式imshow(imread(‘图片路径’));数据是400张人脸图片,属于40个人,每个人10张,每张大小112*92像素,数据下载地址在第一篇文章中有,这里也给个链接,第四段两个链接都可下载。

4.主成分分析法PCA。

主成分分析法是一种降维的方法,上面给出了几个有用的链接,本文只给出代码,以及代码说明,关于原理,大家尽可参照上面几个链接,写得非常详细也非常通俗。

5.SVM支持向量机分类器。

SVM支持向量机是一个二类分类器,但是本次人脸识别不仅只是分出两类,而是需要分出40个类别。本人以前有过一点机器学习基础,所以在支持向量机原理的理解上没有多大问题,如果读者没有SVM基础,可参考SVM入门(H),以及写的非常给力的帖子,SVM三层境界(I)。

注:也许很多初学者看到这么多的资料,链接都已经晕了,失去了学习的动力。先别灰心,稍后我会把代码以及代码运行的结果和过程展示给大家,当大家看到这些图像的变换的美妙,就会有学习的兴趣。

编程实现:

以下将要展示的是几个.m文件的代码,.m文件即是能在matlab上面打开运行的代码文件,可以在其中定义函数,如果matlab的当前路径指定在含有这些.m文件的文件夹中,运行时就可以调用这些文件中定义的函数。

首先展示第一个.m文件,便是图片数据读取函数ReadFace.m

  1. function [f_matrix,realclass]=ReadFace(n_persons,flag)
  2. %ORL人脸库。pgm格式的图片。40人,每人10幅图,图像大小为112*92像素。
  3. %每个人有10幅照片,前5幅当作训练集,后5幅当作测试集
  4. %
  5. %输入变量flag:
  6. % flag是一个标识变量
  7. % flag0时,表示输入为训练集,flag1时,表示输入为测试集
  8. %
  9. %输入变量n_persons
  10. % n_persons标志着你想要识别的人脸个数
  11. %
  12. %输出变量realclass
  13. % realclass是一个n_person*5行,1列的列向量。
  14. % realclass即是数据的标签,无论训练集测试集都进行了标签处理
  15. %
  16. %输出变量f_matrix:
  17. % f_matrix是一个n_person*5行,112*92列的矩阵
  18. % 每一行便是每一张图片的灰度数据
  19. % 将每一张图片列向量排成一个列向量后转置得到放入f_matrix各行当中
  20. imgrow=112;imgcol=92;
  21. global imgrow; %载入图片行数
  22. global imgcol; %载入图片列数
  23. realclass=zeros(n_persons*5,1);
  24. f_matrix=zeros(n_persons*5,imgrow*imgcol);
  25. for i=1:n_persons
  26. %路径设置
  27. %函数num2str(i)说明:将数字转化为字符
  28. facepath=strcat('F:\MATLAB人脸识别\Face\facedata\s',num2str(i),'\'); %路径因不同情况而定
  29. cachepath=facepath;
  30. for j=1:5
  31. facepath=cachepath;
  32. if flag==0
  33. %函数strcat(a,b,...)说明:将输入字符a,b...连接成单个字符
  34. facepath=strcat(facepath,num2str(j));
  35. else
  36. facepath=strcat(facepath,num2str(j+5));
  37. end
  38. realclass((i-1)*5+j)=i;
  39. facepath=strcat(facepath,'.pgm');
  40. %函数imread说明:读取输入路径的图片,将每个像素灰度值保存在输出的矩阵中
  41. img=imread(facepath);
  42. f_matrix((i-1)*5+j,:)=img(:)';
  43. end
  44. end
  45. end

代码当中有着详细的注释,代码与第一篇文章中提供的代码大同小异,根据本人情况修改了一点路径的代码,以及增加了对训练集标签的标识,且增加了注释。现在对代码进行一些说明。

代码第一行有对函数的申明,function []=ReadFace(),中括号为函数的输出,小括号为函数的输入,函数名与文件名一致,一个.m文件当中可以有多个函数申明,但当外面的函数想要调用这个文件中的函数时,只能调用与文件名一致的函数。所以这个文件叫ReadFace.m

何为训练集以及测试集?

在机器学习方法当中,分为监督学习,非监督学习,强化学习。而SVM支持向量机是一种监督学习的算法。所谓监督学习,就是给予机器一套题目并附上标准答案,让它去做题,自己总结了一套做题的方法(这些方法就是建立的模型),它在根据已经学习好的方法来做一套新的题目,把题目做对,尽可能打高分。

训练集就是给予机器的一套题目及标准答案,测试集就是给它的一套新题。而训练集有标签和数据之分,标签就是标准答案,标签有着1和0,就表示这些训练集中有两类,像我们的人脸数据有40种人脸,我们就用1到40来表示。数据就是有着多维的表征一个事物的数据,就是给机器的第一套题目。测试集也有数据,就是后面给机器测试的题目,如果测试集原本含有标签,这些标签就可以作为标准给机器前面训练总结的方法(模型)打分,查看准确率。

在这个人脸库中,每个人有10张图,我们将前5张作为训练集,就有200张图。用一个矩阵来表示这200张图,就形成了一个200*10304的矩阵。后5张图用来当测试集,可以看代码中的说明。

当flag为0时,找出训练集的标签realclass(200*1的矩阵)与数据f_matrix(200*10304的矩阵).

当flag为1时,就是找出测试集来测试分类效果,得出准确率。

SVM训练的目的就是利用训练集找到这么一个分类函数(模型),再在测试集中检测。关于SVM的具体原理查看上面的H和I篇。

-———————————————-分割线———————————————————-

第二个.m文件的文件名为fastPCA.m,用于将样本进行降维处理,参考上面主成分分析PCA文章D,E,F篇,上面有通俗且具体的阐述。

  1. function [ pcaA,V] = fastPCA( A,k,mA)
  2. %快速PCA,主成份分析
  3. %输入:A-样本矩阵,每行是一个样本,列是样本的维数
  4. % k-降至k
  5. % mA-图像矩阵f_matrix每一列的均值排成一个行向量,即mean(f_matrix)
  6. %输出:pacA-降维后,训练样本在低维空间中的系数坐标表示
  7. % V-主成分分量,即低维空间当中的基
  8. %
  9. m=size(A,1); %m为读取图片的张数
  10. Z=(A-repmat(mA,m,1)); %中心化样本矩阵
  11. %一般用中心化的矩阵代替原矩阵。为什么?因为将数据集的均值归零(预处理),也就是只取数据的偏差部分
  12. T=Z*Z';
  13. [V1,D]=eigs(T,k);%计算T的最大的k个特征值和特征向量
  14. V=Z'*V1; %协方差矩阵的特征向量
  15. %这一点是关键步骤,很可能很多初学者无法理解:
  16. %按理来讲,协方差矩阵的计算公式为(假设上面中心化的Z已经求出):
  17. %V = (Z'*Z)./(size(Z,1)-1)(先不管单位化,V=Z'*Z)(这里是一行为一个样本,一列为一个维数的情况)
  18. %协方差矩阵是N*N的方阵,维数N应该与原图片f_matrix200*10304)维数相等
  19. %f_matrix中行数200为图片个数,列数10304为维数
  20. %那为什么这里是T=Z*Z',再求T的K个最大特征值和特征向量V1,再用V=Z'*V1来求协方差矩阵特征向量呢?
  21. %因为我们如果求V=Z'*Z这个V就是一个10304*10304的矩阵,MATLAB奔溃了,太复杂
  22. %我们可以这样看P^-1*(Z*Z')*P=S等价于P^-1*(Z')^-1*Z'*Z*Z'*P=S等价于(Z'*P)^-1*(Z'*Z)*(Z'*P)=S
  23. %注:P^-1P的逆矩阵,(Z')^-1为Z'的逆矩阵,类推,建议大家写在纸上
  24. %最后一个式子可以看出Z'*Z的特征向量矩阵为Z'*P,而Z*Z'的特征向量矩阵为P,即为程序中的V1
  25. %这是一种简便方法,为的就是避免像V=Z'*Z这种维数太高的计算。
  26. %可查看C篇文章步骤4
  27. for i=1:k %特征向量单位化
  28. l=norm(V(:,i));
  29. V(:,i)=V(:,i)/l;
  30. end
  31. %单位化后的V才能是真正的低维空间的基,需要满足正交化单位化两个条件
  32. %具体原因参考D篇文章
  33. pcaA=Z*V; %线性变换,降至k ,将中心化的矩阵投影到低维空间的基中,V就是低维空间的基
  34. %pcaA为低维空间的坐标表示,即一个图像的判断依据
  35. end

代码与第一篇文章代码没有不同,只是多加了注释,便于大家理解。

下面贴出原图,均值脸以及两者的差值图:

20141029175226721

-————————————————————————分割线————————————————————————————-

#

第三个文件为scaling.m文件,其中的代码与原作者代码无二。略加注释。

  1. function [ scaledface] = scaling( faceMat,lowvec,upvec )
  2. %特征数据规范化
  3. %即是将同一个样本中的不同维度归一化
  4. %因为因为对于不同的属性,如果不归一化是不具有比较性的,两者不在一个量级上
  5. %输入——faceMat需要进行规范化的图像数据,
  6. % lowvec原来图像数据中的最小值
  7. % upvec原来图像数据中的最大值
  8. upnew=1;
  9. lownew=-1;
  10. [m,n]=size(faceMat);
  11. scaledface=zeros(m,n);
  12. for i=1:m
  13. scaledface(i,:)=lownew+(faceMat(i,:)-lowvec)./(upvec-lowvec)*(upnew-lownew);
  14. %将图像数据中一个样本的不同维度的值,最小值和最大值规范到-11,其他值按比例规范到(-1,1
  15. end
  16. end

-——————————————————————————分割线——————————————————————————-

第四个文件visualize.m中为显示特征脸的代码,比较简单,并附上显示结果。

  1. function visualize( B )
  2. %显示特征脸(变换空间中的基向量,即单位特征向量)
  3. %输入:B——每列是个主成分分量,显示的就是低维中每个基组成的图像
  4. % k——主成分的维数
  5. global imgrow;
  6. global imgcol;
  7. figure
  8. img=zeros(imgrow,imgcol);
  9. for i=1:20
  10. img(:)=B(:,i);
  11. subplot(4,5,i);
  12. imshow(img,[])
  13. end
  14. end

因为降至20维,所以其在低维中的基便是这20张特征脸,其他所有的经过了降维的脸都可以由这20张特征脸线性表示,即我们要进行脸部识别时,把选择要识别的脸进行降维处理后,再右乘这些基(特征脸)所构成的矩阵,就能得到这些脸在低维中的线性表示。这些表示就是识别的依据。

特征脸截图:

Center

-————————————————————————分割线————————————————————————————-

第五个文件recognition.m中的代码,在A篇文章当中没有,是我自己编写的脸部识别的小程序,比较简单,没有像A篇文章中一样做GUI界面。

  1. function recognition(mA,V,model)
  2. %函数作用:人脸识别模块,利用已经建好的模型,重新找一个样本进行识别
  3. %输入:
  4. % mA-均值
  5. % V-协方差矩阵特征向量
  6. % model-通过SVM对训练集训练得出的已经建立好的模型
  7. %%
  8. global imgrow;
  9. global imgcol;
  10. %%
  11. %弹出输入框,选择要识别的图片
  12. select_person_num=str2double(cell2mat(inputdlg('请输入想要识别的人的编号(总共40个人):')));%总共40个人
  13. select_img_num=str2double(cell2mat(inputdlg('请输入此人图片的编号(总共10张):')));%总共10张图
  14. %%
  15. %对图片信息进行处理,化为1*10304的行向量
  16. disp('读取选择的图片...')
  17. select_facepath=strcat('F:\MATLAB人脸识别\Face\facedata\s',num2str(select_person_num),'\',num2str(select_img_num),'.pgm');
  18. select_img=imread(select_facepath);
  19. select_matrix=zeros(1,imgrow*imgcol);
  20. select_matrix(1,:)=select_img(:)';
  21. select_matrix=(select_matrix-mA)*V;%PCA降维后的低维表示
  22. %%
  23. %图形归一化
  24. disp('规范化选择的图片...')
  25. select_matrix = scaling( select_matrix,min(select_matrix),max(select_matrix));
  26. %%
  27. %测试选择的图片,accuracy只有两个值,100%表示匹配正确,0%表示匹配错误
  28. disp('测试选择的图片...')
  29. [select_predict_label,accuracy,decision_values]=svmpredict(select_person_num,select_matrix,model);
  30. %%
  31. %显示原有图片和匹配图片进行比较
  32. disp('显示选择的图片...')
  33. figure(2);
  34. subplot(1,2,1);imshow(select_img);title('你选择的图片');
  35. subplot(1,2,2);
  36. imshow(imread(strcat('F:\MATLAB人脸识别\Face\facedata\s',num2str(select_predict_label),'\',num2str(1),'.pgm')));
  37. title('匹配的图片');

程序运行到此会弹出输入框,让用户选择想要识别的图片,当Accuracy=100%表示识别正确,如果Accuracy=0%表示识别错误。

20141029174450982 20141029174506582 20141029174556500

输入编码后选择的图片,以及匹配到的图片对比。

20141029174528734

-————————————————————————分割线————————————————————————————-

第六个文件face.m中的代码为主程序。读者想要看到整个效果,只需要将此文件中的程序全部选中按F9即可运行。

  1. %%
  2. %主程序,程序从此开始
  3. clc,clear
  4. npersons=40;%选取40个人的脸
  5. global imgrow;
  6. global imgcol;
  7. imgrow=112;
  8. imgcol=92;
  9. %%
  10. %读取训练数据
  11. disp('读取训练数据...')
  12. [f_matrix,train_label]=ReadFace(npersons,0);%读取训练数据
  13. nfaces=size(f_matrix,1);%样本人脸的数量
  14. disp('.................................................')
  15. %低维空间的图像是(nperson*5)*k的矩阵,每行代表一个主成分脸,每个脸20维特征
  16. %%
  17. %对训练集进行降维处理
  18. disp('训练数据PCA特征提取...')
  19. mA=mean(f_matrix);
  20. k=20;%降维至20
  21. %按理来讲,协方差矩阵的维数是10304维,而训练集的样本数量只有200
  22. %那么起作用的特征值对应的特征向量小于等于199个,其余的特征向量对应的特征值都为0
  23. [train_pcaface,V]=fastPCA(f_matrix,k,mA);%主成分分析法特征提取
  24. disp('.................................................')
  25. %%
  26. %显示主成分脸,即特征脸,低维的基
  27. disp('显示主成分脸...')
  28. visualize(V)%显示主分量脸 ,即特征脸
  29. disp('.................................................')
  30. %%
  31. %低维训练集归一化
  32. disp('训练特征数据归一化...')
  33. disp('.................................................')
  34. lowvec=min(train_pcaface);
  35. upvec=max(train_pcaface);
  36. train_scaledface = scaling( train_pcaface,lowvec,upvec);
  37. %%
  38. %SVM样本训练
  39. %本人的程序叫源程序有改动,使用的是libsvm工具箱进行SVM分类
  40. disp('SVM样本训练...')
  41. disp('.................................................')
  42. model = svmtrain(train_label,train_scaledface,'-t 0');
  43. %%
  44. %读取测试数据
  45. disp('读取测试数据...')
  46. disp('.................................................')
  47. [test_facedata,test_facelabel]=ReadFace(npersons,1);
  48. %%
  49. %测试数据降维
  50. %test_pcatestface-测试数据低维空间的表示
  51. disp('测试数据特征降维...')
  52. disp('.................................................')
  53. m=size(test_facedata,1);
  54. for i=1:m
  55. test_facedata(i,:)=test_facedata(i,:)-mA;
  56. end
  57. test_pcatestface=test_facedata*V;
  58. %%
  59. %测试数据归一化
  60. disp('测试特征数据归一化...')
  61. disp('.................................................')
  62. scaled_testface = scaling( test_pcatestface,lowvec,upvec);
  63. %%
  64. %利用训练集建立的模型,对测试集进行分类
  65. disp('SVM样本分类...')
  66. disp('.................................................')
  67. [predict_label,accuracy,decision_values]=svmpredict(test_facelabel,scaled_testface,model);
  68. %%
  69. %人脸识别模块
  70. disp('人脸识别模块')
  71. disp('.................................................')
  72. recognition(mA,V,model) ;

注:我的SVM分类器是用libsvm工具箱当中的函数实现的两个关键函数便是svmtrain和svmpredict,核函数选用线性核函数。

以上暂时是初稿,肯定还有很多需要修改的地方,如果读者有什么疑问或是看到什么错误,希望能留言,我会加以请教。大家相互学习,相互进步。

发表评论

表情:
评论列表 (有 0 条评论,310人围观)

还没有评论,来说两句吧...

相关阅读

    相关 基于Matlab人脸识别登录系统

    摘 要:人脸识别系统以人脸识别技术为核心,是一项新兴的生物识别技术,是当今比较热门的一项安全认证技术。它涉及人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等功能技

    相关 基于matlab人脸识别

    一:研究背景 随着人工智能技术的兴起,以及人类视觉研究的进展,人们逐渐对人脸图像的机器识别投入很大的热情,并形成了一个人脸图像识别研究领域,这一领域除了它的重大理论价值外,也