NMF人脸数据特征提取
基于《Python机器学习》——北京理工大学 学习笔记
NMF方法及实例——人脸数据特征提取
非负矩阵分解(Non-negative Matrix Factorization ,NMF)是在矩阵中所有元素均为非负数约束条件之下的矩阵分解方法。
基本思想:给定一个非负矩阵V,NMF能够找到一个非负矩阵W和一个非负矩阵H,使得矩阵W和H的乘积近似等于矩阵V中的值。
W矩阵:基础图像矩阵,相当于从原矩阵V中抽取出来的特征.
H矩阵:系数矩阵。
NMF能够广泛应用于图像分析、文本挖掘和语音处理等领域。
目标:已知Olivetti人脸数据共400个,每个数据是64*64大小。由于NMF分解得到的W矩阵相当于从原始矩阵中提取的特征,那么就可以使用NMF对400个人脸数据进行特征提取。
from numpy.random import RandomState #导入相关工程包
import matplotlib.pyplot as plt
from sklearn.datasets import fetch_olivetti_faces
from sklearn import decomposition
n_row, n_col = 2, 3 #设置图像展示时排列情况,2×3
n_components = n_row * n_col #设置提取的特征的数目
image_shape = (64, 64) #设置人脸数据图片的大小
###############################################################################
# Load faces data
dataset = fetch_olivetti_faces(shuffle=True, random_state=RandomState(0))
faces = dataset.data #加载数据,打乱顺序
###############################################################################
def plot_gallery(title, images, n_col=n_col, n_row=n_row):
plt.figure(figsize=(2. * n_col, 2.26 * n_row)) #创建图片,并指定图片大小
plt.suptitle(title, size=16) #设置标题及字号大小
for i, comp in enumerate(images):
plt.subplot(n_row, n_col, i + 1) #选择画制的子图
vmax = max(comp.max(), -comp.min())
plt.imshow(comp.reshape(image_shape), cmap=plt.cm.gray,
interpolation='nearest', vmin=-vmax, vmax=vmax) #对数值归一化,并以灰度图形式显示
plt.xticks(())
plt.yticks(()) #去除子图的坐标轴标签
plt.subplots_adjust(0.01, 0.05, 0.99, 0.94, 0.04, 0.) #对子图的位置及间隔调整
plot_gallery("First centered Olivetti faces", faces[:n_components])
###############################################################################
#创建特征提取的对象NMF,使用PCA作为对比,并将他们存放在同一列表中
estimators = [
('Eigenfaces - PCA using randomized SVD',
decomposition.PCA(n_components=6,whiten=True)),
('Non-negative components - NMF',
decomposition.NMF(n_components=6, init='nndsvda', tol=5e-3))
]
###############################################################################
#降维后数据点的可视化:
for name, estimator in estimators: #分别调用PCA和NMF
print("Extracting the top %d %s..." % (n_components, name))
print(faces.shape)
estimator.fit(faces) #调用PCA或NMF提取特征
components_ = estimator.components_ #获取提取的特征
plot_gallery(name, components_[:n_components]) #按照固定格式进行排列
plt.show()
**subplot(numRows, numCols, plotNum)**
- 图表的整个绘图区域被分成 numRows 行和 numCols 列
- 然后按照从左到右,从上到下的顺序对每个子区域进行编号,左上的子区域的编号为1
- plotNum 参数指定创建的 Axes 对象所在的区域
参考链接 https://www.cnblogs.com/lizm166/p/9667923.html
还没有评论,来说两句吧...