【Python】学习笔记总结8(经典算法)

冷不防 2023-03-01 13:29 75阅读 0赞

文章目录

  • 八、Python经典算法
    • 0.Python画图
    • 1.回归-线性回归
    • 2.分类-k最近邻
    • 3.聚类
      • 3.1.Kmeans(k均值聚类算法)
      • 3.2.DBSCAN(基于密度的聚类算法)
      • 3.3.层次聚类算法
    • 4.降维
      • 4.1.PCA算法
      • 4.2.FA算法
    • 5.学习(神经网络)
      • 5.1.BP神经网络
    • 6.推荐算法
    • 7.时间序列(视频学习)

八、Python经典算法

0.Python画图

Python画图

1.回归-线性回归

回归-课程回顾
目的:找一条线,尽可能地拟合数据点,生成线性回归模型,并进行预测
解决什么样的问题:要完成的任务是预测一个连续值的话,那这个任务就是回归。是离散值的话就是分类
拟合(Fitting):就是说这个曲线能不能很好的描述某些样本,并且有比较好的泛化能力。
过拟合(Overfitting):就是太过贴近于训练数据的特征了,在训练集上表现非常优秀,近乎完美的预测/区分了所有的数据,但是在新的测试集上却表现平平,不具泛化性,拿到新样本后没有办法去准确的判断。
欠拟合(UnderFitting):测试样本的特性没有学到,或者是模型过于简单无法拟合或区分样本。
过拟合和欠拟合的形象解释

  1. import matplotlib.pyplot as plt
  2. import numpy as np
  3. t = np.arange(1,10,1)
  4. y = 0.9 * t + np.sin(t)
  5. # plt.plot(t,y,"o")
  6. # plt.show()
  7. model = np.polyfit(t,y,deg = 3)#生成三阶模型
  8. t2 = np.arange(-2,12,0.5)
  9. y2predict = np.polyval(model,t2)
  10. plt.plot(t,y,"o",t2,y2predict,"x")
  11. plt.show()

在这里插入图片描述

2.分类-k最近邻

分类-课程回顾
目的:根据已知样本进行分类学习,生成模型,并对测试样本进行预测
解决什么样的问题:了解单个样本信息特征以及其标签值,根据其生成模型,并对测试样本进行预测

  1. #分类算法
  2. #k最近邻:近朱者赤近墨者黑原理
  3. import os
  4. import pandas as pd
  5. from sklearn import neighbors
  6. thisFilePath = os.path.abspath('.')
  7. os.chdir(thisFilePath)
  8. # print(os.getcwd())
  9. df = pd.read_csv('ScoreData.csv')
  10. # print(df.head())
  11. train_x = df.iloc[0:8,2:4]
  12. # print(train_x.head())
  13. train_y= df.iloc[0:8,4]
  14. # print(train_y.head())
  15. model = neighbors.KNeighborsClassifier()
  16. model.fit(train_x,train_y)
  17. test_x = df.iloc[8:11,2:4]
  18. test_y= df.iloc[8:11,4].values
  19. test_p = model.predict(test_x)
  20. print(test_p)
  21. print(test_y)
  22. print(model.score(test_x, test_y))

3.聚类

聚类-课程回顾
目的:根据已知样本进行分类学习,生成模型,并对测试样本进行预测
解决什么样的问题:不了解单个样本信息特征以及其标签值,根据其生成模型,并对测试样本进行预测

3.1.Kmeans(k均值聚类算法)

(k-means clustering algorithm)
在这里插入图片描述

  1. import numpy as np
  2. train_x2 = np.array(train_x[['yuwen','shuxue']])
  3. print(train_x2)
  4. from sklearn.cluster import KMeans
  5. model2 = KMeans(n_clusters=3)
  6. model2 = model2.fit(train_x2)
  7. clusterResult = pd.DataFrame(model2.labels_,index=train_x.index,columns=['clusterResult'])
  8. print(clusterResult.head())

3.2.DBSCAN(基于密度的聚类算法)

(Density-Based Spatial Clustering of Applications with Noise)
在这里插入图片描述
在这里插入图片描述

3.3.层次聚类算法

一篇
二篇
三篇
在这里插入图片描述

4.降维

降维-课程回顾
目的:某种映射方法,将原高维空间中的数据点映射到低维度的空间中
解决什么样的问题:通过映射将数据降维后进行分类,案例征友考量,案例文科指数,理科指数(可以使用因子分析得到与原数据相关系数)

4.1.PCA算法

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4.2.FA算法

在这里插入图片描述

5.学习(神经网络)

学习-课程回顾
目的:某种映射方法,将原高维空间中的数据点映射到低维度的空间中
解决什么样的问题:案例图像识别

5.1.BP神经网络

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

6.推荐算法

推荐-课程回顾
目的:利用用户的一些行为,通过一些数学算法,推测出用户可能喜欢的东西
解决什么样的问题:案例推荐
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

7.时间序列(视频学习)

时间序列-课程回顾
目的:根据已有的历史数据对未来进行预测
解决什么样的问题:案例股票
在这里插入图片描述
在这里插入图片描述
ADF检验
在这里插入图片描述
差分
在这里插入图片描述
在这里插入图片描述
ADF检验
在这里插入图片描述
在这里插入图片描述
反差分
在这里插入图片描述
在这里插入图片描述

发表评论

表情:
评论列表 (有 0 条评论,75人围观)

还没有评论,来说两句吧...

相关阅读