12.基于opencv-python+yolov3实现图片目标检测

迈不过友情╰ 2024-04-07 12:24 138阅读 0赞
  1. import cv2
  2. import numpy as np
  3. # 读取图片
  4. # 读取神经网络cv2.dnn.readNetFromDarknet(cfg,weight)
  5. # 把图片送入网络并输出分类结果
  6. imgPath = 'G:/1.png' # 测试图像
  7. coco='F:/coco.names'
  8. # 读取模型和权重
  9. configPath='F:/yolo.cfg'
  10. weightPath='F:yolov3.weights'
  11. net=cv2.dnn.readNetFromDarknet(configPath,weightPath)
  12. CONFIDENCE = 0.2 # 过滤弱检测的最小概率
  13. THRESHOLD = 0.4 # 非最大值抑制阈值
  14. # 加载图片、转为blob格式、送入网络输入层
  15. imgResize = cv2.imread(imgPath)
  16. img = cv2.resize(imgResize, (800,600))
  17. blobImg = cv2.dnn.blobFromImage(img, 1.0/255.0, (416, 416), None, True, False) # # net需要的输入是blob格式的,用blobFromImage这个函数来转格式
  18. net.setInput(blobImg) # # 调用setInput函数将图片送入输入层
  19. # 获取网络输出层信息(所有输出层的名字),设定并前向传播
  20. outInfo = net.getUnconnectedOutLayersNames() # # 前面的yolov3架构也讲了,yolo在每个scale都有输出,outInfo是每个scale的名字信息,供net.forward使用
  21. layerOutputs = net.forward(outInfo) # 得到各个输出层的、各个检测框等信息,是二维结构。
  22. # 拿到图片尺寸
  23. (H, W) = img.shape[:2]
  24. # 过滤layerOutputs
  25. # layerOutputs的第1维的元素内容: [center_x, center_y, width, height, objectness, N-class score data]
  26. # 过滤后的结果放入:
  27. boxes = [] # 所有边界框(各层结果放一起)
  28. confidences = [] # 所有置信度
  29. classIDs = [] # 所有分类ID
  30. # # 1)过滤掉置信度低的框框
  31. for out in layerOutputs: # 各个输出层
  32. for detection in out: # 各个框框
  33. # 拿到置信度
  34. scores = detection[5:] # 各个类别的置信度
  35. classID = np.argmax(scores) # 最高置信度的id即为分类id
  36. confidence = scores[classID] # 拿到置信度
  37. # 根据置信度筛查
  38. if confidence > CONFIDENCE:
  39. box = detection[0:4] * np.array([W, H, W, H]) # 将边界框放会图片尺寸
  40. (centerX, centerY, width, height) = box.astype("int")
  41. x = int(centerX - (width / 2))
  42. y = int(centerY - (height / 2))
  43. boxes.append([x, y, int(width), int(height)])
  44. confidences.append(float(confidence))
  45. classIDs.append(classID)
  46. # # 2)应用非最大值抑制(non-maxima suppression,nms)进一步筛掉
  47. idxs = cv2.dnn.NMSBoxes(boxes, confidences, CONFIDENCE, THRESHOLD) # boxes中,保留的box的索引index存入idxs
  48. # 得到labels列表
  49. with open(coco, 'rt') as f:
  50. labels = f.read().rstrip('\n').split('\n')
  51. # 应用检测结果
  52. np.random.seed(42)
  53. COLORS = np.random.randint(0, 255, size=(len(labels), 3), dtype="uint8") # 框框显示颜色,每一类有不同的颜色,每种颜色都是由RGB三个值组成的,所以size为(len(labels), 3)
  54. if len(idxs) > 0:
  55. for i in idxs.flatten(): # indxs是二维的,第0维是输出层,所以这里把它展平成1维
  56. (x, y) = (boxes[i][0], boxes[i][1])
  57. (w, h) = (boxes[i][2], boxes[i][3])
  58. color = [int(c) for c in COLORS[classIDs[i]]]
  59. cv2.rectangle(img, (x, y), (x+w, y+h), color, 2) # 线条粗细为2px
  60. text = "{}: {:.4f}".format(labels[classIDs[i]], confidences[i])
  61. cv2.putText(img, text, (x, y-5), cv2.FONT_HERSHEY_SIMPLEX, 0.5, color, 2) # cv.FONT_HERSHEY_SIMPLEX字体风格、0.5字体大小、粗细2px
  62. cv2.imshow('img', img)
  63. cv2.waitKey(0)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lZ8FhGrz-1662134356646)(https://git.poker/quinhua/pics/blob/main/markdown/fgbvrdffcftdfsc.webp?raw=true)\]

发表评论

表情:
评论列表 (有 0 条评论,138人围观)

还没有评论,来说两句吧...

相关阅读