YOLO算法简易应用

2025/6/19 人工智能深度学习目标检测 YOLO 计算机视觉

YOLO算法详解与实践教程

一、YOLO算法简介

YOLO (You Only Look Once) 是一种快速、高效的目标检测算法，由Joseph Redmon等人在2015年提出。与传统的两阶段检测器（如R-CNN系列）不同，YOLO是一种单阶段检测器，它将目标检测任务看作单一的回归问题，从输入图像直接预测边界框坐标和类别概率。

1.1 YOLO的主要特点

速度快：YOLO模型能够实现实时目标检测，在现代GPU上可达到45-155 FPS
全局推理：YOLO在整张图像上进行推理，能够学习到目标的上下文信息
泛化能力强：YOLO在新领域和非预期输入上表现良好
精度适中：虽然在早期版本中精度低于一些两阶段检测器，但最新版本已大幅提升精度

1.2 YOLO发展历程

YOLOv1：2015年首次提出，奠定了单阶段检测器的基础
YOLOv2/YOLO9000：2016年改进，引入了anchor box和批量归一化等技术
YOLOv3：2018年发布，采用多尺度预测，大幅提升了小目标检测能力
YOLOv4：2020年推出，整合了多种先进技术，平衡了速度和精度
YOLOv5：由Ultralytics开发的YOLO版本，工程化做得更好，易于使用
YOLOv6/v7/v8：后续版本不断优化，提供更好的性能和更丰富的功能

二、环境配置

2.1 下载安装Conda

Conda是一个开源的包管理系统和环境管理系统，我们将用它来创建一个独立的Python环境：

访问Miniconda官网下载适合您操作系统的安装包
根据安装向导完成Miniconda的安装
安装完成后，打开命令行工具，输入conda --version验证安装

2.2 创建虚拟环境

创建一个名为yolo_env的Python环境:

# 创建Python 3.8环境
conda create -n yolo_env python=3.8

# 激活环境
conda activate yolo_env

2.3 安装必要的库

安装PyTorch、JupyterLab和其他所需依赖：

# 安装PyTorch (根据您的CUDA版本选择适当的命令)
# 对于CUDA 11.7:
conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia

# 安装JupyterLab
conda install -c conda-forge jupyterlab

# 其他常用库
pip install opencv-python matplotlib pillow

三、安装YOLO

现在我们有两种方式获取YOLO：

3.1 通过pip安装

这是最简单的方法，适用于YOLOv5及更新版本：

# 安装YOLOv5
pip install ultralytics

# 或安装特定版本
pip install yolov5

3.2 通过Git克隆源代码

如果您想查看或修改源代码，可以选择克隆GitHub仓库：

# 克隆YOLOv5仓库
git clone https://github.com/ultralytics/yolov5.git
cd yolov5
pip install -r requirements.txt

# 克隆YOLOv8仓库
git clone https://github.com/ultralytics/ultralytics.git
cd ultralytics
pip install -e .

四、下载预训练模型

YOLOv5和YOLOv8提供了多种预训练模型，可以直接使用：

4.1 YOLOv5预训练模型

YOLOv5有不同大小的预训练模型，从小到大分别是：YOLOv5n、YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x：

# 在Python中下载
import torch
model = torch.hub.load('ultralytics/yolov5', 'yolov5s')  # 'yolov5s'是模型名称，可以换成其他型号

# 或通过命令行直接下载权重文件
!wget https://github.com/ultralytics/yolov5/releases/download/v6.1/yolov5s.pt

4.2 YOLOv8预训练模型

# 安装ultralytics包后可以直接使用
from ultralytics import YOLO
model = YOLO("yolov8n.pt")  # 加载预训练的YOLOv8n模型

五、使用YOLO进行目标检测

5.1 使用YOLOv5进行图像检测

import torch

# 加载模型
model = torch.hub.load('ultralytics/yolov5', 'yolov5s')

# 对图像进行预测
img = 'path/to/your/image.jpg'  # 或者'https://ultralytics.com/images/zidane.jpg'
results = model(img)

# 显示结果
results.print()  # 打印结果
results.show()   # 显示带有标记框的图像

# 保存结果
results.save()   # 保存带有标记框的图像到'runs/detect/exp'

5.2 使用YOLOv8进行图像检测

from ultralytics import YOLO

# 加载模型
model = YOLO('yolov8n.pt')

# 对图像进行预测
results = model('path/to/your/image.jpg')

# 显示结果
for r in results:
    print(r.boxes)  # 打印边界框信息
    
# 可视化结果
import cv2
from PIL import Image
import numpy as np

for r in results:
    im_array = r.plot()  # 绘制带有检测框的图像
    im = Image.fromarray(im_array[..., ::-1])  # RGB转BGR
    im.show()  # 显示图像
    im.save('results.jpg')  # 保存图像

5.3 实时视频检测

from ultralytics import YOLO
import cv2

# 加载YOLOv8模型
model = YOLO('yolov8n.pt')

# 打开摄像头
cap = cv2.VideoCapture(0)

# 循环读取视频帧
while cap.isOpened():
    # 读取一帧
    success, frame = cap.read()
    
    if success:
        # 对当前帧进行目标检测
        results = model(frame)
        
        # 可视化结果
        annotated_frame = results[0].plot()
        
        # 显示带有检测框的帧
        cv2.imshow("YOLOv8 Detection", annotated_frame)
        
        # 按'q'键退出
        if cv2.waitKey(1) & 0xFF == ord('q'):
            break
    else:
        break

# 释放资源
cap.release()
cv2.destroyAllWindows()

六、训练自己的YOLO模型

6.1 准备数据集

要训练自己的YOLO模型，首先需要准备一个标注好的数据集。数据集应该包含图像和相应的标注文件。YOLO使用的标注格式如下：

class x_center y_center width height

所有值都是相对于图像宽度和高度的归一化值，范围在0到1之间。

6.2 创建数据集配置文件

创建一个YAML文件描述数据集，例如dataset.yaml:

# 训练和验证数据集路径
train: path/to/train/images
val: path/to/validation/images

# 类别数和类别名称
nc: 3  # 类别数
names: ['person', 'car', 'dog']  # 类别名称

6.3 使用YOLOv5进行训练

# 进入yolov5目录
cd yolov5

# 使用预训练权重开始训练
python train.py --img 640 --batch 16 --epochs 50 --data dataset.yaml --weights yolov5s.pt

6.4 使用YOLOv8进行训练

from ultralytics import YOLO

# 加载预训练模型
model = YOLO('yolov8n.pt')

# 训练模型
results = model.train(
    data='dataset.yaml',
    epochs=50,
    imgsz=640,
    batch=16,
    name='yolov8n_custom'
)

七、模型优化与部署

7.1 模型量化

为了在资源受限的设备上运行YOLO，可以使用模型量化技术减小模型大小并提高推理速度：

# YOLOv5模型量化示例
from pathlib import Path
import torch
from models.experimental import attempt_load
from models.yolo import Model
from utils.torch_utils import select_device

# 加载训练好的模型
weights = 'yolov5s.pt'
device = select_device('0' if torch.cuda.is_available() else 'cpu')
model = attempt_load(weights, device=device)

# 使用torch.quantization进行量化
model_fp32 = model.float()
model_int8 = torch.quantization.quantize_dynamic(
    model_fp32,  # 原始FP32模型
    {torch.nn.Linear, torch.nn.Conv2d},  # 要量化的层类型
    dtype=torch.qint8  # 量化的数据类型
)

# 保存量化模型
torch.save(model_int8.state_dict(), 'yolov5s_quantized.pt')

7.2 模型导出为其他格式

YOLO模型可以导出为多种格式以便在不同平台上部署：

# YOLOv8导出为ONNX格式
from ultralytics import YOLO

# 加载模型
model = YOLO('yolov8n.pt')

# 导出模型
model.export(format='onnx', opset=12)  # 导出ONNX格式

# 其他支持的格式
# format='torchscript'  # TorchScript格式
# format='tflite'       # TensorFlow Lite格式
# format='coreml'       # CoreML格式(iOS)

八、YOLO的实际应用案例

YOLO广泛应用于各种计算机视觉任务：

自动驾驶：检测道路上的车辆、行人和交通标志
安防监控：识别异常行为和入侵者
零售分析：跟踪商店内顾客流动和商品陈列
工业质检：识别产品缺陷
医学图像分析：检测X射线和CT扫描中的异常

LOADING