长生栈 长生栈
首页
  • 编程语言

    • C语言
    • C++
    • Java
    • Python
  • 数据结构和算法

    • 全排列算法实现
    • 动态规划算法
  • CMake
  • gitlab 安装和配置
  • docker快速搭建wordpress
  • electron+react开发和部署
  • Electron-创建你的应用程序
  • ImgUI编译环境
  • 搭建图集网站
  • 使用PlantUml画时序图
  • 友情链接
关于
收藏
  • 分类
  • 标签
  • 归档
GitHub (opens new window)

Living Team

编程技术分享
首页
  • 编程语言

    • C语言
    • C++
    • Java
    • Python
  • 数据结构和算法

    • 全排列算法实现
    • 动态规划算法
  • CMake
  • gitlab 安装和配置
  • docker快速搭建wordpress
  • electron+react开发和部署
  • Electron-创建你的应用程序
  • ImgUI编译环境
  • 搭建图集网站
  • 使用PlantUml画时序图
  • 友情链接
关于
收藏
  • 分类
  • 标签
  • 归档
GitHub (opens new window)
  • 计算机视觉

    • 基本环境搭建
    • 数据集制作-FFMPEG从视频提取关键帧
    • 数据集制作-图像分类
      • 图像分类数据集结构(以 ResNet50 为例)
        • 核心特点
      • 案例-ResNet50 的加载数据集
    • 数据集制作-目标检测
    • 数据集制作-LabelImg的使用
    • ResNet50部署和微调
    • MobileNet部署和微调
    • YOLO部署和微调
    • Janus-Pro部署和使用
  • ESP32开发

  • Linux系统移植

  • 快速开始

  • 编程小知识

  • 技术
  • 计算机视觉
DC Wang
2025-06-07
目录

数据集制作-图像分类

# 数据集制作-图像分类

图像分类是计算机视觉领域的一个重要任务,其目标是将图像划分为不同的类别。在深度学习的过程中,图像分类任务通常被视为一个多分类问题,即给定一张图像,预测其所属的类别。常见的模型有:ResNet、MobileNet等。

# 图像分类数据集结构(以 ResNet50 为例)

数据集根目录/
├── train/               # 训练集
│   ├── class_1/         # 类别1的图片
│   │   ├── img1.jpg
│   │   ├── img2.jpg
│   │   └── ...
│   ├── class_2/         # 类别2的图片
│   │   ├── img1.jpg
│   │   └── ...
│   └── ...              # 更多类别文件夹
│
├── val/                 # 验证集(可选)
│   ├── class_1/
│   │   ├── img1.jpg
│   │   └── ...
│   └── ...
│
└── test/                # 测试集(可选)
    ├── class_1/
    │   ├── test_img1.jpg
    │   └── ...
    └── ...
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22

# 核心特点

  1. 按类别分文件夹
    • 每个子文件夹代表一个类别(如 cat, dog, car)
    • 文件夹名称即类别标签(如 train/dog/xxx.jpg → 标签为 "dog")
  2. 训练/验证/测试集分离
    • train/:用于模型训练
    • val/:用于超参数调优和早停
    • test/:仅用于最终评估(模型不接触此数据)
  3. 文件格式
    • 支持常见格式: .jpg, .png, .jpeg 等
    • 图片尺寸无需统一(ResNet50 会预处理为 224×224)

# 案例-ResNet50 的加载数据集

  1. 输入尺寸

    • 必须缩放至 224×224 像素(通过预处理实现)
    • 通道顺序:RGB
  2. 预处理 需进行归一化(ImageNet 均值/标准差):

    # PyTorch 示例
    transform = transforms.Compose([
         transforms.Resize(256),
         transforms.CenterCrop(224),
         transforms.ToTensor(),
         transforms.Normalize(mean=[0.485, 0.456, 0.406], 
                              std=[0.229, 0.224, 0.225])
    ])
    
    1
    2
    3
    4
    5
    6
    7
    8
编辑 (opens new window)
#AI#CV#Python
上次更新: 2025/06/07, 21:53:36
数据集制作-FFMPEG从视频提取关键帧
数据集制作-目标检测

← 数据集制作-FFMPEG从视频提取关键帧 数据集制作-目标检测→

最近更新
01
ESP32-网络摄像头方案
06-14
02
ESP32-PWM驱动SG90舵机
06-14
03
ESP32-实时操作系统freertos
06-14
更多文章>
Theme by Vdoing | Copyright © 2019-2025 DC Wang All right reserved | 辽公网安备 21021102001125号 | 吉ICP备20001966号-2
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式