Skip to content

zhuhcen/AI_teamwork_datapreprocessing

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 

Repository files navigation

环境依赖

import pandas as pd

from PIL import Image

import random

图片处理思路

  1. 当每个类别的数据量大于IMG_NUM_EACH_TYPE的时候,只进行resize变化。
  2. 当每个类别的数据量小于IMG_NUM_EACH_TYPE的时候,对每一个图片进行 随机切分,随机切分后水平镜像,随机切分后上下镜像(三种变化)。直至到达IMG_NUM_EACH_TYPE,或所有原始图片变化完毕。

crop

用法指南

注意:只需修改definitions.py中的变,main.py不用修改。

1.必须修改的路径参数

使用前请先设置路径,definition.py中的IMAGEDIR,NEWCSVDIR,NEWIMAGEDIR

IMAGEDIR:放置原图像的文件目录,实例:

IMAGEDIR = "/home/zhuchencs/yanyi/aihomework/cloud_dataset/images/"

NEWCSVDIR:放置新生成的train.csv的文件目录,示例:

NEWCSVDIR = "/home/zhuchencs/yanyi/aihomework/cloud_dataset_new/"

NEWIMAGEDIR:放置新生成的图片的文件夹路径,示例:

NEWIMAGEDIR = "/home/zhuchencs/yanyi/aihomework/cloud_dataset_new/images/"

2.其他可以自定义的参数

变量名 用途 备注
RESIZE 生成图片的大小 RESIZE=500说明生成的图片为500*500
IMG_NUM_EACH_TYPE 为每个类型的图片增强到~张 IMG_NUM_EACH_TYPE=2000说明每个类型的图片生成到2000张

结果

生成train.csv和新的图片

train.csv的格式为:

image_name type1 type2 ... type28
1_1.png 1 0 ... 0
1_2.png 1 0 ... 0
... ... ... ... ...
28_2000.png 0 0 ... 1

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages