import pandas as pd
from PIL import Image
import random
- 当每个类别的数据量大于
IMG_NUM_EACH_TYPE
的时候,只进行resize变化。 - 当每个类别的数据量小于
IMG_NUM_EACH_TYPE
的时候,对每一个图片进行 随机切分,随机切分后水平镜像,随机切分后上下镜像(三种变化)。直至到达IMG_NUM_EACH_TYPE
,或所有原始图片变化完毕。
注意:只需修改
definitions.py
中的变,main.py
不用修改。
使用前请先设置路径,definition.py
中的IMAGEDIR
,NEWCSVDIR
,NEWIMAGEDIR
。
IMAGEDIR
:放置原图像的文件目录,实例:
IMAGEDIR = "/home/zhuchencs/yanyi/aihomework/cloud_dataset/images/"
NEWCSVDIR
:放置新生成的train.csv
的文件目录,示例:
NEWCSVDIR = "/home/zhuchencs/yanyi/aihomework/cloud_dataset_new/"
NEWIMAGEDIR
:放置新生成的图片的文件夹路径,示例:
NEWIMAGEDIR = "/home/zhuchencs/yanyi/aihomework/cloud_dataset_new/images/"
变量名 | 用途 | 备注 |
---|---|---|
RESIZE | 生成图片的大小 | RESIZE=500 说明生成的图片为500*500 |
IMG_NUM_EACH_TYPE | 为每个类型的图片增强到~张 | IMG_NUM_EACH_TYPE=2000 说明每个类型的图片生成到2000张 |
生成train.csv
和新的图片
新train.csv
的格式为:
image_name |
type1 |
type2 |
... | type28 |
---|---|---|---|---|
1_1.png | 1 | 0 | ... | 0 |
1_2.png | 1 | 0 | ... | 0 |
... | ... | ... | ... | ... |
28_2000.png | 0 | 0 | ... | 1 |