环境依赖

import pandas as pd

from PIL import Image

import random

图片处理思路

当每个类别的数据量大于IMG_NUM_EACH_TYPE的时候，只进行resize变化。
当每个类别的数据量小于IMG_NUM_EACH_TYPE的时候，对每一个图片进行随机切分，随机切分后水平镜像，随机切分后上下镜像（三种变化）。直至到达IMG_NUM_EACH_TYPE，或所有原始图片变化完毕。

用法指南

注意：只需修改definitions.py中的变，main.py不用修改。

1.必须修改的路径参数

使用前请先设置路径，definition.py中的IMAGEDIR,NEWCSVDIR,NEWIMAGEDIR。

IMAGEDIR:放置原图像的文件目录，实例：

IMAGEDIR = "/home/zhuchencs/yanyi/aihomework/cloud_dataset/images/"

NEWCSVDIR:放置新生成的train.csv的文件目录，示例：

NEWCSVDIR = "/home/zhuchencs/yanyi/aihomework/cloud_dataset_new/"

NEWIMAGEDIR：放置新生成的图片的文件夹路径，示例：

NEWIMAGEDIR = "/home/zhuchencs/yanyi/aihomework/cloud_dataset_new/images/"

2.其他可以自定义的参数

变量名	用途	备注
RESIZE	生成图片的大小	`RESIZE=500`说明生成的图片为500*500
IMG_NUM_EACH_TYPE	为每个类型的图片增强到～张	`IMG_NUM_EACH_TYPE=2000`说明每个类型的图片生成到2000张

结果

生成train.csv和新的图片

新train.csv的格式为：

`image_name`	`type1`	`type2`	...	`type28`
1_1.png	1	0	...	0
1_2.png	1	0	...	0
...	...	...	...	...
28_2000.png	0	0	...	1

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
521FECEE-DAF3-458E-A7A4-102FD2B41D04.jpeg		521FECEE-DAF3-458E-A7A4-102FD2B41D04.jpeg
definitions.py		definitions.py
main.py		main.py
readme.md		readme.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

环境依赖

图片处理思路

用法指南

1.必须修改的路径参数

2.其他可以自定义的参数

结果

About

Releases

Packages

Languages

zhuhcen/AI_teamwork_datapreprocessing

Folders and files

Latest commit

History

Repository files navigation

环境依赖

图片处理思路

用法指南

1.必须修改的路径参数

2.其他可以自定义的参数

结果

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages