首先,我们知道要是图片的大小为80*60,生成的数据就会有80*60个,这样要是图片多的话,csv得到数据就是很多,我们可以考虑把图片缩小
我的图片都是放在目录E:\machineStudy\ta-lib\picture下
我们将灰度图片转为csv,一般都是用来做神经网络学习,一般我们都是给不同的情况贴上标签,我这里就是将10中不同的情况贴上0-9的标签,0-9目录下存在不同情况的图片,我们要做的就是将每个目录下的灰度图都转为csv格式数据,一个图片对应一行数据,并且在csv文件中的第一位存放着我们的标签,也就是0-9的数字。这里要注意,我一开始就说了,我们灰度图的图片可能会很大,我的就是80*60,csv得到的数据会很多,打开文件都得花很长时间,所以我们就可以考虑将我们的图片放小。
程序代码:
# -*- coding:utf-8 -*- import csv import os import cv2 #图片所在的目录 IMG_DIR = r"E:\machineStudy\ta-lib\picture" def convert_img_to_csv(img_dir): #这个是输出文件的位置,自己定义 with open(r'E:\machineStudy\ta-lib\picture\train_data.csv', 'w', newline='') as f: column_name = ['label'] #这里图片的大小为80*60,生成的数据就会有80*60个,csv文件一行是放不下的,所以我们要把图片放小 column_name.extend('pixel%d' % i for i in range(80 * 60)) writer = csv.writer(f) writer.writerow(column_name) for i in range(10): img_file_path = os.path.join(img_dir, str(i)) img_list = os.listdir(img_file_path) print(img_file_path) for img_name in img_list: img_path = os.path.join(img_file_path, img_name) img = cv2.imread(img_path, cv2.IMREAD_GRAYSCALE) #下面两行是将图片放小为原来的1/8, x, y = img.shape[0:2] img_test1 = cv2.resize(img, (int(y / 8), int(x / 8))) image_data = [i] image_data.extend(img_test1.flatten()) # print(image_data) writer.writerow(image_data) if __name__ == "__main__": convert_img_to_csv(IMG_DIR)
控制台输出遍历完的文件目录名
查看生成的train_data.csv文件
第一列就是我们不同的标签,其他列就是我们图片的像素,一行就是一个图片的数据