这一章叫做图像基础。对于图像和NumPy有了解的读者可以直接跳过这一章。
这一章主要介绍了图像的一些基本知识、基本属性等;如何访问图像,表示图像;讨论图像的纵横比及其在准备用于训练神经网络的图像数据集时的关系。
简单说一下内容:
1、图像由像素组成,深度学习关心的图像或者是彩色,或者是灰度图,所以其它色彩空间的图像不讨论。
2、图像的通道,在RGB颜色空间中表示图像,其中每个通道都是一个独立的矩阵,组合后形成最终图像。
3、图像坐标系
4、图像转Numpy数组
# 读取并显示一张图片 import cv2 image = cv2.imread("example.png") print(image.shape) cv2.imshow("Image", image) cv2.waitKey(0) # 读取图片的坐标上的rgb值 (b, g, r) = image[20, 100] # accesses pixel at x=100, y=20 (b, g, r) = image[75, 25] # accesses pixel at x=25, y=75 (b, g, r) = image[90, 85] # accesses pixel at x=85, y=90
5、BGR和RGB的顺序,OpenCV的库读取图像的顺必须是BGR。
6、又讲了一下保持纵横比图像的缩放、不保持纵横比的缩放、以及裁剪等。