PyTorch包含一个名为torchvision
的包,用于加载和准备数据集。它包括两个基本功能,即Dataset
和DataLoader
,它们有助于数据集的转换和加载。
数据集用于从给定数据集读取和转换数据点。实现的基本语法如下所述 -
trainset = torchvision.datasets.CIFAR10(root = './data', train = True, download = True, transform = transform)
DataLoader
用于随机播放和批量处理数据。它可用于与多处理工作程序并行加载数据。
trainloader = torch.utils.data.DataLoader(trainset, batch_size = 4, shuffle = True, num_workers = 2)
示例:加载CSV文件
使用Python包Panda来加载csv文件。原始文件具有以下格式:(图像名称,68个标记 - 每个标记具有x
,y
坐标)。
landmarks_frame = pd.read_csv('faces/face_landmarks.csv') n = 65 img_name = landmarks_frame.iloc[n, 0] landmarks = landmarks_frame.iloc[n, 1:].as_matrix() landmarks = landmarks.astype('float').reshape(-1, 2)