读取下载到本地的EMNIST数据集中的Letters数据集

本文主要是介绍读取下载到本地的EMNIST数据集中的Letters数据集，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

读取自己从官网上下载的数据集Letters。在读取Letters数据集前先了解一下什么是Letters?其实很简单就是一个包涵了a-z和A-Z的手写体数据集总共52个字母，但是却只分了37类，这是因为{C,I,J,K,L,M,O,P,S,U,V,W,X,Y,Z}这几个的大小写很难识别。

在了解完Letters数据集后就是导入数据集了。首先，需要将下载好的压缩包进行解压

Letters数据集：

链接：https://pan.baidu.com/s/1Uq82VExaCJ7Z94cwdX_VRw 提取码: f8vp

解压之后得到四个文件：

1、emnist-letters-test-images-idx3-ubyte.gz 训练集

2、emnist-letters-test-labels-idx1-ubyte.gz 训练集标签

3、emnist-letters-train-images-idx3-ubyte.gz 测试集

4、emnist-letters-train-labels-idx1-ubyte.gz 测试集标签

然后将以上4个压缩文件解压得到对应的Idx文件

之后把解压好的文件和test.py文件放在同一目录下

在导入数据前先检查一下是否有“idx2numpy”这个第三方库，如果没有就需要Win+R打开运行框输入cmd

进入命令提示符，进入Python安装的路径（作者Python的安装路径是：C:\Python37）后接着进入Scripts之后输入：pip install idx2numpy进行安装。

安装完成后就可以用idx2numpy导入Letters数据集的数据了：

import idx2numpy
#导入训练集和训练集标签
X_train = idx2numpy.convert_from_file('./emnist-letters-train-images-idx3-ubyte')
y_train = idx2numpy.convert_from_file('./emnist-letters-train-labels-idx1-ubyte')
#导入测试集和测试集标签
X_test = idx2numpy.convert_from_file('./emnist-letters-test-images-idx3-ubyte')
y_test = idx2numpy.convert_from_file('./emnist-letters-test-labels-idx1-ubyte')

这篇关于读取下载到本地的EMNIST数据集中的Letters数据集的文章就介绍到这儿，希望我们推荐的文章对大家有所帮助，也希望大家多多支持为之网！

Java教程

读取下载到本地的EMNIST数据集中的Letters数据集

前端开发

后端开发

移动端开发

数据库

服务器运维

人工智能

区块链

游戏开发

网站运营

大数据/云计算

软件工程

软件/开发工具使用

资讯