概要设计

数据分析

本次设计的主题是花卉识别，数据为TensorFlow的官方数据集flower_photos，包括5种花卉（雏菊、蒲公英、玫瑰、向日葵和郁金香）的图片，并有对应类别的标识（daisy、dandelion、roses、sunflowers、tulips）

数据集内容举例：
在这里插入图片描述
数据集tgz文件解压后，内部划分为5个相对应的文件夹，文件夹内为相对应图片：

对应样本数（对数据集进行分类，90%训练集，10%验证集）：

设计任务

本次设计的任务是通过所提供的数据集数据（具有对应花卉分类），使用神经网络模型方法进行训练，使用该模型对其它同类花卉进行类型识别，需要借助TensorFlow环境下的神经网络模型进行处理训练。
本次设计任务我将使用TensorFlow环境下的卷积神经网络CNN技术，通过CNN对数据集进行对应的训练，建立相关模型，再使用模型对相对应花卉进行识别。其中神经网络的建立使用TensorFlow 2.x的Keras的Api进行搭建，绘制损失函数和准确率曲线对模型训练效果进行评价，训练完成保存为mode.h5文件储存，在预测数据时读取model文件加载model，再使用model进行预测数据，并使用Pyqt5工具设计一个简洁的GUI界面进行人机交互，能够自定义预测数据集图片。

本次设计使用TensorFlow 2.3，Python 3.8 环境，IDE使用PyCharm，进行神经网络的搭建和训练。

详细设计

数据加载和预处理

1、设置图片尺寸为180*180，分批大小32
在这里插入图片描述

2、从flower_photos文件夹中加载数据：
（train_ds为训练集，val_ds为验证集）
使用tf.keras.preprocessing.image_dataset_from_directory方法，其中参数：
Directory：数据集储存文件夹路径
Validate_split：划分训练集和验证集比例，输入0.1为验证集占10%
Subset：training为训练集，validation为验证集
Seed：用于shuffle和转换的可选随机种子，选择123
Image_size：图片大小，为上一点所预设180*180
Batch_size：数据批次的大小，为预设的32
在这里插入图片描述
3、获取分类名：

结果：

4、数据可视化演示：
在这里插入图片描述
5、配置数据集：
• 使用shuffle()函数打乱数据，使用cache()函数将数据集缓存到内存当中，
再使用prefetch()函数预取数据，加速运行

神经网络构建

第1层：输入层：将数据归一化，并设置input_shape输入
在这里插入图片描述
第2层：卷积层1：卷积核数目为16，卷积核为3*3，激活函数为relu，并设置input_shape为(180,180,3)，使用卷积的目的是从输入图片中提取特征

第3层：池化层1：采用最大池化操作，使用2*2采样，池化层的目的是降低了每个特征映射的维度，但是保留最重要的信息
在这里插入图片描述

第4层：卷积层2：卷积核数目为32，卷积核为3*3，激活函数为relu
在这里插入图片描述

第5层：池化层2：采用最大池化操作，使用2*2采样
在这里插入图片描述

第6层：卷积层3：卷积核数目为64，卷积核为3*3，激活函数为relu
在这里插入图片描述

第7-10层：两个卷积层和池化层
在这里插入图片描述

第11层：Flatten层：连接卷积层与全连接层，把多维的输入一维化
在这里插入图片描述

第12层：全连接层：units设置为128，即输出维度为128,，激活函数为relu，全连接层对上一层的神经元进行全部连接，实现特征的非线性组合，进行特征进一步提取
在这里插入图片描述

第13层：输出层：输出预期结果
在这里插入图片描述

使用Sequential逐层描述每层网络, 搭建神经网络结构：
在这里插入图片描述
打印网络结构：

模型训练

1、模型编译：
优化器optimizer选adam，损失函数loss选SparseCategoricalCrossentropy，指标metrics选择准确率accuracy
在这里插入图片描述
2、训练模型
指定训练集train_ds,验证集validation_data为val_ds，迭代10次

3、训练结束，保存model为model.h5

4、使用evaluate评价模型，并打印准确率

5、获取准确率和损失值并绘制函数

6、绘制混淆矩阵：

在这里插入图片描述

模型预测

1、定义常量：
在这里插入图片描述
Flower_dict为花卉种类序列，以及图片宽高

2、加载模型
在这里插入图片描述
3、根据方法参数path加载图片数据转为array类型，由于维度问题需要扩展1维，使用numpy的expand_dims方法将数据由3维扩展为4维，然后使用model.predict方法将图片数据作为参数调用，返回result结果（index）对应flower_dict相对应index，返回对应index的种类名作为结果
在这里插入图片描述