序贯(Sequential)模型
序贯模型是多个网络层的线性堆叠,可理解为多个网络层的线性函数拟合堆叠。
可以通过向Sequential
模型传递一个layer的list来构造该模型:
也可以通过.add()
方法一个个的将layer加入模型中:
指定输入数据的shape
模型需要知道输入数据的shape,因此,Sequential的第一层需要接受一个关于输入数据shape的参数,后面的各个层则可以自动的推导出中间数据的shape,因此不需要为每个层都指定这个参数。有几种方法来为第一层指定输入数据的shape
- 传递一个
input_shape
的关键字参数给第一层,input_shape
是一个tuple类型的数据,其中也可以填入None
,如果填入None
则表示此位置可能是任何正整数。数据的batch大小不应包含在其中 - 有些2D层,如
Dense
,支持通过指定其输入维度input_dim
来隐含的指定输入数据shape。一些3D的时域层支持通过参数input_dim
和input_length
来指定输入shape。 - 如果你需要为输入指定一个固定大小的
batch_size
(常用于stateful RNN网络),可以传递batch_size
参数到一个层中,例如你想指定输入张量的batch大小是32,数据shape是(6,8),则你需要传递batch_size=32
和input_shape=(6,8)
。
|
|
编译
在训练模型之前,我们需要通过compile
来对学习过程进行配置。compile
接收三个参数:
- 优化器optimizer:该参数可指定为已预定义的优化器名,如
rmsprop
、adagrad
,或一个Optimizer
类的对象,详情见optimizers - 损失函数loss:该参数为模型试图最小化的目标函数,它可为预定义的损失函数名,如
categorical_crossentropy
、mse
,也可以为一个损失函数。详情见losses - 指标列表
metrics
:对分类问题,我们一般将该列表设置为metrics=['accuracy']
。指标可以是一个预定义指标的名字,也可以是一个用户定制的函数.指标函数应该返回单个张量,或一个完成metric_name - > metric_value
映射的字典.请参考性能评估
|
|
训练
Keras以Numpy数组作为输入数据和标签的数据类型。训练模型一般使用fit函数。下面是一些例子。
|
|
|
|