2026/5/18 20:19:44
网站建设
项目流程
杭州网站建设 巴零,公司网站怎么做实名认证,长沙营销型网站制作,西宁做网站的文章目录0 简介1 基于 Keras 用 LSTM 网络做时间序列预测2 长短记忆网络3 LSTM 网络结构和原理3.1 LSTM核心思想3.2 遗忘门3.3 输入门3.4 输出门4 基于LSTM的天气预测4.1 数据集4.2 预测示例5 基于LSTM的股票价格预测5.1 数据集5.2 实现代码6 lstm 预测航空旅客数目数据集预测代…文章目录0 简介1 基于 Keras 用 LSTM 网络做时间序列预测2 长短记忆网络3 LSTM 网络结构和原理3.1 LSTM核心思想3.2 遗忘门3.3 输入门3.4 输出门4 基于LSTM的天气预测4.1 数据集4.2 预测示例5 基于LSTM的股票价格预测5.1 数据集5.2 实现代码6 lstm 预测航空旅客数目数据集预测代码0 简介今天学长向大家介绍LSTM基础基于LSTM的预测算法 - 股票预测 天气预测 房价预测选题指导, 项目分享见文末1 基于 Keras 用 LSTM 网络做时间序列预测时间序列预测是一类比较困难的预测问题。与常见的回归预测模型不同输入变量之间的“序列依赖性”为时间序列问题增加了复杂度。一种能够专门用来处理序列依赖性的神经网络被称为 递归神经网络Recurrent Neural Networks、RNN。因其训练时的出色性能长短记忆网络Long Short-Term Memory NetworkLSTM是深度学习中广泛使用的一种递归神经网络RNN。在本篇文章中将介绍如何在 R 中使用 keras 深度学习包构建 LSTM 神经网络模型实现时间序列预测。如何为基于回归、窗口法和时间步的时间序列预测问题建立对应的 LSTM 网络。对于非常长的序列如何在构建 LSTM 网络和用 LSTM 网络做预测时保持网络关于序列的状态记忆。2 长短记忆网络长短记忆网络或 LSTM 网络是一种递归神经网络RNN通过训练时在“时间上的反向传播”来克服梯度消失问题。LSTM 网络可以用来构建大规模的递归神经网络来处理机器学习中复杂的序列问题并取得不错的结果。除了神经元之外LSTM 网络在神经网络层级layers之间还存在记忆模块。一个记忆模块具有特殊的构成使它比传统的神经元更“聪明”并且可以对序列中的前后部分产生记忆。模块具有不同的“门”gates来控制模块的状态和输出。一旦接收并处理一个输入序列模块中的各个门便使用 S 型的激活单元来控制自身是否被激活从而改变模块状态并向模块添加信息记忆。一个激活单元有三种门遗忘门Forget Gate决定抛弃哪些信息。输入门Input Gate决定输入中的哪些值用来更新记忆状态。输出门Output Gate根据输入和记忆状态决定输出的值。每一个激活单元就像是一个迷你状态机单元中各个门的权重通过训练获得。3 LSTM 网络结构和原理long short term memory即我们所称呼的LSTM是为了解决长期以来问题而专门设计出来的所有的RNN都具有一种重复神经网络模块的链式形式。在标准RNN中这个重复的结构模块只有一个非常简单的结构例如一个tanh层。LSTM 同样是这样的结构但是重复的模块拥有一个不同的结构。不同于单一神经网络层这里是有四个以一种非常特殊的方式进行交互。不必担心这里的细节。我们会一步一步地剖析 LSTM 解析图。现在我们先来熟悉一下图中使用的各种元素的图标。在上面的图例中每一条黑线传输着一整个向量从一个节点的输出到其他节点的输入。粉色的圈代表 pointwise 的操作诸如向量的和而黄色的矩阵就是学习到的神经网络层。合在一起的线表示向量的连接分开的线表示内容被复制然后分发到不同的位置。3.1 LSTM核心思想LSTM的关键在于细胞的状态整个(如下图)和穿过细胞的那条水平线。细胞状态类似于传送带。直接在整个链上运行只有一些少量的线性交互。信息在上面流传保持不变会很容易。门可以实现选择性地让信息通过主要是通过一个 sigmoid 的神经层 和一个逐点相乘的操作来实现的。sigmoid 层输出是一个向量的每个元素都是一个在 0 和 1 之间的实数表示让对应信息通过的权重或者占比。比如 0 表示“不让任何信息通过” 1 表示“让所有信息通过”。LSTM通过三个这样的本结构来实现信息的保护和控制。这三个门分别输入门、遗忘门和输出门。3.2 遗忘门在我们 LSTM 中的第一步是决定我们会从细胞状态中丢弃什么信息。这个决定通过一个称为忘记门层完成。该门会读取和输出一个在 0到 1之间的数值给每个在细胞状态中的数字。1 表示“完全保留”0 表示“完全舍弃”。让我们回到语言模型的例子中来基于已经看到的预测下一个词。在这个问题中细胞状态可能包含当前主语的性别因此正确的代词可以被选择出来。当我们看到新的主语我们希望忘记旧的主语。其中表示的是 上一时刻隐含层的 输出表示的是当前细胞的输入。σ表示sigmod函数。3.3 输入门下一步是决定让多少新的信息加入到 cell 状态 中来。实现这个需要包括两个步骤首先一个叫做“input gate layer ”的 sigmoid 层决定哪些信息需要更新一个 tanh 层生成一个向量也就是备选的用来更新的内容。在下一步我们把这两部分联合起来对 cell 的状态进行一个更新。3.4 输出门最终我们需要确定输出什么值。这个输出将会基于我们的细胞状态但是也是一个过滤后的版本。首先我们运行一个 sigmoid 层来确定细胞状态的哪个部分将输出出去。接着我们把细胞状态通过 tanh 进行处理得到一个在 -1 到 1 之间的值并将它和 sigmoid 门的输出相乘最终我们仅仅会输出我们确定输出的那部分。在语言模型的例子中因为他就看到了一个代词可能需要输出与一个动词相关的信息。例如可能输出是否代词是单数还是负数这样如果是动词的话我们也知道动词需要进行的词形变化。4 基于LSTM的天气预测4.1 数据集如上所示每10分钟记录一次观测值一个小时内有6个观测值一天有1446x24个观测值。给定一个特定的时间假设要预测未来6小时的温度。为了做出此预测选择使用5天的观察时间。因此创建一个包含最后7205x144个观测值的窗口以训练模型。下面的函数返回上述时间窗以供模型训练。参数 history_size 是过去信息的滑动窗口大小。target_size 是模型需要学习预测的未来时间步也作为需要被预测的标签。下面使用数据的前300,000行当做训练数据集其余的作为验证数据集。总计约2100天的训练数据。4.2 预测示例多步骤预测模型中给定过去的采样值预测未来一系列的值。对于多步骤模型训练数据再次包括每小时采样的过去五天的记录。但是这里的模型需要学习预测接下来12小时的温度。由于每10分钟采样一次数据因此输出为72个预测值。future_target72x_train_multi,y_train_multimultivariate_data(dataset,dataset[:,1],0,TRAIN_SPLIT,past_history,future_target,STEP)x_val_multi,y_val_multimultivariate_data(dataset,dataset[:,1],TRAIN_SPLIT,None,past_history,future_target,STEP)划分数据集train_data_multitf.data.Dataset.from_tensor_slices((x_train_multi,y_train_multi))train_data_multitrain_data_multi.cache().shuffle(BUFFER_SIZE).batch(BATCH_SIZE).repeat()val_data_multitf.data.Dataset.from_tensor_slices((x_val_multi,y_val_multi))val_data_multival_data_multi.batch(BATCH_SIZE).repeat()绘制样本点数据defmulti_step_plot(history,true_future,prediction):plt.figure(figsize(12,6))num_increate_time_steps(len(history))num_outlen(true_future)plt.plot(num_in,np.array(history[:,1]),labelHistory)plt.plot(np.arange(num_out)/STEP,np.array(true_future),bo,labelTrue Future)ifprediction.any():plt.plot(np.arange(num_out)/STEP,np.array(prediction),ro,labelPredicted Future)plt.legend(locupper left)plt.show()forx,yintrain_data_multi.take(1):multi_step_plot(x[0],y[0],np.array([0]))此处的任务比先前的任务复杂一些因此该模型现在由两个LSTM层组成。最后由于需要预测之后12个小时的数据因此Dense层将输出为72。multi_step_modeltf.keras.models.Sequential()multi_step_model.add(tf.keras.layers.LSTM(32,return_sequencesTrue,input_shapex_train_multi.shape[-2:]))multi_step_model.add(tf.keras.layers.LSTM(16,activationrelu))multi_step_model.add(tf.keras.layers.Dense(72))multi_step_model.compile(optimizertf.keras.optimizers.RMSprop(clipvalue1.0),lossmae)训练multi_step_historymulti_step_model.fit(train_data_multi,epochsEPOCHS,steps_per_epochEVALUATION_INTERVAL,validation_dataval_data_multi,validation_steps50)5 基于LSTM的股票价格预测5.1 数据集股票数据总共有九个维度分别是5.2 实现代码importnumpyasnpimportpandasaspdimportmatplotlib.pyplotaspltimporttensorflowastf plt.rcParams[font.sans-serif][SimHei]#显示中文plt.rcParams[axes.unicode_minus]False#显示负号defload_data():test_x_batchnp.load(rtest_x_batch.npy,allow_pickleTrue)test_y_batchnp.load(rtest_y_batch.npy,allow_pickleTrue)return(test_x_batch,test_y_batch)#定义lstm单元deflstm_cell(units):celltf.contrib.rnn.BasicLSTMCell(num_unitsunits,forget_bias0.0)#activation默认为tanhreturncell#定义lstm网络deflstm_net(x,w,b,num_neurons):#将输入变成一个列表列表的长度及时间步数inputstf.unstack(x,8,1)cells[lstm_cell(unitsn)forninnum_neurons]stacked_lstm_cellstf.contrib.rnn.MultiRNNCell(cells)outputs,_tf.contrib.rnn.static_rnn(stacked_lstm_cells,inputs,dtypetf.float32)returntf.matmul(outputs[-1],w)b#超参数num_neurons[32,32,64,64,128,128]#定义输出层的weight和biaswtf.Variable(tf.random_normal([num_neurons[-1],1]))btf.Variable(tf.random_normal([1]))#定义placeholderxtf.placeholder(shape(None,8,8),dtypetf.float32)#定义pred和saverpredlstm_net(x,w,b,num_neurons)savertf.train.Saver(tf.global_variables())if__name____main__:#开启交互式Sessionsesstf.InteractiveSession()saver.restore(sess,rD:\股票预测\model_data\my_model.ckpt)#载入数据test_x,test_yload_data()#预测predictssess.run(pred,feed_dict{x:test_x})predicts((predicts.max()-predicts)/(predicts.max()-predicts.min()))#数学校准#可视化plt.plot(predicts,r,label预测曲线)plt.plot(test_y,g,label真实曲线)plt.xlabel(第几天/days)plt.ylabel(开盘价(归一化))plt.title(股票开盘价曲线预测(测试集))plt.legend()plt.show()#关闭会话sess.close()6 lstm 预测航空旅客数目数据集airflights passengers dataset下载地址https://raw.githubusercontent.com/jbrownlee/Datasets/master/airline-passengers.csv这个dataset包含从1949年到1960年每个月的航空旅客数目共12*12144个数字。下面的程序中我们以1949-1952的数据预测1953的数据以1950-1953的数据预测1954的数据以此类推训练模型。预测代码importnumpyasnpimportmatplotlib.pyplotaspltimportpandasaspdimporttorchimporttorch.nnasnnfromsklearn.preprocessingimportMinMaxScalerimportos# super parametersEPOCH400learning_rate0.01seq_length4# 序列长度n_feature12# 序列中每个元素的特征数目。本程序采用的序列元素为一年的旅客一年12个月即12维特征。# datadatapd.read_csv(airline-passengers.csv)# 共 12年*12个月144 个数据datadata.iloc[:,1:5].values# dataFrame, shape (144,1)datanp.array(data).astype(np.float32)scMinMaxScaler()datasc.fit_transform(data)# 归一化datadata.reshape(-1,n_feature)# shape (12, 12)trainData_x[]trainData_y[]foriinrange(data.shape[0]-seq_length):tmp_xdata[i:iseq_length,:]tmp_ydata[iseq_length,:]trainData_x.append(tmp_x)trainData_y.append(tmp_y)# modelclassNet(nn.Module):def__init__(self,in_dim12,hidden_dim10,output_dim12,n_layer1):super(Net,self).__init__()self.in_dimin_dim self.hidden_dimhidden_dim self.output_dimoutput_dim self.n_layern_layer self.lstmnn.LSTM(input_sizein_dim,hidden_sizehidden_dim,num_layersn_layer,batch_firstTrue)self.linearnn.Linear(hidden_dim,output_dim)defforward(self,x):_,(h_out,_)self.lstm(x)# h_out是序列最后一个元素的hidden state# h_outs shape (batchsize, n_layer*n_direction, hidden_dim), i.e. (1, 1, 10)# n_direction根据是“否为双向”取值为1或2h_outh_out.view(h_out.shape[0],-1)# h_outs shape (batchsize, n_layer * n_direction * hidden_dim), i.e. (1, 10)h_outself.linear(h_out)# h_outs shape (batchsize, output_dim), (1, 12)returnh_out trainTrueiftrain:modelNet()loss_functorch.nn.MSELoss()optimizertorch.optim.Adam(model.parameters(),lrlearning_rate)# trainforepochinrange(EPOCH):total_loss0foriteration,Xinenumerate(trainData_x):# Xs shape (seq_length, n_feature)Xtorch.tensor(X).float()Xtorch.unsqueeze(X,0)# Xs shape (1, seq_length, n_feature), 1 is batchsizeoutputmodel(X)# outputs shape (1,12)outputtorch.squeeze(output)lossloss_func(output,torch.tensor(trainData_y[iteration]))optimizer.zero_grad()# clear gradients for this training iterationloss.backward()# computing gradientsoptimizer.step()# update weightstotal_losslossif(epoch1)%200:print(epoch:{:3d}, loss:{:6.4f}.format(epoch1,total_loss.data.numpy()))# torch.save(model, flight_model.pkl) # 这样保存会弹出UserWarning建议采用下面的保存方法详情可参考https://zhuanlan.zhihu.com/p/129948825torch.save({state_dict:model.state_dict()},checkpoint.pth.tar)else:# model torch.load(flight_model.pth)modelNet()checkpointtorch.load(checkpoint.pth.tar)model.load_state_dict(checkpoint[state_dict])# predictmodel.eval()predict[]forXintrainData_x:# Xs shape (seq_length, n_feature)Xtorch.tensor(X).float()Xtorch.unsqueeze(X,0)# Xs shape (1, seq_length, n_feature), 1 is batchsizeoutputmodel(X)# outputs shape (1,12)outputtorch.squeeze(output)predict.append(output.data.numpy())# plotplt.figure()predictnp.array(predict)predictpredict.reshape(-1,1).squeeze()x_ticknp.arange(len(predict))(seq_length*n_feature)plt.plot(list(x_tick),predict,labelpredict data)data_originaldata.reshape(-1,1).squeeze()plt.plot(range(len(data_original)),data_original,labeloriginal data)plt.legend(locbest)plt.show()运行结果 项目分享:大家可自取用于参考学习获取方式见文末!