2026/2/7 21:36:08
网站建设
项目流程
现在网站的外部链接怎么做,如何更改网站图标,做网站看什么书,微信怎么创建微信公众号DL00369-基于机器学习的船舶轨迹预测含AIS数据集源码
新加坡水域的海上监视面临着规模和船舶运动流量的挑战。
每年约有近10万艘船只通过长达105公里的水道#xff0c;占据了世界贸易货物的四分之一左右。
我们的系统每天记录平均100万条船只信息#xff0c;即每分钟跟踪约80…DL00369-基于机器学习的船舶轨迹预测含AIS数据集源码 新加坡水域的海上监视面临着规模和船舶运动流量的挑战。 每年约有近10万艘船只通过长达105公里的水道占据了世界贸易货物的四分之一左右。 我们的系统每天记录平均100万条船只信息即每分钟跟踪约800艘船只。 这些数字使得沿岸警察部队无法仅在发生事故时才巡逻船只因此需要根据船只历史行动来预测其未来位置的技术。 发送船舶移动信息的标准方式是通过自动识别系统AIS。 AIS数据集在本项目中用于分析和机器学习的训练与测试。新加坡港口的繁忙程度超出常人想象——这片水域每天要处理全球四分之一的海运贸易量相当于每分钟都有800艘船在狭窄航道里跳海上芭蕾。沿岸警察部队的巡逻艇根本来不及实时盯防就像要在川流不息的十字路口手动指挥每一辆车。这时候机器学习成了救命稻草特别是那些藏在AIS数据里的航行规律。先看数据长啥样。AIS报文就像船舶的微博每几秒就更新一条动态import pandas as pd raw_data pd.read_csv(ais_2023_sg.csv, parse_dates[timestamp]) print(raw_data[[mmsi,lat,lon,sog,cog,timestamp]].head(3)) #0 4773078 1.265089 103.80815 12.3 158.2 2023-04-15 08:00:01 #1 5661120 1.271511 103.82367 8.7 172.5 2023-04-15 08:00:03 #2 4773078 1.265212 103.80838 12.1 157.9 2023-04-15 08:00:06sog是航速(节)cog是航向角。注意时间戳精度到秒不同船舶的报文频率差异极大货轮可能每分钟报一次拖船可能每秒都在发。处理这种时间不均衡的数据我习惯用插值大法def resample_trajectory(df, freq10S): df df.set_index(timestamp).groupby(mmsi).resample(freq).first() return df.interpolate(methodlinear).reset_index()这里每10秒插一个点保持各船轨迹时间对齐。不过要注意有些船会突然离线几小时这时候得设置最大间隔阈值超过就认为轨迹中断。特征工程阶段发现个有趣现象——船舶在特定区域的转向模式像极了司机变道# 计算加速度和转向率 df[accel] df.groupby(mmsi)[sog].diff() / 3.6 # m/s² df[turn_rate] df.groupby(mmsi)[cog].diff().abs() # 筛选异常机动 sudden_turn df[(df.turn_rate 30) (df.sog 5)] plt.scatter(sudden_turn.lon, sudden_turn.lat, cred, s5)结果这些红点大多出现在港口出入口和分道通航区说明这些位置需要模型特别关注转向特征。模型选型试了LSTM和Transformer最后发现带注意力机制的ConvLSTM效果最稳。核心结构长这样from keras.layers import ConvLSTM2D, Attention # 把轨迹转为时空网格 input_grid layers.Input(shape(12, 50, 50, 6)) # 12帧50x50网格6通道 x ConvLSTM2D(filters64, kernel_size(3,3), return_sequencesTrue)(input_grid) x Attention(use_scaleTrue)([x, x]) # 自注意力抓关键区域 output layers.TimeDistributed(layers.Conv2D(2, (3,3)))(x) # 预测经纬度偏移这里把海域划分成50x50的网格每个格子包含船舶密度、平均速度等特征。ConvLSTM同时捕捉时空特征比纯序列模型更适合处理船舶间的相互影响。训练时发现个坑——直接预测绝对坐标会导致误差累积。改成预测相对位移后30分钟轨迹的MSE从0.15降到0.08# 数据预处理时计算位移增量 df[delta_lat] df.groupby(mmsi)[lat].diff().fillna(0) df[delta_lon] df.groupby(mmsi)[lon].diff().fillna(0) # 损失函数加入航向约束 def nav_loss(y_true, y_pred): mse tf.keras.losses.MSE(y_true, y_pred) direction_loss 1 - tf.cos(y_true[:,:,:,1] - y_pred[:,:,:,1]) # 航向余弦损失 return mse 0.3 * direction_loss最后的可视化效果很有意思预测轨迹蓝色和真实轨迹红色在分道通航区几乎重合但在锚地区域会出现发散毕竟抛锚的船随时可能起航plt.plot(pred_lon, pred_lat, b--, linewidth2) plt.scatter(true_lon, true_lat, cr, s5, alpha0.3) plt.gca().set_facecolor(#e6f3ff) # 浅蓝背景模拟海图这套系统上线后巡逻船的工作模式从救火队变成了先知模式提前到高风险区域蹲守。不过最近有船员反馈某些渔船故意走非常规路线来调戏AI——看来对抗样本的问题在现实世界同样存在下次得把博弈论加进模型里了。