2026/4/9 9:13:13
网站建设
项目流程
设计网站兼职赚钱,付公司网站建设费用会计分录,网站模版怎么编辑器,深圳网络推广公司天涯问答在智能轮椅的辅助导航中#xff0c;如何在保障安全的同时尊重用户的自主意愿#xff0c;一直是人机交互领域的核心难题。传统的意图预测方法往往试图给出唯一的“标准答案”#xff0c;这容易在复杂环境中引发误判。本文介绍了一种名为 DIWIE#xff08;基于扩散模型的轮椅…在智能轮椅的辅助导航中如何在保障安全的同时尊重用户的自主意愿一直是人机交互领域的核心难题。传统的意图预测方法往往试图给出唯一的“标准答案”这容易在复杂环境中引发误判。本文介绍了一种名为 DIWIE基于扩散模型的轮椅用户意图估计 的新型人工智能框架。它创新性地利用图像生成领域的扩散模型技术不仅能够预测用户的多种可能轨迹还能量化这种“不确定性”。通过融合眼动、语义等多源数据且无需预先构建地图DIWIE 为智能轮椅提供了一种更安全、更自然且具有高度泛化能力的“读心术”。一、 背景与挑战当机器人需要“猜”人心对于许多行动不便人士而言动力轮椅是独立的基石。然而操作轮椅并非易事特别是对于存在运动或视觉障碍的用户。为此研究人员开发了“共享控制”系统旨在由用户主导方向机器人提供防撞或导航辅助。这一技术的关键在于意图估计机器人需要提前预判用户想去哪里。传统困境过去的方法大多基于概率模型或深度学习试图预测一条“最优路径”。但人类行为充满变数——在路口左转还是右转是为了穿过这扇门还是为了给别人留门环境依赖许多系统依赖预先绘制的地图和标记好的目标点如“去厨房”这在家庭环境尚可但在超市、医院等动态、陌生的复杂场景中却难以落地。DIWIE 的诞生正是为了解决这些痛点它不再执着于唯一的答案而是学会“拥抱不确定性”。二、 核心创新点一用“扩散”模型预测多条未来DIWIE 最大的突破在于将 去噪扩散概率模型DDPM 引入了轮椅导航领域。在此之前DDPM 主要用于生成逼真的人脸图像或艺术画作。1. 为什么是扩散模型传统的预测模型如卷积神经网络 LSTM通常是确定性的输入相同输出就相同。然而用户的行为是随机的。在走廊尽头面对三个门用户可能选任何一个。传统方法强行预测一个概率最高的门一旦猜错辅助系统就会帮倒忙。DIWIE 方法像生成艺术画作一样一次性生成 M 条 合理的未来轨迹。2. 不确定性作为置信度DIWIE 生成的多条轨迹不仅是备选方案更是一种置信度指标。如果生成的 8 条轨迹高度重合说明模型对预测非常有信心例如在一条笔直的长廊上。如果轨迹发散很大说明当前情境充满歧义例如在复杂的十字路口。这种能力让共享控制系统能根据置信度动态调整干预力度——在不确定时多听用户的在确定时积极辅助。三、 核心创新点二不依赖地图的“多模态”全知视角为了摆脱对预定义地图的依赖DIWIE 将轮椅变成了一个即时感知的综合体。它采用以自我为中心的视角完全基于轮椅当前的传感器输入进行预测就像人类驾驶员看路一样。DIWIE 融合了五类关键数据运动历史轮椅过去几秒的轨迹和速度。占用层通过激光雷达感知周围的障碍物墙、柱子。用户注意力这是极具创新的一点。通过头戴式显示器HoloLens模型获取用户的眼动追踪和头部姿态。用户在看哪里往往预示着想去哪里。语义信息利用摄像头识别环境中的物体门、桌子、人理解环境的语义含义。操纵杆指令用户手部的操作信号。实验发现用户注意力眼动 是仅次于历史轨迹的第二重要特征。这证明了在辅助技术中观察用户的“视线”比单纯的听指令更有效。四、 核心创新点三带“安全围栏”的轨迹生成生成式模型的一个常见缺陷是“天马行空”可能会生成穿过墙壁的轨迹。为了保证安全性DIWIE 引入了碰撞引导模块。原理在模型生成轨迹的去噪过程中实时计算当前轨迹与障碍物地图的碰撞风险。作用这相当于给模型戴上了“安全眼镜”。它是一个软约束机制在不扼杀轨迹多样性的前提下引导模型避开障碍物。结果实验数据显示加上这个模块后预测轨迹的碰撞率CR 大幅降低同时保持了极高的位移预测精度。五、 实验验证表现究竟如何研究团队在 4 种复杂环境中包括狭窄走廊、拥挤的室内外场所通过 13 名驾驶员收集了超过 23 万个样本进行测试。对比对象包括传统的卷积 LSTM 模型和条件变分自编码器CVAE。关键指标突破精度更高在 5 秒的预测时长内DIWIE 的平均位移误差minADE和最终位移误差minFDE均为最低。唯一破 1 米它是所有对比方法中唯一将 5 秒后的最终位置预测误差控制在 1 米以内的模型。考虑到轮椅本身约 0.9 米的长度这具有极高的实用价值。泛化能力强在“新用户-新环境”的测试中DIWIE 没有出现明显的性能下降证明它不需要针对每个用户或房间重新训练具备强大的通用性。实时性虽然扩散模型通常计算量大但研究人员通过优化将去噪步数缩减至 100 步。在实际轮椅搭载的 NVIDIA Jetson AGX Orin 边缘计算平台上推理速度可达到每秒 5 帧以上完全满足实时辅助控制的需求。六、 结论与展望从预测到共情DIWIE 的成功标志着智能轮椅从“被动反应”向“主动预判”迈出了重要一步。它不再仅仅是一个防撞工具而是一个能够理解人类行为模糊性、具有“同理心”的智能伙伴。未来的研究将进一步探索动态环境建模目前的模型将人群视为静态障碍物未来将尝试预测行人的移动让轮椅在人群中穿梭更自如。闭环控制将 DIWIE 直接集成到底层控制算法中根据预测的不确定性动态调节机器人与用户的控制权重。个性化适应不同身体状况如震颤、反应迟缓的特定用户群体。通过将最前沿的生成式 AI 技术应用于辅助机器人DIWIE 为提升残障人士的生活质量和出行自由度开辟了新的道路。