3月6日消息,高德地图宣布推出全球首个由大模型驱动的视觉认知步导系统地标AI领航,深度融合千问大模型、亿级POI数据库与千万级高精街景图像,让导航系统首次具备视觉认知与人类语言理解能力。
该系统针对传统步行导航起点迷方向、距离无概念、终点认不出的痛点,基于超亿级POI数据库、高精度步行路网拓扑及千万级高精街景图像三大核心能力,建立对空间关系的深度理解。
结合千问大模型的多模态能力,可识别交通设施、商铺、地标建筑等实体并评估视觉显著性,生成符合人类习惯的自然语言指引。
导航过程中,系统会在起点、转弯、临近终点等关键节点,优先选择醒目易识别的参照物进行语音播报,同时在地图上高亮对应位置。
指引文案突出颜色、形态与相对位置,例如“过了蓝色便利店右转,银色玻璃门就是入口”“保持施耐德电气大门在左手边”等,实现所见即所导。
实测显示,用户听到视觉地标提示后,平均比传统导航快2秒确认正确路径,有效减少看手机频次,降低老人、亲子家庭、游客等群体的步行出行门槛。升级后的步行导航无需额外设置,在导航界面即可直接使用。
目前该功能已支持北京、上海、广州、深圳、重庆、杭州六座城市,其他城市正在逐步上线。
文章来源:
哈哈库
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至23467321@qq.com举报,一经查实,本站将立刻删除;如已特别标注为本站原创文章的,转载时请以链接形式注明文章出处,谢谢!