代码拉取完成,页面将自动刷新
深度学习估计双目图像深度,谷歌团队提出神经网络模型,官方代码地址:https://github.com/google-research/google-research/tree/master/hitnet。
这里利用谷歌官方提供的模型,编写代码生成 Kitti 数据集深度,其中 hitnet 网络负责估计双目图像视差,然后根据双目相机模型 $depth = \dfrac{bf}{disparity}$ 计算图像深度,这里以 CV_32F 图像格式保存为 tiff 图像文件。
python 环境主要架构为:python 3.8 + tensorflow-cpu==2.5.0,具体环境配置过程如下:
conda create -n hitnet python==3.8
conda activate hitnet
pip install tensorflow-cpu==2.5.0 numpy==1.19.5 opencv-python==3.4.17.63
也可以安装 tensorflow-gpu 版本,不过需要配置 cuda 和 cudnn
这里使用 KITTI 02 数据集,可以去 KITTI 官网下载,这里提供百度网盘下载链接:https://pan.baidu.com/s/1CiFnDgyGgb_G1I1a_OpfZw 提取码: 6ase。
运行代码文件 main.py
,生成 kitti 02 数据集深度,需要修改的变量为 data_path
(数据集路径),如需运行其他数据集需要修改 bf
值(即双目基线与相机焦距之积)
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。