hitnet

深度学习估计双目图像深度，谷歌团队提出神经网络模型，官方代码地址：https://github.com/google-research/google-research/tree/master/hitnet。

这里利用谷歌官方提供的模型，编写代码生成 Kitti 数据集深度，其中 hitnet 网络负责估计双目图像视差，然后根据双目相机模型 $depth = \dfrac{bf}{disparity}$ 计算图像深度，这里以 CV_32F 图像格式保存为 tiff 图像文件。

python 环境主要架构为：python 3.8 + tensorflow-cpu==2.5.0，具体环境配置过程如下：

conda create -n hitnet python==3.8
conda activate hitnet
pip install tensorflow-cpu==2.5.0 numpy==1.19.5 opencv-python==3.4.17.63

也可以安装 tensorflow-gpu 版本，不过需要配置 cuda 和 cudnn

这里使用 KITTI 02 数据集，可以去 KITTI 官网下载，这里提供百度网盘下载链接：https://pan.baidu.com/s/1CiFnDgyGgb_G1I1a_OpfZw 提取码: 6ase。

运行代码文件 main.py，生成 kitti 02 数据集深度，需要修改的变量为 data_path （数据集路径），如需运行其他数据集需要修改 bf 值（即双目基线与相机焦距之积）

Weibo Li/hitnet