克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README
MIT

hitnet

介绍

深度学习估计双目图像深度,谷歌团队提出神经网络模型,官方代码地址:https://github.com/google-research/google-research/tree/master/hitnet。

这里利用谷歌官方提供的模型,编写代码生成 Kitti 数据集深度,其中 hitnet 网络负责估计双目图像视差,然后根据双目相机模型 $depth = \dfrac{bf}{disparity}$ 计算图像深度,这里以 CV_32F 图像格式保存为 tiff 图像文件。

python环境搭建

python 环境主要架构为:python 3.8 + tensorflow-cpu==2.5.0,具体环境配置过程如下:

conda create -n hitnet python==3.8
conda activate hitnet
pip install tensorflow-cpu==2.5.0 numpy==1.19.5 opencv-python==3.4.17.63

也可以安装 tensorflow-gpu 版本,不过需要配置 cuda 和 cudnn

KITTI 数据集下载

这里使用 KITTI 02 数据集,可以去 KITTI 官网下载,这里提供百度网盘下载链接:https://pan.baidu.com/s/1CiFnDgyGgb_G1I1a_OpfZw 提取码: 6ase。

代码运行

运行代码文件 main.py,生成 kitti 02 数据集深度,需要修改的变量为 data_path (数据集路径),如需运行其他数据集需要修改 bf 值(即双目基线与相机焦距之积)

MIT License Copyright (c) 2022 李伟波 Permission is hereby granted, free of charge, to any person obtaining a copy of this software and associated documentation files (the "Software"), to deal in the Software without restriction, including without limitation the rights to use, copy, modify, merge, publish, distribute, sublicense, and/or sell copies of the Software, and to permit persons to whom the Software is furnished to do so, subject to the following conditions: The above copyright notice and this permission notice shall be included in all copies or substantial portions of the Software. THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE.

简介

深度学习估计双目图像深度,生成 kitti 02 数据集深度 展开 收起
Python
MIT
取消

发行版

暂无发行版

贡献者

全部

近期动态

不能加载更多了
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化