Stereo R-CNN, 3D Box Estimation (가제)
- 3D Box Estimation Stereo R-CNN를 통해 얻을 수 있는 정보는 다음과 같다. 왼쪽 카메라로 부터는 bbox의 상하좌우 테두리 픽셀의 좌표와, 바라봐지는 대상의 원근감을 표현하는 한점 까지 5개이며, 오른쪽 카메라 부터는 단순히 bbox의 좌우 테두리 픽셀 좌표, 2데이터를 얻게된다. 필자의 생각엔 오른쪽 카메라는 단순히 왼쪽카메라로부터 x축만 오프셋 되어있고, 동일한 yz평만상에 위치한다. 따라서 두 카메라에서 바라볼때 유의미하게 달라지는 데이터는 bbox의 x좌표일 것이므로, 나머지 데이터는 사용하지 않는 것으로 사려된다. [ 이전 스텝으로 부터 얻은 데이터들 : Z = {ul,vt,ur,vb,u0_l,u0_r,up} ] 그러나 이 데이터들은 2D 이미지 상에서 원근감을 잘 표..