고차원 비용함수에서 경사가 0인 경우 대부분 Local Optima(지역 최적값)가 아니라 Saddle Point(안장점)입니다.

Saddle Point란 미분 값이 아주 오래 동안 0에 가깝게 유지되는 지역을 말합니다.

https://thisisiron.github.io/assets/images/saddle_point.PNG

위 그림에서 하늘색 점이 Saddle Point입니다. 이 지점의 경사는 0이게 됩니다. 이러한 이름으로 부르게 된 이유는 말의 안장과 비슷하게 생겼기 때문입니다.

https://thisisiron.github.io/assets/images/plateaus.PNG

위의 그림에서 하늘색 점 이동하는 경로가 점점 경사가 0이거나 0에 가까운 값들이기 때문에 오랜 시간이 걸려 안장점에 도착하게 됩니다. 그 후 왼쪽이나 오른쪽에 무작위로 변화를 주게되면 안정지대를 벗어나게 됩니다.

Reference

Coursera: Improving Deep Neural Networks: Hyperparameter tuning, Regularization and Optimization (Andrew Ng)

딥러닝 2단계: 심층 신경망 성능 향상시키기 강좌소개 : edwith