вымывание и взрыв градиента

Почему в глубоких нейросетях возникают проблемы вымывания градиента и градиентного взрыва, как они связаны с последовательным умножением весов и почему это мешает обучению.

May 17, 2018 · 371 words