k-armed бандит и 𝜺-greedy алгоритм. Нестационарная проблема.

В нестационарной задаче многорукого бандита эффективность ε-жадного алгоритма снижается, но её можно восстановить, увеличив количество шагов и заменив изменяющийся коэффициент обновления на постоянный.

декабря 27, 2018 · 313 слов

k-armed бандит и 𝜺-greedy алгоритм

ε-жадный алгоритм балансирует между исследованием и использованием знаний для решения проблемы многорукого бандита, помогая находить оптимальную стратегию вознаграждения.

декабря 26, 2018 · 493 слова

Функция правдоподобия и оценка максимального правдоподобия

Как функция правдоподобия помогает оценить вероятность неизвестного параметра, и почему метод максимального правдоподобия даёт наиболее вероятную оценку.

декабря 7, 2018 · 396 слов

биномиальное распределение

Как биномиальное распределение помогает оценить вероятность определённого числа успехов в серии экспериментов с двумя исходами.

ноября 28, 2018 · 288 слов

геометрический алгоритм Монте-Карло интегрирования

Геометрический метод Монте-Карло приближённо вычисляет интегралы, используя случайные точки внутри ограничивающей области.

октября 27, 2018 · 439 слов

MSE

Как среднеквадратичная ошибка (MSE) оценивает качество модели и как её использовать для сравнения предсказаний.

июня 16, 2018 · 174 слова

Правило Стёрджеса

Как правило Стёрджеса помогает определить количество интервалов в гистограмме, почему оно подходит для небольших выборок и какие альтернативные методы используются для больших данных.

июня 12, 2018 · 228 слов

PReLU

Как PReLU улучшает ReLU, добавляя обучаемые параметры для отрицательных значений, и как это влияет на обучение нейросетей.

мая 18, 2018 · 376 слов

вымывание и взрыв градиента

Почему в глубоких нейросетях возникают проблемы вымывания градиента и градиентного взрыва, как они связаны с последовательным умножением весов и почему это мешает обучению.

мая 17, 2018 · 1 слово

elimination и permutation матрицы

Как elimination и permutation матрицы используются для приведения матрицы к треугольному виду, упрощая вычисления в линейной алгебре.

мая 1, 2018 · 250 слов