k-armed бандит и 𝜺-greedy алгоритм. Нестационарная проблема.
В нестационарной задаче многорукого бандита эффективность ε-жадного алгоритма снижается, но её можно восстановить, увеличив количество шагов и заменив изменяющийся коэффициент обновления на постоянный.