Softmax
Разбираемся с тем, что такое softmax и как эта функция работает на простом примере.
Разбираемся с тем, что такое softmax и как эта функция работает на простом примере.
В статье разбираемся, как использовать теорему Байеса для оценки истинной вероятности заболевания после положительного теста, учитывая чувствительность и специфичность теста.
Статья объясняет, как отношение правдоподобий помогает сравнивать гипотезы о параметре распределения, оценивая, насколько одна гипотеза более вероятна другой на основе имеющихся данных.
Разбираемся с тем, как влияет размер выборки на правдоподобие.
Как можно комбинировать правдоподобия, умножая их, и объясняет, что объединение двух независимых выборок даёт такой же результат, как если бы данные поступили от одного источника с суммарным числом наблюдений.
В чем разница между вероятностью и правдоподобием?
Оптимистичная инициализация оценочного вознаграждения Q заставляет даже жадный алгоритм исследовать альтернативные действия, что в долгосрочной перспективе приводит к лучшим результатам по сравнению с ε-жадным методом.
В нестационарной задаче многорукого бандита эффективность ε-жадного алгоритма снижается, но её можно восстановить, увеличив количество шагов и заменив изменяющийся коэффициент обновления на постоянный.
ε-жадный алгоритм балансирует между исследованием и использованием знаний для решения проблемы многорукого бандита, помогая находить оптимальную стратегию вознаграждения.
Как функция правдоподобия помогает оценить вероятность неизвестного параметра, и почему метод максимального правдоподобия даёт наиболее вероятную оценку.