z = Statistics2.pnormaldist(1-(1-confidence)/2)
def ci_lower_bound(pos, n, confidence)
*Кванти±ль в математической статистике значение, которое заданная случайная величина не превышает с фиксированной вероятностью.
Используйте минус там, где написано плюс/минус, чтобы вычислить нижнюю границу. Здесь pІ доля положительных оценок, za/2 есть квантиль* (1-a/2) стандартного нормального распределения, и n есть общее число оценок. Аналогичнная формула, примененная на Ruby:
Почему это правильно. Нам необходимо найти баланс между долей положительных оценок и неопределенностью малого числа наблюдений. К счатью, математический аппарат для решения этой проблемы был разработан в 1927 году Эдвином Вильсоном. Мы хотим знать следующее: «Обладая набором данных мне оценок, можно ли с вероятностью 95% сказать, какова будет реальная доля положительных оценок?». Вильсон дает ответ. Учитывая только положительные и отрицательные оценки (т.е. не беря во внимание 5-бальную систему оценивания), нижняя граница доли положительных оценок вычисляется по следующей формуле:
Рейтинг = Нижняя граница доверительного интервала Вильсона (Wilson) для параметра Бернулли
Правильное решение
Сайты, которые допускают подобную ошибку:
Почему это неправильно. Средняя оценка хорошо работает, если у вас всегда куча оценок. Но предположим, что у одного объекта 2 положительные оценки и 0 отрицательных. Предположим далее, что у второго объекта 100 положительных оценок и 1 отрицательная. Данный алгоритм разместит второй объект (с кучей положительных оценок) ниже первого объекта (с очень малым числом положительных оценок). Это неправильно.
Рейтинг = Средняя оценка = (Число положительных оценок) / (Число всех оценок)
Неправильное решение 2
Сайты, которые допускают подобную ошибку:
Почему это неправильно. Предположим, у одного объекта есть 600 положительных оценок и 400 отрицательных, т.е. в итоге 60% положительных. Предположим далее, что у другого объекта 5500 положительных оценок и 4500 отрицательных, т.е. в итоге 55% положительных. Данный алгоритм разместит второй объект (с рейтингом 1000, но всего с 55% положительных оценок) выше первого объекта (с рейтингом 200 и с 60% положительных оценок). Неправильно.
Рейтинг= (Число положительных оценок) - (Число отрицательных оценок)
Неправильное решение 1
Вы занимаетесь веб программированием. У вас есть пользователи, которые оценивают контент на вашем сайте. Вы хотите разместить высоко оцененный контент наверху, а низко оцененный внизу. Для этого на основе пользовательских оценок вам нужно вычислить некий «рейтинг».
Постановка проблемы
В оригинале название звучит как «How Not To Sort By Average Rating». Я подумал, что дословный перевод «Как не сортировать по усреднённому рейтингу» будет малопонятен и хуже отражает содержание статьи.
Как правильно сортировать контент на основе оценок пользователей
Как правильно сортировать контент на основе оценок пользователей / Блог компании Дару-дар (Darudar) / Хабрахабр
Комментариев нет:
Отправить комментарий