воскресенье, 10 февраля 2013 г.

подростки большие сиськи

z = Statistics2.pnormaldist(1-(1-confidence)/2)

def ci_lower_bound(pos, n, confidence)

*Кванти±ль в математической статистике значение, которое заданная случайная величина не превышает с фиксированной вероятностью.

Используйте минус там, где написано плюс/минус, чтобы вычислить нижнюю границу. Здесь pІ доля положительных оценок, za/2 есть квантиль* (1-a/2) стандартного нормального распределения, и n есть общее число оценок. Аналогичнная формула, примененная на Ruby:

Почему это правильно. Нам необходимо найти баланс между долей положительных оценок и неопределенностью малого числа наблюдений. К счатью, математический аппарат для решения этой проблемы был разработан в 1927 году Эдвином Вильсоном. Мы хотим знать следующее: «Обладая набором данных мне оценок, можно ли с вероятностью 95% сказать, какова будет реальная доля положительных оценок?». Вильсон дает ответ. Учитывая только положительные и отрицательные оценки (т.е. не беря во внимание 5-бальную систему оценивания), нижняя граница доли положительных оценок вычисляется по следующей формуле:

Рейтинг = Нижняя граница доверительного интервала Вильсона (Wilson) для параметра Бернулли

Правильное решение

Сайты, которые допускают подобную ошибку:

Почему это неправильно. Средняя оценка хорошо работает, если у вас всегда куча оценок. Но предположим, что у одного объекта 2 положительные оценки и 0 отрицательных. Предположим далее, что у второго объекта 100 положительных оценок и 1 отрицательная. Данный алгоритм разместит второй объект (с кучей положительных оценок) ниже первого объекта (с очень малым числом положительных оценок). Это неправильно.

Рейтинг = Средняя оценка = (Число положительных оценок) / (Число всех оценок)

Неправильное решение 2

Сайты, которые допускают подобную ошибку:

Почему это неправильно. Предположим, у одного объекта есть 600 положительных оценок и 400 отрицательных, т.е. в итоге 60% положительных. Предположим далее, что у другого объекта 5500 положительных оценок и 4500 отрицательных, т.е. в итоге 55% положительных. Данный алгоритм разместит второй объект (с рейтингом 1000, но всего с 55% положительных оценок) выше первого объекта (с рейтингом 200 и с 60% положительных оценок). Неправильно.

Рейтинг= (Число положительных оценок) - (Число отрицательных оценок)

Неправильное решение 1

Вы занимаетесь веб программированием. У вас есть пользователи, которые оценивают контент на вашем сайте. Вы хотите разместить высоко оцененный контент наверху, а низко оцененный внизу. Для этого на основе пользовательских оценок вам нужно вычислить некий «рейтинг».

Постановка проблемы

В оригинале название звучит как «How Not To Sort By Average Rating». Я подумал, что дословный перевод «Как не сортировать по усреднённому рейтингу» будет малопонятен и хуже отражает содержание статьи.

Как правильно сортировать контент на основе оценок пользователей

Как правильно сортировать контент на основе оценок пользователей / Блог компании Дару-дар (Darudar) / Хабрахабр

Комментариев нет:

Отправить комментарий