mikaprok (mikaprok) wrote,
mikaprok
mikaprok

Точка отсчета. Ошибки у кассы



В предыдущей записи коротко поговорили о статистике и ее важности для государственного устройства. Вещь это самоочевидная, во всем мире занимающая краеугольное положение при принятии всех управленческих и житейских решений. С появлением массовой грамотности, сопровождающейся позже появлением телевидения и радио, на Западе, в первую очередь в бихевиористских США, стали выпускать литературу по статистическим методам и визуализации числовой информации.С этого момента цифры сопровождают статьи даже в третьесортных желтых газетах. СССР был и в большой степени остается страной без цифр, а соответственно без глаз. Люди не умеют и не хотят читать статистику и делать осознанные выводы.

Поскольку в РФ книги по статистике редкость, а в СМИ вбрасывается огромное количество разрозненных данных, призванных имитировать осознанность тех или иных государственных решений, познакомимся с основными приемами нечистоплотной статистики. Благо встречаются они на каждом углу и очевидны, как божий день.

- "Случайная выборка". Когда мы слышим, что опрос показывает, что каждая третья женщина носит красную юбку или удовлетворенность выборами 80% или в стране 65% курящих мужчин в возрасте от 18 лет, речь идет о выборке случайных людей и их опросе. Вопрос в данном случае -- насколько репрезентативна сама выборка? Входят ли в нее все категории интервьюируемых, учтены ли все ограничения, сравнивалась ли данная выборка с более общей статисической информацией. В большинстве случаев ответ нет. 90% ежедневной статистики получается из опросов на улице, проводимых в рабочее время. Опрашивают 100 добровольцев, из которых, к примеру, 40 пенсионеров. И так по всему миру. Аккуратная выборка это большой труд.

- "Отравленный источник". Чаще всего цифры, на основе которых строится статистика, и вовсе берутся из непроверенных источников. Кто-то нашел в газете цифры за прошлый год, экстраполировал на следующий и voila перед нами готовая таблица. Это настолько масштабное явление, что имеет смысл всегда смотреть и перепроверять источники первичных данных.

- "Лексическая уловка". Такие слова как "средний", "процентная ставка", "прибыль" нуждаются в специальной расшифровке. Например, "средний" может означать маематическое среднее, моду или медиану выборки. Процентная ставка может быть годовая, полугодовая, охватывать всю сумму или только прибыль и т.д. Прибыль это чистая прибыль или кассовый доход? Вопросов много, но ответ кроется в терминологии.

- "Некорректная визуализация". Изменение масштаба явления на плакате, диаграмме или графике достаточно распространенное явление. Очень часто, чтобы драматизировать явление его искусственно сужают или расширяют. Например цены на что-то увеличились за 2 года на 5%. В этом случае двухлетний график будет выглядеть как почти горизональная прямая. Я вот график на масштабе двух дней увеличения цены на 2,5 % будет выглядеть как устремленная ввысь прямая.

- "Не-пришей-рукав". В качестве иллюстрации к рекламе часто говорят о том, что зубная паста убивает бактерии, а двигатель определенной марки машины сверхнадежен. Приводятся какие-то цифры, графики, сравнения. Но ни к эффективности пасты, ни к перспективам поездки на данной машине подобные сведения не имеют отношения. Бактерии бывают разные, а двигатели современных машин очень редко являются причинами ремонта. Это очень характерный отвлекающий маневр -- данный предмет в чем-то хорош, поэтому купите его для чего-то другого.

- "За этим, значит в следствии этого". Очень старый и распространный трюк -- школьники получающие низкие оценки больше курят, чем школьники с высокими. Что здесь причина, а что следствие не понять. Значит это бесполезные данные. Таким образом можно связать что угодно с чем угодно.

- "Ошибка". Наконец последнее -- статистическая погрешность. Ее обычно не называют и не учитывают, а она составляет обычно до 10%. Т.е. если наша цель выбрать лидера по продажам в каком-то регионе и цифры первого-третьего мест отличаются меньше, чем на 10%, то эту статистику можно отправлять в мусорную корзину.

Это лишь базовые и всем понятные вещи , а сколько открытий у пыливого ума отечественного читателя впереди...
Tags: math, statistics, trivia
Subscribe
promo mikaprok july 7, 00:17 88
Buy for 20 tokens
Редкий для меня служебно-личный пост. За последние полгода накопилось просто какое-то невероятное количество тем, о которых стоит поговорить, но за повседневной текучкой не доходят руки. Причем большей частью тем вполне жежешных форматов, которые не нужно упрощать-адаптировать и…
  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 0 comments