Ахмедов Равиль (oo_o_oo) wrote in doktor_killer,
Ахмедов Равиль
oo_o_oo
doktor_killer

Средние зарплаты

Оригинал взят у oo_o_oo в Средние зарплаты
"Это, типа, начальник ест мясо, а я капусту, а вместе мы, значит, едим голубцы"


К вопросу о наукообразности данных. Поговорим-ка о зарплатах.


Статистика имеет дело с закономерностями в явлениях реального мира, которые мы хотим описать вероятностными законами, чтобы оперировать моделями больших совокупностей объектов, явлений, событий и т.д. Статистика используется для того чтобы попытаться отобразить весь разнообразный мир в цифрах, а потом еще что-то с этим отображением сделать.

Мы все время сталкиваемся со средними цифрами. Кругом все все время их используют. Средние цифры валятся как из рога изобилия в отчетах правительства, в разговорах с начальством. В практике врача средние цифры зарплат - это эдакий кляп, которым затыкают рот всем вопрошающим, однако, неприятный осадочек все равно остается.

Поговорим об осадочке.

Сплошь и рядом написано средняя зарплата врачей составляет какие-то нереальные цифры. Сколько бы я не работал на скорой ни единого разу мой доход по квитку не превысил средних значений для врачей скорой помощи Новосибирска. Несовпадение цифр сначала наводило на мысль, что пока опыта нет, нет категории, а позже я понял, что я играю в игру не по своим правилам, привело к попыткам найти ответы.

Среднее арифметическое - один из самых простых статистических показателей и поэтому часто используемых. У среднего арифметического есть одна особенность оно более менее совпадает с самым часто встречающимся значением только при симметричном нормальном гауссовском распределении. Вот типа таком.

symmetric

В случае, если распределение не симметричное, то средние цифры показывают вообще непонятно что. Кто вообще догадается, что среднее значение на графике ниже расположено справа, а не слева?

asymmetric

Как правило, в публичных отчетах даже не указывается кого включили в выборку для расчета средних цифр, поэтому данные о распределении зарплат покрыты мраком. Прикинем какое у нас получится распределение значений зарплат врачей. Когда неизвестно кто включен в выборку, то в выборку может быть включен кто угодно, включая главврачей и всевозможных местечковых и даже московских министров. Это уловка. По умолчанию подразумевается, что врач исходя из своих слабых знаний в статистике, включит только себя и свое окружение в эту выборку, т.е. в голове у врача рисуется вот такой график зависимости зарплаты - обычное такое гауссовское распределение (по горизонтали размер дохода, по вертикали количество людей в коллективе с таким доходом).

обычное гауссовское распределение

Однако, если не указано обратное, в выборке может оказаться кто угодно с каким угодно размером оплаты труда, например, главврачи ведь они же тоже врачи только с корочками по управлению здравоохранением.

аморфная толпа плюс скрытые главнюки

Таким образом, пара-тройка в тихую добавленных к выборке замов и главврачей с хорошим доходом может запросто улучшить "статистику" (см. пример ниже).

Также для того чтобы быть максимально достоверной выборка должна быть максимально однородной, т.е. оцениваться должны как можно более похожие случаи по одному единственному признаку, который отличается. В нашем случае, всех врачей можно для начала разделить как минимум на 4 группы по категориям, т.к. при смене категорий происходит квантовый скачок зарплат.

просто по категориям

Да, да, не забываем про доходы администрации.

по категориям с главными врачами

Итого, мы получили как минимум 5 горбов реального распределения зарплат врачей, связанных с категориями, что говорит о том, что выборка неоднородна по категориям. Однако, в приводимых значениях нет никаких указаний о том сколько каждый из учтенных персонажей отработал по времени. Человек может работать на ставку, может на полторы или две, а может быть совместителем и каждый раз отработанное время влияет на размер дохода. Также, принимая во внимание, что размер ставки по часам каждый месяц равный, а доход все равно рассчитывается от фиксированного размера оклада, то, если человек работает не строго на ставку (как на скорой например), то его доход каждый месяц будет разным при всех прочих равных условиях - т.е. в январе самая большая зарплата, в декабре самая маленькая, при временных ставках примерно 118 и 168 часов соответственно. Также квантовый скачок размера зарплаты случается при появлении научных степеней, увеличении стажа или общего времени работы в организации ("колеса" на скорой). Также не указывается какой доход учитывается в оценке. Если учитывать доход после вычета налогов, то некоторые показатели будут завышены, потому что работники с двумя и более детьми до 18 лет  не платят подоходного налога в 13%. В итоге мы выяснили, что выборка врачей настолько неоднородна, что совершенно не похожа на гауссиану, для которой теоретически можно рассчитать какие-то средние значения для всех врачей или хотя бы для какой-то категории врачей отдельно.

Мало того что требования среднего арифметического очень жесткие, так среднее вообще ни о чем не говорит. Вот просто ни о чем. Какой смысл несет утверждение, что средняя зарплата по стране/медработника/врача равна такому-то значению? Никакого. Сейчас попробую сделать инсайт. Какой смысл несет утверждение, что средняя температура по больнице равна такому-то значению? Никакого, кроме желания насмешить. Так почему же средняя температура это анекдотическая притча во языцех, а к средним зарплатам отношение абсолютно толерантное, при том что и температура тела и зарплата для статистики абсолютно равны как единичные и уникальные явления?

Итак, если не опираться на средние показатели зарплат, то на что опираться? Самым показательным в сравнении со сложностью получения, в случае оценки доходов явится использование медианы. Медиана или еще квантиль 0.5 - это такой показатель, который делит выборку на две равные части: 50 % «нижних» единиц ряда данных будут иметь значение признака не больше, чем медиана, а «верхние» 50 % — значения признака не меньше, чем медиана. В общем случае можно сказать, что медиана будет показывать то, сколько заработал средний человек (так нами любимый с совковых времен). Если говорить просто, то медиана покажет не больше(меньше) какой цифры получает 50% выборки (коллектива то есть).

Примеры.

Сначала абстрактный пример с миллиардером.

Предположим, что в одной комнате оказалось 19 бедняков и один миллиардер. Каждый кладёт на стол деньги — бедняки из кармана, а миллиардер — из чемодана. По $5 кладёт каждый бедняк, а миллиардер — $1 млрд. В сумме получается $1 000 000 095. Если мы разделим деньги равными долями на 20 человек, то получим $50 000 004,75. Это будет среднее арифметическое значение суммы наличных, которая была у всех 20 человек в этой комнате. (Именное поэтому тотже Билл Гейтс, проживающий в Вайоминге, испортил бы статистику доходов всего штата, если бы его одного включили в показатели, но к счастью его доходы не учитываются.) Медиана в этом случае будет равна $5. Можно интерпретировать это следующим образом. Разделив нашу компанию на две равные группы по 10 человек, мы можем утверждать, что в первой группе каждый положил на стол не больше $5, во второй же не меньше $5. В общем случае можно сказать, что медиана это то, сколько принёс с собой средний человек. Наоборот, среднее арифметическое — неподходящая характеристика, так как оно значительно превышает сумму наличных, имеющуюся у среднего человека.

Теперь более реальный пример из области медицины.

Если представить последнюю картинку распределения доходов социальной группы врачи с пятью горбами в виде цифр, с пиками по категориям на 12тр,16тр,20тр,24тр и 100тр у завов, замов и главнюков, при этом последние занимают только 10% популяции, а остальные работяги - равными долями остальные 90%, то среднее значение доходов будет 26.2, что собственно недалеко от официальных цифр, а медиана доходов коллектива всего 19.2524 тыр, что как раз что-то очень близкое к реальности.

Остановимся на медиане подробнее. Расчет медианы, не требуя симметричности распределения, тем не менее все равно требует чтобы изучаемая выборка была как можно более однородна для более лучшей точности показателей оценки (не этого ли мы хотим добиться в конце концов?). Ну так как же нам быть с такой неоднородной врачебной выборкой с их категориями, должностями, научными званиями, не говоря уже об остальных медработниках сестрах, фельдшерах, санитарах, которые также могут совмещать, работать от четверти до двух трех ставок, иметь налоговые льготы. Эти все неоднородности выборки так или иначе присущи любой профессии, поэтому все сказанное выше применимо ко всем. Общая неоднородность народных масс никак не позволяет эффективно и достоверно использовать даже медиану для оценки заработков. Выходом из ситуации, явится использование медианы, или на худой конец, средних цифр заработка в час по данной специальности до вычета налогов, т.е. не больше/меньше какой цифры зарабатывают 50% врачей по категориям на момент начисления доходов без учета вычета налогов. Кстати, именно так и поступают на западе, где электорат не даст так легко заигрывать с цифрами.

Философский аспект

Практика применения средних цифр доходов является софизмом, а те кто его применяют демагогами, маскирующими реальность за наукообразностю слов. По умолчанию после приведения абстрактных средних цифр без указания выборки предполагается, что слушатель домыслит их в ключе медианы - не меньше этой цифры и уткнется. Вследствие тонких различий этих показателей, разница совершенно не заметна, по крайней мере я до сих пор не нашел ни одного поста со срыванием покровов на тему средних цифр. В итоге, кинутый в массы статистический мусор воспринимается как данность и только чувство недоумения от несовпадения собственного заработка с приведенным остается в осадке. Разношерстные объекты нельзя сводить к одному единственному показателю -- это не работает. Никогда. И тот, кто так делает -- всегда занимается искажением реальности, отвлечением внимания и уходом ответов.

Также при сложившейся структуре выборки бОльшие значения средних цифр по отношению к медиане играют ведущую роль в поддержании другого распространенного софизма "Сперва добейся!", проявляющегося в бесконечным задиранием планки, за которой начинается выполнение обещанного. За счет роста зарплаты одних управленцев рисуется липовый общий рост, который никоим образом нельзя обогнать легальными средствами. Примерно также, я думаю, в нашей стране рисуется общий рост средних доходов на фоне роста доходов олигархов.

Для каких-то локальных целей оценок заработков стационаров, конечно, можно рассчитывать медиану доходов какой-то группы, но эта медиана должна быть эталонная с очень четким перерасчетом на занятость в одну ставку, до вычета налогов, без учета стажа или научным степеней. С другой стороны отвечая тренду back in USSR, ни один стационар не кичится доходами своих работников открыто, а наоборот всячески напоминает об уравниловке и беспросвете средними цифрами доходов и фактическим использованием совковых тарифных сеток для персонала при формальной законной свободе платить почти сколько угодно (эта свобода касается в основном администрацию).

Следствия применения наукообразных данных

После оглашения средних цифр заработка весь авторитетный костяк медицинского олдскула, к чьему мнению могут прислушаться, а также все функционеры со своими зарплатами выше среднего, имеющие возможность влиять на ситуацию помещаются вне игры за оплату труда. Они не будут открывать рта и всячески будут способствовать затыканию всех недовольных ртов, по причине страха потерять свой высокий уровень оплаты и потребления в сравнении с теми кто ниже средних цифр. Такие дела.

Вообще, вся эта ситуация с общими размерами доходов похожа на детальную экспертизу чужого грязного белья. Размеры часовых доходов мало того что более точные и показательные, так еще и стимулируют на рост и развитие. Как потопаешь, так и полопаешь.

Применение знаний почерптнутых в данном посте.

Теперь будучи ознакомленными с разницей между средними значениями и медианой, а также важностью указания выборки и ее однородности, вы сможете уличить докладчика в незнании основ статистики и методов получения выдаваемых данных, а значит в подтасовке данных и искажении реальности. Отличный повод на следующем собрании задать неудобный вопрос.

Выводы

Почему же мы получаем в ответ такие псевдонаучные бредни?

Теория первая - жопоголическая. Власти все знают, но скрывают. Подразумевается, что все таки ведется сбор данных по многим параметрам, но на выходе все очень примитивно в угоду псевдонаглядности, чтобы не создавать панику или по еще каким-то причинам. Эта теория не находит практического подтверждения, потому что рано или поздно был бы слив.

Теория вторая - некомпетентная. Повальное увлечение средними цифрами также говорит о низкой образованности населения, а также низкой образованности тех кто их приводит. Короче говоря, люди, по работе обязанные выдавать нам статистическую картину максимально приближенную к реальности, выдают нам некий наукообразный суррогат, на основе которого потом ведутся расходы, подаются отчеты, а пипл хавает. Наелись, теперь можно весело троллить!

Учитывая опыт общения с руководящими элементами здравохоронения могу предложить новые статистические параметры для лечения пациентов, в которые входят понятия среднее здоровье, среднее лечение, средний эффект от препарата, средний побочный эффект от препарата, средний аппендицит и прочие радости. Такие параметры всегда будут показывать прекрасное состояние здоровья нации ведь количество больных ничтожно мало в сравнении со здоровыми людьми. Зачем нам рядовые врачи, когда есть показатель среднего здоровья и министр так виртуозно им оперирующий!

Написано совместно с det_random. Он мне прислал практически целый пост, но его текста, на мой взгляд, было недостаточно для раскрытия вопроса. Допейсал каг мог. Если где не прав, поправляйте. Замечания по теме и корректура ошибок приветствуется.

Этот текст распространяется по лицензии CC-SA (copyleft). Репостите, копируйте, просвещайтесь сами и просвещайте коллег.




Извините!

Subscribe

  • юмор

  • Блин.....

    Такую группу профукали.... все от безмозглых модераторов, зарезавших материалы, которые могли максимально выстрелить в ТОПы... Ни себе - ни людям...…

  • Занимательная римская медицина.

    А, вот, сняли фильм про римскую медицину. Есть свои минусы и плюсы, но мы старались.18+ Фото для понимания, видео по ссылке.…

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 50 comments

  • юмор

  • Блин.....

    Такую группу профукали.... все от безмозглых модераторов, зарезавших материалы, которые могли максимально выстрелить в ТОПы... Ни себе - ни людям...…

  • Занимательная римская медицина.

    А, вот, сняли фильм про римскую медицину. Есть свои минусы и плюсы, но мы старались.18+ Фото для понимания, видео по ссылке.…