Попалась мне в facebook ссылка на статью с большой кучей графиков и подробным их описанием. Только посмотрел я на графики и засомневался в выводах авторов. Потому что «кривые лезут вверх, а цифры остаются на месте». Ну и решил воспользоваться этим примером, чтобы показать, «как правильно и как неправильно визуализировать данные».
Для начала история про одного всемирно известного физика (его фамилию моя память со школы забыла, но «всё было именно так»).
Анекдот про известного физика в картинках
На лекции физик объяснял студентам как действует какой-то физический закон. И чтобы описать его наглядно, решил нарисовать график на доске.
— График этой функции выглядит вот так, — сказал он студентам и нарисовал на доске следующее:
Подумал немного, стер график с доски и рисуя новый график сказал:
— Нет, он выглядит вот так:
Объяснять анекдот не буду, кто понял — тот понял, а «разъяснения» для тех, кто не сообразил, последуют дальше.
Разглядываем графики
Первый график в статье выглядит вот так:
Комментарий к нему такой: «После падения, шедшего на протяжении нескольких лет и достигшего максимума в 2015 году, начался рост».
Тут пока еще всё нормально, падение видно, рост видно. Смотрим следующий:
Комментарий: «Как уже не раз было нами отмечено, в последние три года резко пошел в гору уголь.»
Резко???
Ну да, если считать, что колебания у отметки 152 — это норма, то выглядит как»резко». Но давайте глянем на этот же график, построенный чуть иначе:
Ух ты! А куда делся «резкий рост»??? Может цифры не те? Да нет, те же самые. Ну, примерно… Мы же точных не знаем. Но в целом ни одна цифра этого графика существенно не отличается от цифр предыдущего.
И что мы имеем? Резкий рост! Примерно 27-28 млн. тонн за три года. Т.е. в среднем около 9 млн. тонн в год, что к базовой величине в 150 млн. тонн составляет около 6%. Резко? Прямо как зубная боль.
Комментарий: «При этом нефть и нефтепродукты – один из самых значительных и при этом высокодоходных грузов, делающих кассу ОАО РЖД – после небольшого подъема, за счет экспорта, в 2014 году, после 2015-го полетели вниз.»
Так. Смотрим, как они «летят вниз»:
Ай-яй-яй! Обвал перевозок нефти! Крушение рынка неминуемо! Как? Нет? Снова нет? А что такое?
Я бы назвал это «трендом».
За пять лет упали на 8,7%!!! Кошмар!!!
Хотя на самом деле ничего особенного. С учетом всех изменений, которые произошли на нефтяном рынке с 2012-го года по нынешнее время — я бы сказал, что это «нормальный тренд, ничего особенного».
Еще один график:
Комментарий: «Мы наблюдаем его стабильный прирост, что означает рост порожнего пробега на единицу груза и, в ряде случаев, увеличение транспортного плеча. Очевидно, что Индекс стабильно – так сказать, «естественно» – растет на сети РЖД год от года. При этом в 2014-15 годах, в период активизации экспорта, он резко пошел в гору. Потом наблюдался крайне незначительный «отскок», и в 2017-м «естественный» рост продолжился.» (выделено мной — ВК)
Глядя на этот же график в таком формате и не скажешь, что был какой-то «резкий поход в гору» или какой-либо хоть сколько-заметный «отскок».
Ну и вернемся к первому графику, т.к. в статье он присутствует дважды:
Особенно сильно огорчает комментарий про 2008 год.
Но если взглянуть иначе на те же цифры, то ужас не охватывает:
Вы скажете «ну, слушай, всё-таки 60 млн. тонн — это не два рюкзака с картошкой, это очень много». Ну, для меня 60 млн. тонн чего-либо в год — это очень много. Но для РЖД-то нет! Не верите? Вот те же цифры в процентах к 2008 году:
Конечно, падение на 13% в 2015 году к 2008 году малоприятно, но катастрофой его не назвать. Да и оставшиеся в этом году 9% до 2008 года тоже не назвать величиной, о которой «похоже, пока не стоит и мечтать…» — что такое 9% при росте на 4% за последние 2 года? Это чуть меньше пяти лет работы «в том же духе».
И если бы показатели этого года были бы пиковыми для РЖД, можно было бы порассжудать о загруженности железных дорог, изношенности локомотивов и так далее, но мы явно видим, что при всем при том же всего 9 лет назад РЖД делала эти самые 680 млн. тонн, так что никаких «инфраструктурных» узких мест там нет, и «мечтать» о таких цифрах вполне можно, а некоторым — наверное и нужно.
Думаю, картинок хватит, пора переходить к разъяснениям и выводам
Да, здесь (оригинальная ссылка не работает — ВК, 01.03.2018) вы можете найти оригинальную статью и иллюстрации.
Что не так в этих графиках?
Я думаю, вы уже, конечно же, догадались. Вся разница — в «базовой величине», от которой строится график, т.е. в том, какую цифру мы оставляем на нижней части графика.
Ставим 0 — одна картинка, ставим 600 миллионов тонн — совсем другая. Меняется пропорция и кажется, что «всё отлично!» или «всё ужасно!», хотя речь идет о мелких колебаниях в 2-3 процента, которые могут зависеть даже от методики сбора исходных данных, а не от реальных изменений.
Как же правильно? А правильно, для восприятия, показывать нижнюю границу не чуть ниже одной из значимых точек (модная тенденция, введенная в практику создателями электронных таблиц и программ для слайдовых презентаций), а такую величину, ниже которой значение графика не может опуститься «ни при каких значениях». Ну, вот например:
Забавный, но очень показательный пример. Ниже 0 литров на человека в год потребление алкоголя не опустится ни при каких обстоятельствах (если только не брать в расчёт мутации homo sapiens, при которых он будет выделять из организма этиловый спирт).
Зачем нужно ставить именно эту величину? Да потому что «подсознательно» мы все принимаем нижнюю границу графика за минимально возможную. Ниже падать некуда — там ничего не бывает.
Нет, конечно иногда бывает, но тогда на графике рисуют ось абсцисс, т.е. горизонталь, которая обозначает местоположение нулевого уровня. И тогда всё ясно: вот здесь — положительные значения, а здесь — отрицательные. А вот тут — ноль. То есть — ничто.
Если вы поднимаете нижнюю границу, это отсекает от сознания всё, что находится под ней. и тогда мы, вскользь, полуосознанно оценивая график думаем: ну, так там же ничего нет, вся работа идет сверху!
Вот взгляните еще раз на последний график из статьи:
Согласитесь, выглядит так, будто 590 — это уже край, ниже некуда, еще чуть-чуть — и РЖД просто «встанет». Будто бы 580 миллионов тонн — это величина, которая «будет при любом раскладе», будто даже если все локомотивы остановятся, все вагоны встанут, а стрелки и пути поломаются, то всё равно 580 миллионов тонн РЖД всё-таки сделает.
Это ведь не так? Тогда почему базой служит цифра в 580 миллионов тонн?
Очень просто. Это потому, что если рисовать график от нуля, то он будет какой-то слишком плоский:
Таким графиком сложно гордиться, либо ругать за него невозможно — тут же всё «ровненько-ровненько».
А если поставить не 0, а 580 — то график скачет вверх и вниз, цифры поддаются восторженным или гневным эмоциям, и всё становится хорошо.
Вот представьте, что следующие два графика описывают не объемы погрузки нефти и нефтепродуктов, а ваш вес в тот период, когда вы пытаетесь резко похудеть перед летним отпуском:
один
и второй:
Согласитесь, первый график будет вызывать больше эмоций — столько веса скинул! А потом снова начал набирать! Аааа! Полундра! Всю сдобу выкидываем из дома!
А второй? Разве там есть что-то интересное? Просто тоска…
Вот и получается, что там, где говорить не о чем, PowerPoint и Excel автоматически предлагают нам «лупу» которая резко увеличивает все эти наноизменения, которые мы наблюдаем на обычных графиках. И тогда есть о чем доложить начальству, есть за что отчитать подчиненных, и всё здорово.
Короткий, как выстрел, вывод
В случае, если на линейном графике указываются значения натуральных показателей (производство, финансы), то в качестве нижней границы нужно выбирать 0, либо то значение, ниже которого этот показатель в принципе никогда не опустится.
Если на графике присутствуют и отрицательные цифры, то нижняя граница может быть любой, но обязательно нужно указать уровень нуля.
Кстати, если на графике присутствуют ТОЛЬКО отрицательные цифры, то нулевая отметка должна служить верхней границей.
Если же вам важнее красота и эмоции, а не цифры и факты, отдайтесь на волю Excel или PowerPoint — они покажут вам, о чем говорить.
График потребления алкоголя взят здесь.
Иллюстрация в заголовке статьи взята здесь.
Остальные иллюстрации взяты из вышеупомянутой статьи (оригинальная ссылка http://dnd1520.info/2017/07/12/%D0%BF%D0%BE%D0%B3%D1%80%D1%83%D0%B7%D0%BA%D0%B0-%D0%BD%D0%B0-%D1%81%D0%B5%D1%82%D0%B8-%D1%80%D0%B6%D0%B4-%D0%B7%D0%B0-6-%D0%BC%D0%B5%D1%81%D1%8F%D1%86%D0%B5%D0%B2-2017-%D0%B3%D0%BE%D0%B4%D0%B0/ не работает — ВК, 01.03.2018) в качестве примера, либо сделаны мной.
P.S. Если вы в начале чтения всей этой истории не поняли, о чем был анекдот про известного физика, перечитайте его еще раз, я думаю, теперь вы поймёте «в чём фишка». Кстати, рассказывал эту историю мой школьный учитель физики, ирония и самоирония которому была далеко не чужда.
Кому это может быть интересно
Узнать, кто эти люди…