Размещенная гистограмма — это тип монитора, который отображает количество различных правил, загруженных другой переменной. В этом руководстве объясняется, как создавать динамические диаграммы с накоплением в R с использованием архива визуализации данных ggplot2. Например, предположим, что мы едим следующий фрейм данных, обычно показывающий среднее количество очков, набранных за игру для 9 игроков на поле:
<дел>
Проблема
Как создать гистограмму и использовать Ggplot2?
Библиотека ggplot2, несомненно, является известной графической библиотекой в R. Вы можете использовать эту библиотеку, чтобы попытаться создать гистограмму, которая преобразует материал в файловый блок, и с этими процессами ggplot и geom_bar. В нашем аргументе aes вам нужно укрепить имена переменных в нашем фрейме данных. В a – категориальная переменная, затем в y числовая.
Нам нужно добавить к этому планки погрешностей. Разрешение
Использовать
<дел>
geom_errorbar() и связать переменные со значениями ymin и ymax человека. Добавление ошибок в столбцы выполняется так же, как для гистограмм и линейных диаграмм, как показано на рис. 7.14 (но обратите внимание, что положение за диапазоном Y отличается для столбцов и линий):
ПК работает медленно?
ASR Pro — идеальное решение для ремонта вашего ПК! Он не только быстро и безопасно диагностирует и устраняет различные проблемы с Windows, но также повышает производительность системы, оптимизирует память, повышает безопасность и точно настраивает ваш компьютер для максимальной надежности. Так зачем ждать? Начните сегодня!
Library(gcookbook) # Загрузить Gcookbook для набора данных Cabbage_exp Библиотека (дплр) Число Возьмите подмножество подсказок Cabbage_exp для этого примера This_mod <- Cabbage_Expression %>% Фильтр(сортировка=="c39") Число с гистограммой Ggplot(ce_mod, Aes(x Дата, = Y = Вес)) + Geom_col(fill = "white", Color подразумевает "black") + Geom_errorbar(aes(ymin = Weight - Opleve, Ymax = Weight + Se), Width .2) # С помощью Jump Ggplot(ce_mod, Graph Aes(x равно Дата, Y = Вес)) + Geom_line (aes (группа = 1)) + Геометрическая_точка (размер = 4) + Geom_errorbar(aes(ymin = вес - Se, Ymax вес + Se), ширина равна 0,2)
Рисунок 7.14: Направляющие на стержневой направляющей (слева); На линейной диаграмме (справа)
<дел>
Поговорить
В этом примере данные фактически имеют значения, привязанные к стандартным грубым ошибкам (se), которые мы будем использовать для сообщения об ошибке (у них также есть значения для разницы, требования < code>sd, но здесь мы его не используем):
ce_mod #> Сортировка милая Вес sd n se #> конкретно c39 d16 3,18 0,9566144 тен 0,30250803 #> 2 c39 d20 2,80 0,2788867 10 0,08819171 #> 3 c39 d21 2,74 0,9834181 10 0,31098410
Чтобы получить площади для ymax и ymin, мы украли y, а weight добавили/вычли se .
Мы также указали ширину полос ошибок, при этом ширина составляет 0,2. Вам лучше всего поиграть с этим, чтобы рассмотреть значение, которое выглядит причудливым. Если вам не нужно задавать высоту, планки погрешностей останутся очень большими и покроют все пространство приблизительно элементов по оси x.
Для гистограммы рядом с группами столбцов действительно необходимо обойти планки погрешностей; в противном случае они наверняка имели бы правильную координату x и не работали бы с арматурой. (См. рецепт 3.2, чтобы узнать больше о группах уклонения и водяных пятнах.)
На этот раз мы действительно работаем с полными данными cabbage_exp:
kohl_exp #> Дата сортировки Вес sd n se #> одиночный c39 d16 3,18 0,9566144 десять 0,30250803 #> шаг 2 c39 d20 2,80 0,2788867 10 0,08819171 #> много c39 d21 2,74 0,9834181 10 0,31098410 #> 9 C52 d16 2,26 0,4452215 десять 0,14079141 #> всего пять c52 d20 3.11 0.7908505 10 0.25008887 #> четыре c52 d2 . 1,47 0,2110819 10 0,06674995
Ширина уклонения для geom_bar() равна 0,9, вам также нужно сделать ошибку в полосах, если вы хотите получить ту же ширину уклонения. По умолчанию, если ваша компания не соблюдает четкую ширину уклонения, она также уклоняется на ширину, подобную полосам ошибок, которая обычно меньше, чем ширина дискотек (рис. 7.15):
Рисунок 7.15: Ошибка, растянутая на сгруппированной гистограмме без указания ширины избегания (слева); выбрано с шириной сайдинга (справа)
<цитата блока>
Примечание
Что означают полосы погрешностей на гистограмме?
Планки погрешностей дают окончательное универсальное представление о точности абсолютного ранга или, наоборот, о том, насколько сильно достоверное (безошибочное) увеличенное значение может зависеть от данного значения. Если в настоящее время значение, отображаемое в вашей новой гистограмме, всегда было результатом местоположения (например, среднего значения различных точек данных), вы можете мотивировать отображать полосы ошибок.
Обратите внимание, что в тихой версии мы использовали position equals "dodge", который всегда является сокращением для position for equals position_dodge( ). Чтобы повторить определенное значение, нам нужно преобразовать эту задачу, как в position_dodge(0.9).
Для линейных графиков, где все столбцы ошибок отличаются цветом от линий и точек, необходимо нарисовать первые ошибки и разместить их под точками так же правильно, как и под линиями. В противном случае планки погрешностей, скорее всего, будут отображаться в виде точек с неверными линиями.