group-telegram.com/stats_for_science/52
Last Update:
Подборка источников о ggplot2 и обзор некоторых интересных расширений
Начнем с того, что такое ggplot2
. ggplot2
- пакет в R для визуализации данных, входит в ядро tidyverse
. На самом деле это не просто "какой-то очередной пакет для графиков", а целая философия визуализации! gg
в названии означает grammar of graphics - язык для построения графиков, описанный в книге Леланда Вилкинсона (Leland Wilkinson).
Делюсь материалами по освоению ggplot2:
- Англоязычные
• Замечательная инструкция как работает пакет, изучение с самых основ. Далее разбирается визуализация конкретных данных, с самого начала, то есть не сразу готовое красивое решение, а постепенно, с улучшением и дополнением на каждом этапе (а иногда и нужно вернуться на предыдущий шаг);
• Интересный разбор использования stat_summary
для создания графиков с error bar (пределами погрешностей);
• Очень объемный туториал, разбирается много важных вещей (сама целиком не прочитала).
- Русскоязычные
• глава книги Ивана Позднякова про устройство пакета
• воркшоп по ggplot2
Татьяны Балтыжаковой (я все не читала, но судя по заголовкам очень хороший материал)
• вебинар Филиппа Управителева, есть также запись на ютуб
Материалов много, поэтому я решила пока не писать свой интродакшн в ggplot, а вместо этого рассмотреть некоторые интересные расширения. Для пакета существует очень много расширений (на момент написания поста 120), с полным списком можно ознакомиться здесь.
• Расширение patchwork для объединения нескольких графиков в один. Пример работы можно посмотреть у меня в посте про пределы погрешностей. Очень крутая вещь, позволяет в том числе сразу добавлять аннотации на плоты (например А, B, C), что делает их отлично отформатированными для научной публикации.
• По поводу публикаций - здесь есть несколько расширений, чтобы например добавлять результаты статистических тестов на графики: ggstatplot, ggpubr, ggsignif. Минус этих расширений в том, что они поддерживают заданный набор базовых плотов: барплоты, боксплоты и другое, но не все что угодно, как обычный ggplot2 без расширений. Кроме того, с коллегой обнаружили, что ggpubr
не поддерживает односторонние тесты, конечно можно залезть в код и отредактировать, но немного неприятно.
• Еще по поводу статей: пакет hrbrthemes делает очень красивые графики для публикаций с нужными шрифтами, фоном, выравниванием заголовков.
• Для генетиков и биоинформатиков: gggenes позволяет визуализировать гены и их относительное расположение, направление цепи, думаю экзон-интронную структуру также можно воспроизвести.
• ggpattern, чтобы раскрашивать графики котятами (и не только).
• ggheatmap для отрисовки хитмапов
Посмотрите сами галерею расширений, может приглянется что-то, и окажется, что какие-то задачи можно больше не делать вручную, а использовать готовый пакет для этого!
Также рекомендуйте в комментариях, какие есть еще интересные расширения.
#R #data_vis #ggplot2
BY Статистика и R в науке и аналитике
Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260
Share with your friend now:
group-telegram.com/stats_for_science/52