Telegram Group & Telegram Channel
Подборка источников о ggplot2 и обзор некоторых интересных расширений

Начнем с того, что такое ggplot2.
ggplot2 - пакет в R для визуализации данных, входит в ядро tidyverse. На самом деле это не просто "какой-то очередной пакет для графиков", а целая философия визуализации! gg в названии означает grammar of graphics - язык для построения графиков, описанный в книге Леланда Вилкинсона (Leland Wilkinson).

Делюсь материалами по освоению ggplot2:

- Англоязычные
• Замечательная инструкция как работает пакет, изучение с самых основ. Далее разбирается визуализация конкретных данных, с самого начала, то есть не сразу готовое красивое решение, а постепенно, с улучшением и дополнением на каждом этапе (а иногда и нужно вернуться на предыдущий шаг);
• Интересный разбор использования stat_summary для создания графиков с error bar (пределами погрешностей);
• Очень объемный туториал, разбирается много важных вещей (сама целиком не прочитала).

- Русскоязычные
глава книги Ивана Позднякова про устройство пакета
воркшоп по ggplot2 Татьяны Балтыжаковой (я все не читала, но судя по заголовкам очень хороший материал)
вебинар Филиппа Управителева, есть также запись на ютуб

Материалов много, поэтому я решила пока не писать свой интродакшн в ggplot, а вместо этого рассмотреть некоторые интересные расширения. Для пакета существует очень много расширений (на момент написания поста 120), с полным списком можно ознакомиться здесь.

• Расширение patchwork для объединения нескольких графиков в один. Пример работы можно посмотреть у меня в посте про пределы погрешностей. Очень крутая вещь, позволяет в том числе сразу добавлять аннотации на плоты (например А, B, C), что делает их отлично отформатированными для научной публикации.
• По поводу публикаций - здесь есть несколько расширений, чтобы например добавлять результаты статистических тестов на графики: ggstatplot, ggpubr, ggsignif. Минус этих расширений в том, что они поддерживают заданный набор базовых плотов: барплоты, боксплоты и другое, но не все что угодно, как обычный ggplot2 без расширений. Кроме того, с коллегой обнаружили, что ggpubr не поддерживает односторонние тесты, конечно можно залезть в код и отредактировать, но немного неприятно.
• Еще по поводу статей: пакет hrbrthemes делает очень красивые графики для публикаций с нужными шрифтами, фоном, выравниванием заголовков.
• Для генетиков и биоинформатиков: gggenes позволяет визуализировать гены и их относительное расположение, направление цепи, думаю экзон-интронную структуру также можно воспроизвести.
ggpattern, чтобы раскрашивать графики котятами (и не только).
ggheatmap для отрисовки хитмапов

Посмотрите сами галерею расширений, может приглянется что-то, и окажется, что какие-то задачи можно больше не делать вручную, а использовать готовый пакет для этого!

Также рекомендуйте в комментариях, какие есть еще интересные расширения.

#R #data_vis #ggplot2



group-telegram.com/stats_for_science/52
Create:
Last Update:

Подборка источников о ggplot2 и обзор некоторых интересных расширений

Начнем с того, что такое ggplot2.
ggplot2 - пакет в R для визуализации данных, входит в ядро tidyverse. На самом деле это не просто "какой-то очередной пакет для графиков", а целая философия визуализации! gg в названии означает grammar of graphics - язык для построения графиков, описанный в книге Леланда Вилкинсона (Leland Wilkinson).

Делюсь материалами по освоению ggplot2:

- Англоязычные
• Замечательная инструкция как работает пакет, изучение с самых основ. Далее разбирается визуализация конкретных данных, с самого начала, то есть не сразу готовое красивое решение, а постепенно, с улучшением и дополнением на каждом этапе (а иногда и нужно вернуться на предыдущий шаг);
• Интересный разбор использования stat_summary для создания графиков с error bar (пределами погрешностей);
• Очень объемный туториал, разбирается много важных вещей (сама целиком не прочитала).

- Русскоязычные
глава книги Ивана Позднякова про устройство пакета
воркшоп по ggplot2 Татьяны Балтыжаковой (я все не читала, но судя по заголовкам очень хороший материал)
вебинар Филиппа Управителева, есть также запись на ютуб

Материалов много, поэтому я решила пока не писать свой интродакшн в ggplot, а вместо этого рассмотреть некоторые интересные расширения. Для пакета существует очень много расширений (на момент написания поста 120), с полным списком можно ознакомиться здесь.

• Расширение patchwork для объединения нескольких графиков в один. Пример работы можно посмотреть у меня в посте про пределы погрешностей. Очень крутая вещь, позволяет в том числе сразу добавлять аннотации на плоты (например А, B, C), что делает их отлично отформатированными для научной публикации.
• По поводу публикаций - здесь есть несколько расширений, чтобы например добавлять результаты статистических тестов на графики: ggstatplot, ggpubr, ggsignif. Минус этих расширений в том, что они поддерживают заданный набор базовых плотов: барплоты, боксплоты и другое, но не все что угодно, как обычный ggplot2 без расширений. Кроме того, с коллегой обнаружили, что ggpubr не поддерживает односторонние тесты, конечно можно залезть в код и отредактировать, но немного неприятно.
• Еще по поводу статей: пакет hrbrthemes делает очень красивые графики для публикаций с нужными шрифтами, фоном, выравниванием заголовков.
• Для генетиков и биоинформатиков: gggenes позволяет визуализировать гены и их относительное расположение, направление цепи, думаю экзон-интронную структуру также можно воспроизвести.
ggpattern, чтобы раскрашивать графики котятами (и не только).
ggheatmap для отрисовки хитмапов

Посмотрите сами галерею расширений, может приглянется что-то, и окажется, что какие-то задачи можно больше не делать вручную, а использовать готовый пакет для этого!

Также рекомендуйте в комментариях, какие есть еще интересные расширения.

#R #data_vis #ggplot2

BY Статистика и R в науке и аналитике


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/stats_for_science/52

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

False news often spreads via public groups, or chats, with potentially fatal effects. On February 27th, Durov posted that Channels were becoming a source of unverified information and that the company lacks the ability to check on their veracity. He urged users to be mistrustful of the things shared on Channels, and initially threatened to block the feature in the countries involved for the length of the war, saying that he didn’t want Telegram to be used to aggravate conflict or incite ethnic hatred. He did, however, walk back this plan when it became clear that they had also become a vital communications tool for Ukrainian officials and citizens to help coordinate their resistance and evacuations. And indeed, volatility has been a hallmark of the market environment so far in 2022, with the S&P 500 still down more than 10% for the year-to-date after first sliding into a correction last month. The CBOE Volatility Index, or VIX, has held at a lofty level of more than 30. Asked about its stance on disinformation, Telegram spokesperson Remi Vaughn told AFP: "As noted by our CEO, the sheer volume of information being shared on channels makes it extremely difficult to verify, so it's important that users double-check what they read." "Russians are really disconnected from the reality of what happening to their country," Andrey said. "So Telegram has become essential for understanding what's going on to the Russian-speaking world."
from id


Telegram Статистика и R в науке и аналитике
FROM American