Telegram Group Search
Это самый заряженный на любовь к ML пост от OpenBio! ❤️

Мы подготовили для вас особенные валентинки — такие, от которых расчувствуется даже нейросеть. Делитесь ими с коллегами, друзьями и теми, чья любовь к ML глубже, чем многослойный перцептрон.

❤️ А ещё лучше — приходите вместе изучать ML на курсе «Машинное обучение в биологии и биомедицине»! Ведь разделять новые знания так же ценно, как и разделять важные моменты жизни.

#openbio_ML

До старта курса: 1️⃣ 1️⃣ дней

📌 Машинное обучение в биологии и биомедицине | OpenBio.Edu — подписывайтесь!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔭 Всем привет! Мы немного отдохнули после запуска курса, а теперь восстанавливаем активность и продолжаем делиться с вами новостями из мира ML в биологии и биомедицины ☺️

Сегодня подобрали небольшой дайджест событий в сфере биотеха и IT, на которых можно получить полезные знания, познакомиться со специалистами из академии и индустрии и прокачать свои навыки в ML.

1️⃣ 19 марта | Семинар по МЛ в геномике: «Как функциональная геномика может помочь при исследовании эволюции?»

Уже завтра пройдет семинар для тех, кто хочет глубже разобраться в применении машинного обучения в биоинформатике и понять, как его используют в современной генетике. Это возможность дополнительно встретиться со спикером курса «Машинное обучение в биологии и биомедицине» Артёмом Касьяновым! Он расскажет, как современные омиксные технологии — RNA-seq, ChIP-seq, Hi-C — помогают исследовать эволюционные процессы, а также представит подходы, позволяющие анализировать экспрессию генов и выявлять события положительного отбора в популяциях.

2️⃣ 4–24 апреля | Дни компьютерных наук ФКН НИУ ВШЭ

Фестиваль объединяет студентов, преподавателей, исследователей и всех, кто интересуется IT. В программе — лекции, дискуссии, квизы и кинопоказы. Для тех, кто только начинает изучать машинное обучение, особенно полезными будут тренинги по ML и прикладному программированию. Это хорошая возможность не только освоить новые технологии, но и пообщаться с экспертами и представителями IT-компаний.

3️⃣ 16–17 мая | ML-конференция: от обучения до эксплуатации моделей (IML Conf)

Конференция ориентирована на практическое применение машинного обучения в самых разных сферах, включая медицину и биотех. В программе — доклады и мастер-классы по NLP, Computer Vision, Big Data, MLOps и другим ключевым темам. Участники смогут узнать, как организуется полный цикл работы с ML-моделями: от обучения до внедрения в реальный продукт. Для тех, кто только начинает разбираться в этой области, это возможность услышать реальные кейсы и познакомиться с профессиональным сообществом.

4️⃣ 21–23 мая | Саммит разработчиков лекарственных препаратов «Сириус.Биотех»

Саммит посвящен ключевым технологическим платформам разработки лекарств и последним трендам в биофармацевтике. Ведущие эксперты отрасли расскажут о современных подходах к созданию и производству препаратов, а также о возможностях карьерного роста в этой области. Для студентов и молодых ученых это не только шанс получить актуальные знания, но и возможность наладить контакты с потенциальными работодателями и партнерами.

⤵️Прошедшее, но полезное⤵️

5️⃣ IX Всероссийская конференция по ИИ в здравоохранении («ИТМ ИИ»)

Конференция собрала специалистов, работающих с искусственным интеллектом в медицине. В докладах обсуждались реальные кейсы внедрения ML-моделей в клиническую практику в РФ, а также вопросы регулирования и оценки качества ИИ-систем.

Записи докладов с конференции можно найти в свободном доступе во Вконтакте или на сайте ИТМ (нужна регистрация) — если вам любопытно, как именно новые технологии используются для анализа медицинских данных в настоящей врачебной практике, это отличная возможность погрузиться в тему.

#openbio_news

📌 Машинное обучение в биологии и биомедицине | OpenBio.Edu — подписывайтесь!
Please open Telegram to view this post
VIEW IN TELEGRAM
Сегодня отмечается Всемирный день воды — событие, привлекающее внимание к проблемам экологии океанов и ледников. Современные технологии сбора данных, включая спутниковые наблюдения, акустические системы и генетический анализ, генерируют огромные массивы информации. Для их обработки используются машинное обучение и искусственный интеллект, которые стали важными инструментами в морской экологии.

➡️ Сегодня рассмотрим, как методы ML помогают анализировать информацию о физических процессах и биоразнообразии мирового океана.

🌊 Применение машинного обучения в морской экологии

🔷 Обработка изображений и видео с помощью сверточных нейросетей (CNNs) позволяет автоматически идентифицировать морские организмы, картировать донные экосистемы и обнаруживать пластиковый мусор. При этом сложность анализа данных возрастает из-за большого разнообразия объектов: для планктона важна точность детекции среди водной толщи, а для анализа бентоса — способность выделять организмы на сложном фоне морского дна.

🔷 Машинное обучение также автоматизирует анализ акустических данных. Поскольку звук проникает сквозь воду лучше, чем свет, он широко используется для подводных измерений. В глубоких нейросетях акустические сигналы часто преобразуются в спектрограммы и анализируются так же, как изображения.

🔷 В области экологической геномики ИИ помогает анализировать данные о ДНК, извлекаемой из морской воды, что позволяет отслеживать состав микробных сообществ. Генетическая информация охватывает целые экосистемы, а современные алгоритмы выявляют таксономические группы и сопоставляют их с географическим расположением, что открывает новые возможности для мониторинга биоразнообразия.

🔷 Спутниковые данные и эхосигналы, обработанные ML-моделями, используются для составления карт биогеографических зон, оценки состояния коралловых рифов и анализа донных осадков.

🔷 В рыболовстве машинное обучение помогает отслеживать популяции рыб и предсказывать их миграцию, сочетая экологические и экономические факторы в предсказательных моделях. Это важно и для отслеживания популяций рыб в природе, и для организации эффективного, но безопасного для экосистемы промышленного рыболовства.

🧊 Задачи гляциологии (науки о ледниках)

🔷 Картирование ледников сталкивается с трудностями из-за изменяющихся климатических условий и различий в данных, полученных с разных спутников. Однако ML-модели, комбинирующие многолетние разнородные данные, позволяют более точно анализировать эволюцию ледников.

🔷 Дифференциация льда и снега, а также моделирование динамики льдов пока находятся на ранней стадии развития в ИИ-исследованиях, но уже сейчас разработанные алгоритмы демонстрируют высокую точность.
Например, ученые Университета Лозанны создали модель глубокого обучения, которая позволила предсказывать толщину ледников с разрешением 300 метров, что в несколько раз превосходит точность предыдущих методов.

Машинное обучение радикально меняет морскую науку, позволяя анализировать огромные массивы данных. К сожалению, чем больше мы узнаем с помощью новых технологий, тем более тревожной становится картина. Анализ с использованием ИИ показывает, что состояние ледников и океанов ухудшается быстрее, чем предполагалось ранее. Человеческая деятельность ускоряет процессы, ранее считавшиеся стабильными. Новые инструменты не только дают нам беспрецедентные возможности оценить масштаб разрушений, но и требуют от нас решительных действий.

#openbio_ml #openbio_science

📌 Машинное обучение в биологии и биомедицине | OpenBio.Edu — подписывайтесь!
Please open Telegram to view this post
VIEW IN TELEGRAM
Методы ML.pdf
568 KB
Всем приятной и продуктивной пятницы! ↗️

Чтобы немного переключиться после насыщенной рабочей недели и одновременно занять ум чем-то полезным, предлагаем вам освежить знания о сфере машинного обучения. Мы подготовили наглядную схему, где собраны самые популярные методы, применяемые в биомедицинских исследованиях.
Схема может быть полезна и как шпаргалка, и как точка старта, если хочется углубиться в тему.

Сколько из них вы уже пробовали на практике? А если МЛ пока не ваш основной инструмент — какие из подходов зацепили или вдохновили?

#openbio_ml

📌 Машинное обучение в биологии и биомедицине | OpenBio.Edu — подписывайтесь!
Please open Telegram to view this post
VIEW IN TELEGRAM
Актуальная подборка вакансий в области биологии и биомедицины с компетенциями в ML:

🦠Биоинформатик (онкология) 
ФГБУ ЦСП ФМБА России в поисках биоинформатиков с опытом в биомедицинских проектах для анализа NGS-данных (геном, транскриптом, метилом) и разработки пайплайнов. Большим преимуществом будет знание ML, системной биологии и наличия дополнительного образования в онкологии/генетике. 

📊 Биостатистик (лаборатория разработки новых методов молекулярной диагностики заболеваний человека)
Центр постгеномных технологий ищет разработчика (биоинформатика/статистика) для анализа ДНК, обработки данных и написания статей с использованием методов ML.

🧬ML/DL Researcher для дизайна белков
Ищут мотивированного специалиста для разработки и применения алгоритмов (AlphaFold, Diffusion-модели и др.), интеграции биоданных, валидации in silico, с уверенным знание ML/DL (генеративные модели, GNN), с опытом работы с белковыми структурами (PDB, Biopython), Python/PyTorch/TensorFlow.

👨💻Руководитель разработки (Tech Lead)
Компания нуждается в руководителе, который будет вести команду разработчиков, проектировать архитектуру (SQL/NoSQL, AI-системы, компьютерное зрение), создавать аналитические сервисы для генетических данных, заниматься код-ревью и менторством.


#openbio_вакансии
📰 Возвращаемся с новостями!

Уже заканчивается второй поток курса «Машинное обучение в биологии и биомедицине», а мы готовим для вас насыщенное лето:
🔻 прямые эфиры с новыми "сеньорами" биоинформатиками
🔻 свежие тренды в биотехе и сфере AI
🔻 азы Python и ML для новичков и разборы ключевых терминов
🔻 раскрытие сложных тем в рубрике "вопрос-ответ" от наших экспертов
🔻 подборки вакансий и карьерные советы

Ну что, поехали! 🚀

#openbio_ml #openbio_education #биотех #машинноеобучение
Please open Telegram to view this post
VIEW IN TELEGRAM
Python для биомеда: словари и циклы — ключ к анализу данных

Продолжаем нашу рубрику «азы программирования» с разбором словарей и циклов — core skill инструментов для работы с биомедицинской информацией.

📌 Словари: биоинформатика в виде пар «ключ–значение»

Словарь — это структура данных, где каждому ключу соответствует значение. Это особенно удобно, когда данные не упорядочены, но имеют ярко выраженные идентификаторы.

Словарь с экспрессией генов:
gene_expression = {
'TP53': 3.4,
'BRCA1': 1.8,
'EGFR': 2.7
}

Здесь ключи — названия генов, а значения — их уровень экспрессии (например, log2(TPM+1)).

Когда это полезно?
Быстрый доступ к данным по уникальному идентификатору — например, по имени гена.
Работа с JSON-структурами (часто встречаются в аннотациях генов, результатах API).
Представление биомедицинских таблиц, где строки становятся словарями (например, записи пациента или профили экспрессии).

📌 Циклы: автоматизация анализа

Циклы позволяют выполнять повторяющиеся действия. Это основа для парсинга данных, агрегации результатов, фильтрации по условиям и т.д.

Выводим список интересующих генов:
genes = ['TP53', 'BRCA1', 'EGFR']
for gene in genes:
print(f"Ген: {gene}")


Можно не просто выводить, а сравнивать с контрольными значениями, фильтровать и обрабатывать:
threshold = 2.0
for gene, expr in gene_expression.items():
if expr > threshold:
print(f"{gene} сверхэкспрессирован: {expr}")


📌 Комбинируем словари и циклы: практические примеры

🔸 Пример 1: Анализ мутаций по пациентам
mutations = {
'patient_001': ['TP53', 'EGFR'],
'patient_002': ['BRCA1'],
'patient_003': []
}

for patient_id, mutated_genes in mutations.items():
print(f"{patient_id}: найдено {len(mutated_genes)} мутаций")


🔸 Пример 2: Сравнение экспрессии в норме и опухоли
normal_expr = {'TP53': 1.2, 'BRCA1': 2.1, 'EGFR': 1.9}
tumor_expr = {'TP53': 3.4, 'BRCA1': 1.8, 'EGFR': 2.7}

for gene in normal_expr:
change = tumor_expr[gene] - normal_expr[gene]
print(f"{gene}: изменение экспрессии = {change:+.2f}")


🔸 Пример 3: Агрегация статистики по опухолевым типам
tumor_samples = {
'glioblastoma': ['TP53', 'IDH1', 'EGFR'],
'breast_cancer': ['BRCA1', 'BRCA2', 'TP53'],
'lung_cancer': ['EGFR', 'KRAS']
}

gene_counts = {}
for cancer_type, genes in tumor_samples.items():
for gene in genes:
gene_counts[gene] = gene_counts.get(gene, 0) + 1

print("Гены, встречающиеся чаще всего:")
for gene, count in gene_counts.items():
if count > 1:
print(f"{gene}: {count} типов опухолей")


🔻 Почему владение словарями и циклами критично?

Конструкции for, dict, items, range, enumerate входят в топ-10 самых часто используемых в Python-коде.
Циклы и словари встречаются в более чем 90% Jupyter-ноутбуков, связанных с анализом биомедицинских данных (источники: Kaggle, OpenML, BioPython).
Любая современная библиотека (Pandas, PyTorch, BioPython, Scikit-learn) использует их под капотом или требует при работе с API.

✔️ Посмотреть, как используются словари и циклы в реальных проектах, можно тут и тут.

Попробуйте и вы!

#openbio_python #openbio_ml #openbio_education
Please open Telegram to view this post
VIEW IN TELEGRAM
2025/06/11 11:58:03
Back to Top
HTML Embed Code: