Telegram Group Search
Это самый заряженный на любовь к ML пост от OpenBio! ❤️

Мы подготовили для вас особенные валентинки — такие, от которых расчувствуется даже нейросеть. Делитесь ими с коллегами, друзьями и теми, чья любовь к ML глубже, чем многослойный перцептрон.

❤️ А ещё лучше — приходите вместе изучать ML на курсе «Машинное обучение в биологии и биомедицине»! Ведь разделять новые знания так же ценно, как и разделять важные моменты жизни.

#openbio_ML

До старта курса: 1️⃣ 1️⃣ дней

📌 Машинное обучение в биологии и биомедицине | OpenBio.Edu — подписывайтесь!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔭 Всем привет! Мы немного отдохнули после запуска курса, а теперь восстанавливаем активность и продолжаем делиться с вами новостями из мира ML в биологии и биомедицины ☺️

Сегодня подобрали небольшой дайджест событий в сфере биотеха и IT, на которых можно получить полезные знания, познакомиться со специалистами из академии и индустрии и прокачать свои навыки в ML.

1️⃣ 19 марта | Семинар по МЛ в геномике: «Как функциональная геномика может помочь при исследовании эволюции?»

Уже завтра пройдет семинар для тех, кто хочет глубже разобраться в применении машинного обучения в биоинформатике и понять, как его используют в современной генетике. Это возможность дополнительно встретиться со спикером курса «Машинное обучение в биологии и биомедицине» Артёмом Касьяновым! Он расскажет, как современные омиксные технологии — RNA-seq, ChIP-seq, Hi-C — помогают исследовать эволюционные процессы, а также представит подходы, позволяющие анализировать экспрессию генов и выявлять события положительного отбора в популяциях.

2️⃣ 4–24 апреля | Дни компьютерных наук ФКН НИУ ВШЭ

Фестиваль объединяет студентов, преподавателей, исследователей и всех, кто интересуется IT. В программе — лекции, дискуссии, квизы и кинопоказы. Для тех, кто только начинает изучать машинное обучение, особенно полезными будут тренинги по ML и прикладному программированию. Это хорошая возможность не только освоить новые технологии, но и пообщаться с экспертами и представителями IT-компаний.

3️⃣ 16–17 мая | ML-конференция: от обучения до эксплуатации моделей (IML Conf)

Конференция ориентирована на практическое применение машинного обучения в самых разных сферах, включая медицину и биотех. В программе — доклады и мастер-классы по NLP, Computer Vision, Big Data, MLOps и другим ключевым темам. Участники смогут узнать, как организуется полный цикл работы с ML-моделями: от обучения до внедрения в реальный продукт. Для тех, кто только начинает разбираться в этой области, это возможность услышать реальные кейсы и познакомиться с профессиональным сообществом.

4️⃣ 21–23 мая | Саммит разработчиков лекарственных препаратов «Сириус.Биотех»

Саммит посвящен ключевым технологическим платформам разработки лекарств и последним трендам в биофармацевтике. Ведущие эксперты отрасли расскажут о современных подходах к созданию и производству препаратов, а также о возможностях карьерного роста в этой области. Для студентов и молодых ученых это не только шанс получить актуальные знания, но и возможность наладить контакты с потенциальными работодателями и партнерами.

⤵️Прошедшее, но полезное⤵️

5️⃣ IX Всероссийская конференция по ИИ в здравоохранении («ИТМ ИИ»)

Конференция собрала специалистов, работающих с искусственным интеллектом в медицине. В докладах обсуждались реальные кейсы внедрения ML-моделей в клиническую практику в РФ, а также вопросы регулирования и оценки качества ИИ-систем.

Записи докладов с конференции можно найти в свободном доступе во Вконтакте или на сайте ИТМ (нужна регистрация) — если вам любопытно, как именно новые технологии используются для анализа медицинских данных в настоящей врачебной практике, это отличная возможность погрузиться в тему.

#openbio_news

📌 Машинное обучение в биологии и биомедицине | OpenBio.Edu — подписывайтесь!
Please open Telegram to view this post
VIEW IN TELEGRAM
Сегодня отмечается Всемирный день воды — событие, привлекающее внимание к проблемам экологии океанов и ледников. Современные технологии сбора данных, включая спутниковые наблюдения, акустические системы и генетический анализ, генерируют огромные массивы информации. Для их обработки используются машинное обучение и искусственный интеллект, которые стали важными инструментами в морской экологии.

➡️ Сегодня рассмотрим, как методы ML помогают анализировать информацию о физических процессах и биоразнообразии мирового океана.

🌊 Применение машинного обучения в морской экологии

🔷 Обработка изображений и видео с помощью сверточных нейросетей (CNNs) позволяет автоматически идентифицировать морские организмы, картировать донные экосистемы и обнаруживать пластиковый мусор. При этом сложность анализа данных возрастает из-за большого разнообразия объектов: для планктона важна точность детекции среди водной толщи, а для анализа бентоса — способность выделять организмы на сложном фоне морского дна.

🔷 Машинное обучение также автоматизирует анализ акустических данных. Поскольку звук проникает сквозь воду лучше, чем свет, он широко используется для подводных измерений. В глубоких нейросетях акустические сигналы часто преобразуются в спектрограммы и анализируются так же, как изображения.

🔷 В области экологической геномики ИИ помогает анализировать данные о ДНК, извлекаемой из морской воды, что позволяет отслеживать состав микробных сообществ. Генетическая информация охватывает целые экосистемы, а современные алгоритмы выявляют таксономические группы и сопоставляют их с географическим расположением, что открывает новые возможности для мониторинга биоразнообразия.

🔷 Спутниковые данные и эхосигналы, обработанные ML-моделями, используются для составления карт биогеографических зон, оценки состояния коралловых рифов и анализа донных осадков.

🔷 В рыболовстве машинное обучение помогает отслеживать популяции рыб и предсказывать их миграцию, сочетая экологические и экономические факторы в предсказательных моделях. Это важно и для отслеживания популяций рыб в природе, и для организации эффективного, но безопасного для экосистемы промышленного рыболовства.

🧊 Задачи гляциологии (науки о ледниках)

🔷 Картирование ледников сталкивается с трудностями из-за изменяющихся климатических условий и различий в данных, полученных с разных спутников. Однако ML-модели, комбинирующие многолетние разнородные данные, позволяют более точно анализировать эволюцию ледников.

🔷 Дифференциация льда и снега, а также моделирование динамики льдов пока находятся на ранней стадии развития в ИИ-исследованиях, но уже сейчас разработанные алгоритмы демонстрируют высокую точность.
Например, ученые Университета Лозанны создали модель глубокого обучения, которая позволила предсказывать толщину ледников с разрешением 300 метров, что в несколько раз превосходит точность предыдущих методов.

Машинное обучение радикально меняет морскую науку, позволяя анализировать огромные массивы данных. К сожалению, чем больше мы узнаем с помощью новых технологий, тем более тревожной становится картина. Анализ с использованием ИИ показывает, что состояние ледников и океанов ухудшается быстрее, чем предполагалось ранее. Человеческая деятельность ускоряет процессы, ранее считавшиеся стабильными. Новые инструменты не только дают нам беспрецедентные возможности оценить масштаб разрушений, но и требуют от нас решительных действий.

#openbio_ml #openbio_science

📌 Машинное обучение в биологии и биомедицине | OpenBio.Edu — подписывайтесь!
Please open Telegram to view this post
VIEW IN TELEGRAM
Методы ML.pdf
568 KB
Всем приятной и продуктивной пятницы! ↗️

Чтобы немного переключиться после насыщенной рабочей недели и одновременно занять ум чем-то полезным, предлагаем вам освежить знания о сфере машинного обучения. Мы подготовили наглядную схему, где собраны самые популярные методы, применяемые в биомедицинских исследованиях.
Схема может быть полезна и как шпаргалка, и как точка старта, если хочется углубиться в тему.

Сколько из них вы уже пробовали на практике? А если МЛ пока не ваш основной инструмент — какие из подходов зацепили или вдохновили?

#openbio_ml

📌 Машинное обучение в биологии и биомедицине | OpenBio.Edu — подписывайтесь!
Please open Telegram to view this post
VIEW IN TELEGRAM
Актуальная подборка вакансий в области биологии и биомедицины с компетенциями в ML:

🦠Биоинформатик (онкология) 
ФГБУ ЦСП ФМБА России в поисках биоинформатиков с опытом в биомедицинских проектах для анализа NGS-данных (геном, транскриптом, метилом) и разработки пайплайнов. Большим преимуществом будет знание ML, системной биологии и наличия дополнительного образования в онкологии/генетике. 

📊 Биостатистик (лаборатория разработки новых методов молекулярной диагностики заболеваний человека)
Центр постгеномных технологий ищет разработчика (биоинформатика/статистика) для анализа ДНК, обработки данных и написания статей с использованием методов ML.

🧬ML/DL Researcher для дизайна белков
Ищут мотивированного специалиста для разработки и применения алгоритмов (AlphaFold, Diffusion-модели и др.), интеграции биоданных, валидации in silico, с уверенным знание ML/DL (генеративные модели, GNN), с опытом работы с белковыми структурами (PDB, Biopython), Python/PyTorch/TensorFlow.

👨💻Руководитель разработки (Tech Lead)
Компания нуждается в руководителе, который будет вести команду разработчиков, проектировать архитектуру (SQL/NoSQL, AI-системы, компьютерное зрение), создавать аналитические сервисы для генетических данных, заниматься код-ревью и менторством.


#openbio_вакансии
📰 Возвращаемся с новостями!

Уже заканчивается второй поток курса «Машинное обучение в биологии и биомедицине», а мы готовим для вас насыщенное лето:
🔻 прямые эфиры с новыми "сеньорами" биоинформатиками
🔻 свежие тренды в биотехе и сфере AI
🔻 азы Python и ML для новичков и разборы ключевых терминов
🔻 раскрытие сложных тем в рубрике "вопрос-ответ" от наших экспертов
🔻 подборки вакансий и карьерные советы

Ну что, поехали! 🚀

#openbio_ml #openbio_education #биотех #машинноеобучение
Please open Telegram to view this post
VIEW IN TELEGRAM
Python для биомеда: словари и циклы — ключ к анализу данных

Продолжаем нашу рубрику «азы программирования» с разбором словарей и циклов — core skill инструментов для работы с биомедицинской информацией.

📌 Словари: биоинформатика в виде пар «ключ–значение»

Словарь — это структура данных, где каждому ключу соответствует значение. Это особенно удобно, когда данные не упорядочены, но имеют ярко выраженные идентификаторы.

Словарь с экспрессией генов:
gene_expression = {
'TP53': 3.4,
'BRCA1': 1.8,
'EGFR': 2.7
}

Здесь ключи — названия генов, а значения — их уровень экспрессии (например, log2(TPM+1)).

Когда это полезно?
Быстрый доступ к данным по уникальному идентификатору — например, по имени гена.
Работа с JSON-структурами (часто встречаются в аннотациях генов, результатах API).
Представление биомедицинских таблиц, где строки становятся словарями (например, записи пациента или профили экспрессии).

📌 Циклы: автоматизация анализа

Циклы позволяют выполнять повторяющиеся действия. Это основа для парсинга данных, агрегации результатов, фильтрации по условиям и т.д.

Выводим список интересующих генов:
genes = ['TP53', 'BRCA1', 'EGFR']
for gene in genes:
print(f"Ген: {gene}")


Можно не просто выводить, а сравнивать с контрольными значениями, фильтровать и обрабатывать:
threshold = 2.0
for gene, expr in gene_expression.items():
if expr > threshold:
print(f"{gene} сверхэкспрессирован: {expr}")


📌 Комбинируем словари и циклы: практические примеры

🔸 Пример 1: Анализ мутаций по пациентам
mutations = {
'patient_001': ['TP53', 'EGFR'],
'patient_002': ['BRCA1'],
'patient_003': []
}

for patient_id, mutated_genes in mutations.items():
print(f"{patient_id}: найдено {len(mutated_genes)} мутаций")


🔸 Пример 2: Сравнение экспрессии в норме и опухоли
normal_expr = {'TP53': 1.2, 'BRCA1': 2.1, 'EGFR': 1.9}
tumor_expr = {'TP53': 3.4, 'BRCA1': 1.8, 'EGFR': 2.7}

for gene in normal_expr:
change = tumor_expr[gene] - normal_expr[gene]
print(f"{gene}: изменение экспрессии = {change:+.2f}")


🔸 Пример 3: Агрегация статистики по опухолевым типам
tumor_samples = {
'glioblastoma': ['TP53', 'IDH1', 'EGFR'],
'breast_cancer': ['BRCA1', 'BRCA2', 'TP53'],
'lung_cancer': ['EGFR', 'KRAS']
}

gene_counts = {}
for cancer_type, genes in tumor_samples.items():
for gene in genes:
gene_counts[gene] = gene_counts.get(gene, 0) + 1

print("Гены, встречающиеся чаще всего:")
for gene, count in gene_counts.items():
if count > 1:
print(f"{gene}: {count} типов опухолей")


🔻 Почему владение словарями и циклами критично?

Конструкции for, dict, items, range, enumerate входят в топ-10 самых часто используемых в Python-коде.
Циклы и словари встречаются в более чем 90% Jupyter-ноутбуков, связанных с анализом биомедицинских данных (источники: Kaggle, OpenML, BioPython).
Любая современная библиотека (Pandas, PyTorch, BioPython, Scikit-learn) использует их под капотом или требует при работе с API.

✔️ Посмотреть, как используются словари и циклы в реальных проектах, можно тут и тут.

Попробуйте и вы!

#openbio_python #openbio_ml #openbio_education
Please open Telegram to view this post
VIEW IN TELEGRAM
Сегодня в центре внимания — цикл While! 🔁

Это один из самых простых и мощных инструментов для автоматизации повторяющихся задач. Он позволяет выполнять блок кода многократно, пока выполняется определённое условие.

📌 Если вы уже освоили базовую работу с библиотеками NumPy и pandas, научились читать и обрабатывать датасеты, группировать, и визуализировать векторные операции — самое время перейти к управлению потоком выполнения кода. Цикл while — фундаментальная конструкция, которая пригодится в любом проекте.

Например:
ридов_прочитано = 0 # Количество прочитанных фрагментов ДНК
цель_ридов = 1000 # Требуемое количество

while ридов_прочитано < цель_ридов:
print(f"Прочитано {ридов_прочитано} ридов. Ещё собираем...")
ридов_прочитано += 100 # Имитация чтения 100 ридов за шаг


Здесь while проверяет условие ридов прочитано < цель_ридов. Пока оно истинно, выполняется print(count) и увеличивается значение переменной ридов прочитано. Когда ридов прочитано достигнет 1000 или больше — цикл завершится.

📌 Структура цикла while в Python:
while условие:
Тело цикла

Условие — логическое выражение, которое проверяется перед каждой итерацией.
Двоеточие (:) сообщает Python, что далее — блок команд.
Тело цикла — команды с отступом, которые выполняются, пока условие истинно.

While — это цикл с предусловием: сначала проверяется условие, и только если оно истинно — выполняется тело цикла.

📌 Сравнение с оператором if и логические операции

Цикл while напоминает условный оператор if, но с повторением:
if выполняет код один раз, если условие истинно.
while выполняет код многократно, пока условие остаётся истинным.

Оба могут использовать логические операторы and, or, not:
белок_свернут = 0 # Уровень правильной свёртки белка (0-10)
токсичность = True # Моделируем, что белок токсичен на старте

while белок_свернут < 8 and токсичность:
print(f"Свёртка: {белок_свернут}. Белок пока токсичен.")
белок_свернут += 1 # Улучшаем свёртку
if белок_свернут >= 5:
токсичность = False # Допустим, после 5 уровня свёртки токсичность исчезает


Этот цикл будет продолжаться, пока уровень свёртки меньше 8 и белок остаётся токсичным. Когда белок_свернут станет 5, токсичность переключится в False и цикл завершится, даже если свёртка не достигла 8.

📌 Бесконечные циклы

Цикл while может стать бесконечным, если условие всегда истинно:
while True:
print("Ищем идеальную последовательность...")
# Здесь могла бы быть сложная функция анализа


Чтобы остановить такой цикл, используют break:
консенсус_найден = False # Флаг нахождения консенсуса

while True:
показатель_качества = float(input("Введите показатель качества сборки (0.0-1.0): "))
if показатель_качества > 0.95:
print("Отлично! Сборка соответствует стандарту:", показатель_качества)
break # Выходим из цикла, т.к. цель достигнута
else:
print("Качество сборки недостаточно. Попробуйте ещё раз.")

Этот код будет спрашивать показатель качества, пока пользователь не введёт корректное значение выше 0.95.

Всегда следите за условиями цикла и используйте break осознанно, бесконечные циклы могут «повесить» программу.

Цикл while — универсальный инструмент, которым пользуется почти каждый биоинформатик, особенно при парсинге данных, автоматизации рутинных задач и построении пайплайнов. Он позволяет создавать гибкие конструкции и управлять выполнением кода с максимальной точностью.

↗️ Освоив базовые принципы, вы сможете перейти к более сложным паттернам: вложенным циклам, контролю итераций через continue и else, созданию симуляций и генераторов.

🔭 While обязательно пригодится в ваших проектах — от простых до исследовательских. Главное — начать, практиковать и не бояться экспериментов.

#openbio_python #openbio_ml #openbio_education
Please open Telegram to view this post
VIEW IN TELEGRAM
2025/06/18 12:59:42
Back to Top
HTML Embed Code: