Please open Telegram to view this post
VIEW IN TELEGRAM
Это самый заряженный на любовь к ML пост от OpenBio! ❤️
Мы подготовили для вас особенные валентинки — такие, от которых расчувствуется даже нейросеть. Делитесь ими с коллегами, друзьями и теми, чья любовь к ML глубже, чем многослойный перцептрон.
❤️ А ещё лучше — приходите вместе изучать ML на курсе «Машинное обучение в биологии и биомедицине»! Ведь разделять новые знания так же ценно, как и разделять важные моменты жизни.
#openbio_ML
До старта курса:1️⃣ 1️⃣ дней
📌 Машинное обучение в биологии и биомедицине | OpenBio.Edu — подписывайтесь!
Мы подготовили для вас особенные валентинки — такие, от которых расчувствуется даже нейросеть. Делитесь ими с коллегами, друзьями и теми, чья любовь к ML глубже, чем многослойный перцептрон.
#openbio_ML
До старта курса:
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Сегодня подобрали небольшой дайджест событий в сфере биотеха и IT, на которых можно получить полезные знания, познакомиться со специалистами из академии и индустрии и прокачать свои навыки в ML.
Уже завтра пройдет семинар для тех, кто хочет глубже разобраться в применении машинного обучения в биоинформатике и понять, как его используют в современной генетике. Это возможность дополнительно встретиться со спикером курса «Машинное обучение в биологии и биомедицине» Артёмом Касьяновым! Он расскажет, как современные омиксные технологии — RNA-seq, ChIP-seq, Hi-C — помогают исследовать эволюционные процессы, а также представит подходы, позволяющие анализировать экспрессию генов и выявлять события положительного отбора в популяциях.
Фестиваль объединяет студентов, преподавателей, исследователей и всех, кто интересуется IT. В программе — лекции, дискуссии, квизы и кинопоказы. Для тех, кто только начинает изучать машинное обучение, особенно полезными будут тренинги по ML и прикладному программированию. Это хорошая возможность не только освоить новые технологии, но и пообщаться с экспертами и представителями IT-компаний.
Конференция ориентирована на практическое применение машинного обучения в самых разных сферах, включая медицину и биотех. В программе — доклады и мастер-классы по NLP, Computer Vision, Big Data, MLOps и другим ключевым темам. Участники смогут узнать, как организуется полный цикл работы с ML-моделями: от обучения до внедрения в реальный продукт. Для тех, кто только начинает разбираться в этой области, это возможность услышать реальные кейсы и познакомиться с профессиональным сообществом.
Саммит посвящен ключевым технологическим платформам разработки лекарств и последним трендам в биофармацевтике. Ведущие эксперты отрасли расскажут о современных подходах к созданию и производству препаратов, а также о возможностях карьерного роста в этой области. Для студентов и молодых ученых это не только шанс получить актуальные знания, но и возможность наладить контакты с потенциальными работодателями и партнерами.
Конференция собрала специалистов, работающих с искусственным интеллектом в медицине. В докладах обсуждались реальные кейсы внедрения ML-моделей в клиническую практику в РФ, а также вопросы регулирования и оценки качества ИИ-систем.
Записи докладов с конференции можно найти в свободном доступе во Вконтакте или на сайте ИТМ (нужна регистрация) — если вам любопытно, как именно новые технологии используются для анализа медицинских данных в настоящей врачебной практике, это отличная возможность погрузиться в тему.
#openbio_news
Please open Telegram to view this post
VIEW IN TELEGRAM
Сегодня отмечается Всемирный день воды — событие, привлекающее внимание к проблемам экологии океанов и ледников. Современные технологии сбора данных, включая спутниковые наблюдения, акустические системы и генетический анализ, генерируют огромные массивы информации. Для их обработки используются машинное обучение и искусственный интеллект, которые стали важными инструментами в морской экологии.
➡️ Сегодня рассмотрим, как методы ML помогают анализировать информацию о физических процессах и биоразнообразии мирового океана.
🌊 Применение машинного обучения в морской экологии
🔷 Обработка изображений и видео с помощью сверточных нейросетей (CNNs) позволяет автоматически идентифицировать морские организмы, картировать донные экосистемы и обнаруживать пластиковый мусор. При этом сложность анализа данных возрастает из-за большого разнообразия объектов: для планктона важна точность детекции среди водной толщи, а для анализа бентоса — способность выделять организмы на сложном фоне морского дна.
🔷 Машинное обучение также автоматизирует анализ акустических данных. Поскольку звук проникает сквозь воду лучше, чем свет, он широко используется для подводных измерений. В глубоких нейросетях акустические сигналы часто преобразуются в спектрограммы и анализируются так же, как изображения.
🔷 В области экологической геномики ИИ помогает анализировать данные о ДНК, извлекаемой из морской воды, что позволяет отслеживать состав микробных сообществ. Генетическая информация охватывает целые экосистемы, а современные алгоритмы выявляют таксономические группы и сопоставляют их с географическим расположением, что открывает новые возможности для мониторинга биоразнообразия.
🔷 Спутниковые данные и эхосигналы, обработанные ML-моделями, используются для составления карт биогеографических зон, оценки состояния коралловых рифов и анализа донных осадков.
🔷 В рыболовстве машинное обучение помогает отслеживать популяции рыб и предсказывать их миграцию, сочетая экологические и экономические факторы в предсказательных моделях. Это важно и для отслеживания популяций рыб в природе, и для организации эффективного, но безопасного для экосистемы промышленного рыболовства.
🧊 Задачи гляциологии (науки о ледниках)
🔷 Картирование ледников сталкивается с трудностями из-за изменяющихся климатических условий и различий в данных, полученных с разных спутников. Однако ML-модели, комбинирующие многолетние разнородные данные, позволяют более точно анализировать эволюцию ледников.
🔷 Дифференциация льда и снега, а также моделирование динамики льдов пока находятся на ранней стадии развития в ИИ-исследованиях, но уже сейчас разработанные алгоритмы демонстрируют высокую точность.
Например, ученые Университета Лозанны создали модель глубокого обучения, которая позволила предсказывать толщину ледников с разрешением 300 метров, что в несколько раз превосходит точность предыдущих методов.
Машинное обучение радикально меняет морскую науку, позволяя анализировать огромные массивы данных. К сожалению, чем больше мы узнаем с помощью новых технологий, тем более тревожной становится картина. Анализ с использованием ИИ показывает, что состояние ледников и океанов ухудшается быстрее, чем предполагалось ранее. Человеческая деятельность ускоряет процессы, ранее считавшиеся стабильными. Новые инструменты не только дают нам беспрецедентные возможности оценить масштаб разрушений, но и требуют от нас решительных действий.
#openbio_ml #openbio_science
📌 Машинное обучение в биологии и биомедицине | OpenBio.Edu — подписывайтесь!
🌊 Применение машинного обучения в морской экологии
🧊 Задачи гляциологии (науки о ледниках)
Например, ученые Университета Лозанны создали модель глубокого обучения, которая позволила предсказывать толщину ледников с разрешением 300 метров, что в несколько раз превосходит точность предыдущих методов.
Машинное обучение радикально меняет морскую науку, позволяя анализировать огромные массивы данных. К сожалению, чем больше мы узнаем с помощью новых технологий, тем более тревожной становится картина. Анализ с использованием ИИ показывает, что состояние ледников и океанов ухудшается быстрее, чем предполагалось ранее. Человеческая деятельность ускоряет процессы, ранее считавшиеся стабильными. Новые инструменты не только дают нам беспрецедентные возможности оценить масштаб разрушений, но и требуют от нас решительных действий.
#openbio_ml #openbio_science
Please open Telegram to view this post
VIEW IN TELEGRAM
Методы ML.pdf
568 KB
Всем приятной и продуктивной пятницы! ↗️
Чтобы немного переключиться после насыщенной рабочей недели и одновременно занять ум чем-то полезным, предлагаем вам освежить знания о сфере машинного обучения. Мы подготовили наглядную схему, где собраны самые популярные методы, применяемые в биомедицинских исследованиях.
Схема может быть полезна и как шпаргалка, и как точка старта, если хочется углубиться в тему.
Сколько из них вы уже пробовали на практике? А если МЛ пока не ваш основной инструмент — какие из подходов зацепили или вдохновили?
#openbio_ml
📌 Машинное обучение в биологии и биомедицине | OpenBio.Edu — подписывайтесь!
Чтобы немного переключиться после насыщенной рабочей недели и одновременно занять ум чем-то полезным, предлагаем вам освежить знания о сфере машинного обучения. Мы подготовили наглядную схему, где собраны самые популярные методы, применяемые в биомедицинских исследованиях.
Схема может быть полезна и как шпаргалка, и как точка старта, если хочется углубиться в тему.
Сколько из них вы уже пробовали на практике? А если МЛ пока не ваш основной инструмент — какие из подходов зацепили или вдохновили?
#openbio_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Актуальная подборка вакансий в области биологии и биомедицины с компетенциями в ML:
🦠Биоинформатик (онкология)
ФГБУ ЦСП ФМБА России в поисках биоинформатиков с опытом в биомедицинских проектах для анализа NGS-данных (геном, транскриптом, метилом) и разработки пайплайнов. Большим преимуществом будет знание ML, системной биологии и наличия дополнительного образования в онкологии/генетике.
📊 Биостатистик (лаборатория разработки новых методов молекулярной диагностики заболеваний человека)
Центр постгеномных технологий ищет разработчика (биоинформатика/статистика) для анализа ДНК, обработки данных и написания статей с использованием методов ML.
🧬ML/DL Researcher для дизайна белков
Ищут мотивированного специалиста для разработки и применения алгоритмов (AlphaFold, Diffusion-модели и др.), интеграции биоданных, валидации in silico, с уверенным знание ML/DL (генеративные модели, GNN), с опытом работы с белковыми структурами (PDB, Biopython), Python/PyTorch/TensorFlow.
👨💻Руководитель разработки (Tech Lead)
Компания нуждается в руководителе, который будет вести команду разработчиков, проектировать архитектуру (SQL/NoSQL, AI-системы, компьютерное зрение), создавать аналитические сервисы для генетических данных, заниматься код-ревью и менторством.
#openbio_вакансии
🦠Биоинформатик (онкология)
ФГБУ ЦСП ФМБА России в поисках биоинформатиков с опытом в биомедицинских проектах для анализа NGS-данных (геном, транскриптом, метилом) и разработки пайплайнов. Большим преимуществом будет знание ML, системной биологии и наличия дополнительного образования в онкологии/генетике.
📊 Биостатистик (лаборатория разработки новых методов молекулярной диагностики заболеваний человека)
Центр постгеномных технологий ищет разработчика (биоинформатика/статистика) для анализа ДНК, обработки данных и написания статей с использованием методов ML.
🧬ML/DL Researcher для дизайна белков
Ищут мотивированного специалиста для разработки и применения алгоритмов (AlphaFold, Diffusion-модели и др.), интеграции биоданных, валидации in silico, с уверенным знание ML/DL (генеративные модели, GNN), с опытом работы с белковыми структурами (PDB, Biopython), Python/PyTorch/TensorFlow.
👨💻Руководитель разработки (Tech Lead)
Компания нуждается в руководителе, который будет вести команду разработчиков, проектировать архитектуру (SQL/NoSQL, AI-системы, компьютерное зрение), создавать аналитические сервисы для генетических данных, заниматься код-ревью и менторством.
#openbio_вакансии
Уже заканчивается второй поток курса «Машинное обучение в биологии и биомедицине», а мы готовим для вас насыщенное лето:
Ну что, поехали! 🚀
#openbio_ml #openbio_education #биотех #машинноеобучение
Please open Telegram to view this post
VIEW IN TELEGRAM
Python для биомеда: словари и циклы — ключ к анализу данных
Продолжаем нашу рубрику «азы программирования» с разбором словарей и циклов — core skill инструментов для работы с биомедицинской информацией.
📌 Словари: биоинформатика в виде пар «ключ–значение»
Словарь — это структура данных, где каждому ключу соответствует значение. Это особенно удобно, когда данные не упорядочены, но имеют ярко выраженные идентификаторы.
Словарь с экспрессией генов:
Здесь ключи — названия генов, а значения — их уровень экспрессии (например, log2(TPM+1)).
Когда это полезно?
➖ Быстрый доступ к данным по уникальному идентификатору — например, по имени гена.
➖ Работа с JSON-структурами (часто встречаются в аннотациях генов, результатах API).
➖ Представление биомедицинских таблиц, где строки становятся словарями (например, записи пациента или профили экспрессии).
📌 Циклы: автоматизация анализа
Циклы позволяют выполнять повторяющиеся действия. Это основа для парсинга данных, агрегации результатов, фильтрации по условиям и т.д.
Выводим список интересующих генов:
Можно не просто выводить, а сравнивать с контрольными значениями, фильтровать и обрабатывать:
📌 Комбинируем словари и циклы: практические примеры
🔸 Пример 1: Анализ мутаций по пациентам
🔸 Пример 2: Сравнение экспрессии в норме и опухоли
🔸 Пример 3: Агрегация статистики по опухолевым типам
🔻 Почему владение словарями и циклами критично?
➕ Конструкции
➕ Циклы и словари встречаются в более чем 90% Jupyter-ноутбуков, связанных с анализом биомедицинских данных (источники: Kaggle, OpenML, BioPython).
➕ Любая современная библиотека (Pandas, PyTorch, BioPython, Scikit-learn) использует их под капотом или требует при работе с API.
✔️ Посмотреть, как используются словари и циклы в реальных проектах, можно тут и тут.
Попробуйте и вы!
#openbio_python #openbio_ml #openbio_education
Продолжаем нашу рубрику «азы программирования» с разбором словарей и циклов — core skill инструментов для работы с биомедицинской информацией.
Словарь — это структура данных, где каждому ключу соответствует значение. Это особенно удобно, когда данные не упорядочены, но имеют ярко выраженные идентификаторы.
Словарь с экспрессией генов:
gene_expression = {
'TP53': 3.4,
'BRCA1': 1.8,
'EGFR': 2.7
}
Здесь ключи — названия генов, а значения — их уровень экспрессии (например, log2(TPM+1)).
Когда это полезно?
Циклы позволяют выполнять повторяющиеся действия. Это основа для парсинга данных, агрегации результатов, фильтрации по условиям и т.д.
Выводим список интересующих генов:
genes = ['TP53', 'BRCA1', 'EGFR']
for gene in genes:
print(f"Ген: {gene}")
Можно не просто выводить, а сравнивать с контрольными значениями, фильтровать и обрабатывать:
threshold = 2.0
for gene, expr in gene_expression.items():
if expr > threshold:
print(f"{gene} сверхэкспрессирован: {expr}")
mutations = {
'patient_001': ['TP53', 'EGFR'],
'patient_002': ['BRCA1'],
'patient_003': []
}
for patient_id, mutated_genes in mutations.items():
print(f"{patient_id}: найдено {len(mutated_genes)} мутаций")
normal_expr = {'TP53': 1.2, 'BRCA1': 2.1, 'EGFR': 1.9}
tumor_expr = {'TP53': 3.4, 'BRCA1': 1.8, 'EGFR': 2.7}
for gene in normal_expr:
change = tumor_expr[gene] - normal_expr[gene]
print(f"{gene}: изменение экспрессии = {change:+.2f}")
tumor_samples = {
'glioblastoma': ['TP53', 'IDH1', 'EGFR'],
'breast_cancer': ['BRCA1', 'BRCA2', 'TP53'],
'lung_cancer': ['EGFR', 'KRAS']
}
gene_counts = {}
for cancer_type, genes in tumor_samples.items():
for gene in genes:
gene_counts[gene] = gene_counts.get(gene, 0) + 1
print("Гены, встречающиеся чаще всего:")
for gene, count in gene_counts.items():
if count > 1:
print(f"{gene}: {count} типов опухолей")
for, dict, items, range, enumerate
входят в топ-10 самых часто используемых в Python-коде.Попробуйте и вы!
#openbio_python #openbio_ml #openbio_education
Please open Telegram to view this post
VIEW IN TELEGRAM