Telegram Group & Telegram Channel
Автоматизация научных обзоров с помощью больших языковых моделей: систематический обзор

Большие языковые модели (LLM) недавно стали одним из самых мощных инструментов обработки естественного языка (NLP) для решения различных задач. В этом систематическом обзоре мы стремились оценить естественное расширение использования LLM для управления и направления процесса обзора.

Методы

Исследование проводилось в июне 2024 года в базах данных PubMed, Scopus, Dimensions и Google Scholar. В обзор были включены только англоязычные публикации, посвященные использованию LLM для автоматизации различных этапов систематического обзора.

Скрининг и извлечение данных проводились в Covidence с помощью разработанного командой плагина LLM для Covidence. Этот плагин использует модель OpenAI gpt-4o и автоматизирует действия в Covidence, такие как нажатие кнопок «Включить/Исключить» или оставление заметок.

Результаты

В общей сложности было найдено 3788 статей, из которых 172 были признаны подходящими для окончательного обзора. ChatGPT и LLM на основе GPT стали наиболее распространенной архитектурой для автоматизации обзора (n=126, 73,2%). Значительное количество проектов по автоматизации обзора было найдено, но лишь ограниченное число статей (n=26, 15,1%) представляли собой фактические обзоры, в которых LLM использовались при их создании.

Большинство статей были сосредоточены на автоматизации определенного этапа обзора, например, на поиске публикаций (n=60, 34,9%) и извлечении данных (n=54, 31,4%). При сравнении совокупной производительности моделей на основе GPT и BERT первые показали лучшие результаты в извлечении данных со средней точностью 83,0% (SD=10,4) и полнотой 86,0% (SD=9,8), в то время как вторые были немного менее точными на этапе скрининга заголовков и рефератов (Maccuracy=77,3%, SD=13,0 против Maccuracy=80,9% SD=11,8).

Примеры использования LLM

- Поиск публикаций: LLM могут использоваться для автоматического поиска релевантных публикаций в базах данных, таких как PubMed, Scopus и Web of Science.

- Скрининг заголовков и рефератов: LLM могут использоваться для автоматического скрининга заголовков и рефератов на предмет релевантности, что позволяет рецензентам сосредоточиться на полнотекстовом скрининге.

- Извлечение данных: LLM могут использоваться для автоматического извлечения данных из полнотекстовых статей, таких как характеристики участников, вмешательства и результаты.

- Синтез данных: LLM могут использоваться для автоматического синтеза данных из нескольких статей, что позволяет рецензентам получить более полное представление о состоянии исследований.

Ограничения

- Точность: Хотя LLM достигли значительных успехов в точности, они все еще могут допускать ошибки, особенно при извлечении данных из сложных или неоднозначных текстов.

- Предвзятость: LLM могут быть подвержены предвзятости, основанной на данных, на которых они были обучены.

- Этика: Использование LLM в автоматизации обзора поднимает этические вопросы, такие как прозрачность, подотчетность и потенциальное смещение.



group-telegram.com/selfmadeLibrary/722
Create:
Last Update:

Автоматизация научных обзоров с помощью больших языковых моделей: систематический обзор

Большие языковые модели (LLM) недавно стали одним из самых мощных инструментов обработки естественного языка (NLP) для решения различных задач. В этом систематическом обзоре мы стремились оценить естественное расширение использования LLM для управления и направления процесса обзора.

Методы

Исследование проводилось в июне 2024 года в базах данных PubMed, Scopus, Dimensions и Google Scholar. В обзор были включены только англоязычные публикации, посвященные использованию LLM для автоматизации различных этапов систематического обзора.

Скрининг и извлечение данных проводились в Covidence с помощью разработанного командой плагина LLM для Covidence. Этот плагин использует модель OpenAI gpt-4o и автоматизирует действия в Covidence, такие как нажатие кнопок «Включить/Исключить» или оставление заметок.

Результаты

В общей сложности было найдено 3788 статей, из которых 172 были признаны подходящими для окончательного обзора. ChatGPT и LLM на основе GPT стали наиболее распространенной архитектурой для автоматизации обзора (n=126, 73,2%). Значительное количество проектов по автоматизации обзора было найдено, но лишь ограниченное число статей (n=26, 15,1%) представляли собой фактические обзоры, в которых LLM использовались при их создании.

Большинство статей были сосредоточены на автоматизации определенного этапа обзора, например, на поиске публикаций (n=60, 34,9%) и извлечении данных (n=54, 31,4%). При сравнении совокупной производительности моделей на основе GPT и BERT первые показали лучшие результаты в извлечении данных со средней точностью 83,0% (SD=10,4) и полнотой 86,0% (SD=9,8), в то время как вторые были немного менее точными на этапе скрининга заголовков и рефератов (Maccuracy=77,3%, SD=13,0 против Maccuracy=80,9% SD=11,8).

Примеры использования LLM

- Поиск публикаций: LLM могут использоваться для автоматического поиска релевантных публикаций в базах данных, таких как PubMed, Scopus и Web of Science.

- Скрининг заголовков и рефератов: LLM могут использоваться для автоматического скрининга заголовков и рефератов на предмет релевантности, что позволяет рецензентам сосредоточиться на полнотекстовом скрининге.

- Извлечение данных: LLM могут использоваться для автоматического извлечения данных из полнотекстовых статей, таких как характеристики участников, вмешательства и результаты.

- Синтез данных: LLM могут использоваться для автоматического синтеза данных из нескольких статей, что позволяет рецензентам получить более полное представление о состоянии исследований.

Ограничения

- Точность: Хотя LLM достигли значительных успехов в точности, они все еще могут допускать ошибки, особенно при извлечении данных из сложных или неоднозначных текстов.

- Предвзятость: LLM могут быть подвержены предвзятости, основанной на данных, на которых они были обучены.

- Этика: Использование LLM в автоматизации обзора поднимает этические вопросы, такие как прозрачность, подотчетность и потенциальное смещение.

BY какая-то библиотека




Share with your friend now:
group-telegram.com/selfmadeLibrary/722

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

You may recall that, back when Facebook started changing WhatsApp’s terms of service, a number of news outlets reported on, and even recommended, switching to Telegram. Pavel Durov even said that users should delete WhatsApp “unless you are cool with all of your photos and messages becoming public one day.” But Telegram can’t be described as a more-secure version of WhatsApp. Pavel Durov, a billionaire who embraces an all-black wardrobe and is often compared to the character Neo from "the Matrix," funds Telegram through his personal wealth and debt financing. And despite being one of the world's most popular tech companies, Telegram reportedly has only about 30 employees who defer to Durov for most major decisions about the platform. "This time we received the coordinates of enemy vehicles marked 'V' in Kyiv region," it added. He said that since his platform does not have the capacity to check all channels, it may restrict some in Russia and Ukraine "for the duration of the conflict," but then reversed course hours later after many users complained that Telegram was an important source of information. The news also helped traders look past another report showing decades-high inflation and shake off some of the volatility from recent sessions. The Bureau of Labor Statistics' February Consumer Price Index (CPI) this week showed another surge in prices even before Russia escalated its attacks in Ukraine. The headline CPI — soaring 7.9% over last year — underscored the sticky inflationary pressures reverberating across the U.S. economy, with everything from groceries to rents and airline fares getting more expensive for everyday consumers.
from us


Telegram какая-то библиотека
FROM American