Актуальные проблемы нефти и газа

УДК [303.6+303.7]:001.8

Boris N. Chigarev

DEMONSTRATION OF THE IMPORTANCE OF PREPROCESSING THE TEXT FIELDS OF BIBLIOMETRIC RECORDS TO IDENTIFY PROMISING RESEARCH TASKS: CASE STUDY OF SCOPUS DATA ON PETROLEUM RESERVOIR ENGINEERING

Abstract

Background. Nowadays, bibliometric analysis of data from abstract databases is often used to identify relevant research tasks in order to rationalize the use of financial and other resources. Objective. To demonstrate the importance of preprocessing the text fields of bibliometric records to build a network of co-occurrence of terms and the possibility of subsequent use of Scimago Graphica for detailed study of different slices of clustering results in order to identify relevant research topics. Materials and methods. A total of 8,051 records exported from Scopus and matching the filter: (LIMIT-TO (EXACTKEYWORD, “Petroleum Reservoir Engineering”)) for the last ten years were used. VOSviewer and Scimago Graphica programs have been applied for bibliometric analysis. Results. The study showed the relevance of using the filter “LIMIT-TO EXACTKEYWORD” in the query to Scopus; the expediency of disclosing abbreviations in the text fields of records and preliminary clarification of texts; the effectiveness of using filters in the program Scimago Graphica to build a network of conjugation of terms in order to identify promising research topics. Conclusions. The promising research topics identified by the analysis can be described by the following terms: 1) nanopores, shale oil, pore size, molecular; 2) nanoparticles and nanofluids; 3) methane hydrate, hydrate saturation, hydrate bearing sediments. It is observed that in some cases, terms occurring in the same cluster are not the best choice for querying to expand the collection of publications on a given topic. Therefore, a separate study is proposed for this purpose using Apriori class algorithms.

Keywords: terms co-occurrence, text preprocessing, abbreviations, promising research tasks, VOSviewer, Scimago Graphica

Б.Н. Чигарев

ДЕМОНСТРАЦИЯ ЗНАЧИМОСТИ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ ТЕКСТОВЫХ ПОЛЕЙ БИБЛИОМЕТРИЧЕСКИХ ЗАПИСЕЙ ДЛЯ ВЫЯВЛЕНИЯ ПЕРСПЕКТИВНЫХ ИССЛЕДОВАТЕЛЬСКИХ ЗАДАЧ НА ПРИМЕРЕ ДАННЫХ SCOPUS ПО PETROLEUM RESERVOIR ENGINEERING

Аннотация

Актуальность. В настоящее время библиометрический анализ данных из реферативных баз часто используется для выявления актуальных исследовательских задач с целью рационального использования финансовых и других ресурсов. Цель работы. Продемонстрировать важность предварительной обработки текстовых полей библиометрических записей для построения сети совместной встречаемости терминов и возможность последующего использования Scimago Graphica для детального изучения различных срезов результатов кластеризации с целью выявления актуальных тем исследований. Материалы и методы. Использована 8051 запись, экспортированная из Scopus и соответствующая фильтру: (LIMIT-TO (EXACTKEYWORD, “Petroleum Reservoir Engineering”)) за последние десять лет. Для библиометрического анализа применялись программы VOSviewer и Scimago Graphica. Результаты. Показана релевантность использования фильтра «LIMIT-TO EXACTKEYWORD» в запросе к Scopus; целесообразность раскрытия сокращений в текстовых полях записей и предварительного уточнения текстов; эффективность использования фильтров в программе Scimago Graphica для построения сети сопряжения терминов с целью выявления перспективных тем исследований. Выводы. Выявленные в результате анализа перспективные темы исследований могут быть описаны следующими терминами: 1) нанопоры, сланцевая нефть, размер пор, молекулярный; 2) наночастицы и нанофлюиды; 3) гидрат метана, гидратонасыщенность и гидратоносные отложения. Замечено, что в некоторых случаях термины, встречающиеся в одном кластере, не являются лучшим выбором для запроса с целью расширения коллекции публикаций по данной теме. Поэтому для этой цели предлагается отдельное исследование с использованием алгоритмов класса Apriori.

Ключевые слова: совместная встречаемость терминов, предварительная обработка текста, аббревиатуры, перспективные исследовательские задачи, VOSviewer, Scimago Graphica