Актуальные проблемы нефти и газа

УДК [303.6+303.7]:001.8

Б.Н. Чигарев

ВЫЯВЛЕНИЕ АКТУАЛЬНЫХ ТЕМ ИССЛЕДОВАНИЙ ПО ВОПРОСАМ ЭНЕРГЕТИЧЕСКОЙ ПОЛИТИКИ И БЕЗОПАСНОСТИ В ПУБЛИКАЦИЯХ ИЗДАТЕЛЬСТВ ELSEVIER И MDPI ЗА 2021–2023 ГГ. ЧАСТЬ 2. КЛАСТЕРИЗАЦИЯ ПУБЛИКАЦИЙ. АВТОМАТИЧЕСКОЕ ЭКСТРАКТИВНОЕ ИЗВЛЕКАЮЩЕЕ РЕФЕРИРОВАНИЕ

Аннотация

Данная статья посвящена выявлению актуальных тем исследований в публикациях за 2021–2023 гг. издательств Elsevier и MDPI по вопросам энергетической политики и безопасности на основе кластеризации публикаций.

Показано, что именные группы, извлеченные из заголовков и аннотаций, могут быть использованы для кластеризации публикаций, позволяющей определить актуальные темы исследований. Извлечение именных групп осуществлялось с использованием программного пакета Sifaka. Строилась таблица из 5000 наиболее часто встречаемых именных групп, термины которых оставлялись в текстах заголовков и аннотаций, остальные термины удалялись. Подготовленные таким образом тексты использовались в процессе кластеризации библиометрических записей с использованием демоверсии программы Carrot2 и алгоритма Lingo3G. Тексты аннотаций для каждого кластера подвергались автоматическому экстрактивному реферированию с использованием программы sumy с алгоритмом Text-rank и списка стоп-слов stopwords-en-ISO.txt. Продемонстрирована возможность использования технологии экстрактивного реферирования для описания доминирующей тематики отдельных кластеров публикаций.

Приведен список доминирующих тематик в публикациях по вопросам энергетической политики и безопасности в публикациях издательств Elsevier и MDPI за 2021–2023 гг.

Ключевые слова: энергетическая политика, темы исследований, библиометрический анализ, Sifaka, Carrot2, кластеризация публикаций, экстрактивное реферирование.

B.N. Chigarev

IDENTIFICATION OF ACTUAL ENERGY POLICY AND SECURITY RESEARCH TOPICS IN ELSEVIER AND MDPI PUBLICATIONS FOR 2021–2023. Part 2. CLUSTERING OF PUBLICATIONS. AUTOMATIC EXTRACTIVE REFERENCING

Abstract

This article focuses on identifying relevant research topics in Elsevier and MDPI publications 2021–2023 on energy policy and security based on publication clustering.

It is shown that name groups extracted from titles and abstracts can be used to cluster publications to identify relevant research topics. The extraction of noun phrases was carried out using the Sifaka software package. A table of the 5,000 most frequent name groups was constructed, the terms of which were retained in the title and abstract texts, and the remaining terms were deleted. The prepared texts were used to cluster the bibliometric records using a demo version of Carrot2 and the Lingo3G algorithm. The annotation texts for each cluster were subjected to automatic extractive referencing using the sumy program with the Text-rank algorithm and the stopwords-en-ISO.txt list. The possibility of using extractive referencing technology to describe the dominant topic of individual publication clusters is demonstrated.

A list of dominant themes in energy policy and security publications in Elsevier and MDPI publications for 2021–2023 is given.

Keywords: energy policy, research topics, bibliometric analysis, Sifaka, Carrot2, publication clustering, extractive referencing.

  DOI 10.29222/ipng.2078-5712.2023-41.art6

 

Полный текст статьи в формате PDF