Список литературы

2518-1092

Научный результат. Информационные технологии

2518-1092

10.18413/2518-1092-2024-9-4-0-3

3665

ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ И ПРИНЯТИЕ РЕШЕНИЙ

<strong>СРАВНЕНИЕ СТРУКТУРЫ, ЭФФЕКТИВНОСТИ И СКОРОСТИ РАБОТЫ ПОЛНОСВЯЗНЫХ, СВЕРТОЧНЫХ И РЕКУРРЕНТНЫХ НЕЙРОННЫХ СЕТЕЙ</strong>

<strong>COMPARISON OF THE STRUCTURE, EFFICIENCY, AND SPEED OF OPERATION OF FEEDFORWARD, CONVOLUTIONAL, AND RECURRENT NEURAL NETWORKS</strong>

Шапалин

Виталий Геннадиевич

Shapalin

Vitaliy Gennadiyevich

shapalinv@gmail.com

Николаенко

Денис Владимирович

Nikolayenko

Denis Vladimirovich

dv.nikolaenko@yandex.ru

2024

9400

Рассмотрение оптимальности работы различных архитектур нейронных сетей для различных задач является на данный момент актуальной темой для исследования. В данной статье была рассмотрена эффективность работы полносвязных, рекуррентных и сверточных нейронных сетей в контексте разработки простой модели для прогноза погоды. Были рассмотрены архитектуры и принципы работы полносвязных нейронных сетей, устройство одномерных и двумерных сверточных нейронных сетей, а также архитектуру, особенности, преимущества и недостатки рекуррентных нейронных сетей: простых рекуррентных нейронных сетей, сетей LSTM и GRU, а также их двунаправленные подвиды для каждого из трех вышеперечисленных видов. На основе имеющихся теоретических материалов были разработаны простые нейронные сети для сравнения эффективности той или иной архитектуры, где в качестве критерия выступают время обучения и величина ошибки, а в качестве данных для обучения: температура, скорость ветра и атмосферное давление. Были рассмотрены скорость обучения, минимальное и среднее значение ошибки для полносвязной нейронной сети, сверточной нейронной сети, простой рекуррентной сети, LSTM и GRU, а также для двунаправленных рекуррентных нейронных сетей. На основе полученных результатов был проведен анализ возможных причин эффективности той или иной архитектур. На основе полученных данных были построены графики зависимости скорости работы от величины ошибки для трех исследуемых наборов данных: температуры, скорости ветра и атмосферного давления, а также сделаны выводы об эффективности определенной модели в контексте прогноза временных рядов метеорологических данных. Полученные результаты планируется использовать в дальнейших работах со смежными темами, либо развивать данную тему.

This article examines the efficiency of fully connected, recurrent, and convolutional neural networks in the context of developing a simple model for weather forecasting. The architectures and working principles of fully connected neural networks, the structure of one-dimensional and two-dimensional convolutional neural networks, as well as the architecture, features, advantages, and disadvantages of recurrent neural networks—specifically, simple recurrent neural networks, LSTM, and GRU, along with their bidirectional variants for each of the three aforementioned types—are discussed. Based on the available theoretical materials, simple neural networks were developed to compare the efficiency of each architecture, with training time and error magnitude serving as criteria, and temperature, wind speed, and atmospheric pressure as training data. The training speed, minimum and average error values for the fully connected neural network, convolutional neural network, simple recurrent network, LSTM, and GRU, as well as for bidirectional recurrent neural networks, were examined. Based on the results obtained, an analysis was conducted to explore the possible reasons for the effectiveness of each architecture. Graphs were plotted to show the relationship between processing speed and error magnitude for the three datasets examined: temperature, wind speed, and atmospheric pressure. Conclusions were drawn about the efficiency of specific models in the context of forecasting time series of meteorological data.

LSTMGRUдвунаправленные рекуррентные нейронные сетисверточные нейронные сетиkeras

LSTMGRUbidirectional recurrent neural networksconvolutional neural networks kerastensorflow

Список литературы

Рындин А.А., Ульев В.П., Исследование скорости обучения нейронных сетей [Электронный ресурс]. URL: https://cyberleninka.ru/article/n/issledovanie-skorosti-obucheniya-neyronnyh-setey (Дата обращения: 12.10.2024)

Быков Ф.Л., Царалов Н.Д., Современные практики применения машинного обучения в задаче прогноза погоды [Электронный ресурс]. URL: https://cyberleninka.ru/article/n/sovremennye-praktiki-primeneniya-mashinnogo-obucheniya-v-zadache-prognoza-pogody (Дата обращения: 13.10.2024)

Логином вики: многослойный персептрон [Электронный ресурс]. URL: https://wiki.loginom.ru/articles/multilayered-perceptron.html (Дата обращения: 03.07.2024)

Murat H. Sazli, A brief review of feed-forward neural networks [Электронный ресурс]. URL: https://www.researchgate.net/publication/228394623_A_brief_review_of_feed-forward_neural_networks (Дата обращения: 03.07.2024)

Полносвязные слои нейронных сетей в машинном обучении [Электронный ресурс]. URL: https://habr.com/ru/articles/718044/ (Дата обращения: 03.07.2024)

Горбачевская Е.Н., Классификация нейронных сетей [Электронный ресурс]. URL: https://cyberleninka.ru/article/n/klassifikatsiya-neyronnyh-setey/viewer (Дата обращения: 03.07.2024)

Kaggle weather dataset [Электронный ресурс]. URL: https://www.kaggle.com/datasets/muthuj7/weather-dataset/data (Дата обращения: 08.07.2024)

Shapalin Vitaliy: «Forecast» github repository [Электронный ресурс]. URL: https://github.com/ShapalinVitaliy/Forecast (Дата обращения: 09.07.2024)

Keras official website [Электронный ресурс]. URL: https://keras.io/ (Дата обращения: 10.07.2024)

Simon J. D. Prince Understanding deep learning. MIT press, udlbook.com, 2023. 161 с.

Хабр, «Свертка» [Электронный ресурс]. URL: https://habr.com/ru/articles/795223/ (Дата обращения: 05.08.2024)

Д.А. Маршалко, О.В. Кубанский, архитектура сверточных нейронных сетей [Электронный ресурс]. URL: https://cyberleninka.ru/article/n/arhitektura-svyortochnyh-neyronnyh-setey/viewer (Дата обращения: 05.08.2024)

1D convolutional neural networks and applications: A survey [Электронный ресурс]. URL: https://www.sciencedirect.com/science/article/pii/S0888327020307846 (Дата обращения: 06.08.2024)

Conceptual Understanding of Convolutional Neural Network- A Deep Learning Approach [Электронный ресурс]. URL: https://www.sciencedirect.com/science/article/pii/S1877050918308019 (06.08.2024)

I. Goodfellow, I. Bengio, A. Courville Deep learning. MIT press, Deeplearningbook.org, 2023. 373 с.

RNN, LSTM, GRU и другие рекуррентные нейронные сети [Электронный ресурс]. URL: http://vbystricky.ru/2021/05/rnn_lstm_gru_etc.html (Дата обращения: 12.07.2024)

Robin M. Schmidt, Recurrent Neural Networks (RNNs): A gentle Introduction and Overview [Электронный ресурс]. URL: https://arxiv.org/abs/1912.05911 (Дата обращения: 13.07.2024)

Recurrent Neural Networks (RNN) - The Vanishing Gradient Problem [Электронный ресурс]. URL: https://www.superdatascience.com/blogs/recurrent-neural-networks-rnn-the-vanishing-gradient-problem (Дата обращения: 13.07.2024)

Paul Werbos, Backpropagation through time: what it does and how to do it [Электронный ресурс]. URL: https://www.researchgate.net/publication/2984354_Backpropagation_through_time_what_it_does_and_how_to_do_it (Дата обращения: 12.07.2024)

LSTM — нейронная сеть с долгой краткосрочной памятью [Электронный ресурс]. URL: https://neurohive.io/ru/osnovy-data-science/lstm-nejronnaja-set/ (Дата обращения: 29.07.2024)

A survey on long short-term memory networks for time series prediction [Электронный ресурс]. URL: https://www.sciencedirect.com/science/article/pii/S2212827121003796 (Дата обращения: 30.07.2024)

Рекуррентные блоки GRU. Пример их реализации в задаче сентимент-анализа [Электронный ресурс]. URL: https://proproprogs.ru/neural_network/rekurrentnye-bloki-gru-primer-realizacii-v-zadache-sentiment-analiza (Дата обращения: 30.07.2024)

Двунаправленные (bidirectional) рекуррентные нейронные сети [Электронный ресурс]. URL: https://proproprogs.ru/neural_network/bidirectional-rekurrentnye-neyronnye-seti (Дата обращения: 30.07.2024)

Mike Schuste, Kuldip K. Paliwal Bidirectional Recurrent Neural Networks [Электронный ресурс]. URL: https://deeplearning.cs.cmu.edu/S24/document/readings/Bidirectional%20Recurrent%20Neural%20Networks.pdf (Дата обращения: 30.07.2024)