<?xml version='1.0' encoding='utf-8'?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.2 20190208//EN" "http://jats.nlm.nih.gov/publishing/1.2/JATS-journalpublishing1.dtd">
<article article-type="research-article" dtd-version="1.2" xml:lang="ru" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink"><front><journal-meta><journal-id journal-id-type="issn">2518-1092</journal-id><journal-title-group><journal-title>Научный результат. Информационные технологии</journal-title></journal-title-group><issn pub-type="epub">2518-1092</issn></journal-meta><article-meta><article-id pub-id-type="doi">10.18413/2518-1092-2026-11-1-0-9</article-id><article-id pub-id-type="publisher-id">4102</article-id><article-categories><subj-group subj-group-type="heading"><subject>КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ</subject></subj-group></article-categories><title-group><article-title>&lt;strong&gt;КЛАССИФИКАЦИЯ АНОМАЛИЙ В ДАННЫХ И ВЫБОР МЕТОДОВ ИХ ОБНАРУЖЕНИЯ&lt;/strong&gt;</article-title><trans-title-group xml:lang="en"><trans-title>&lt;strong&gt;DATA ANOMALY TAXONOMY AND METHOD SELECTION&lt;/strong&gt;</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author"><name-alternatives><name xml:lang="ru"><surname>Котов</surname><given-names>Дмитрий Васильевич</given-names></name><name xml:lang="en"><surname>Kotov</surname><given-names>Dmitry Vasilyevich</given-names></name></name-alternatives><email>kotovdv2101@outlook.com</email></contrib></contrib-group><pub-date pub-type="epub"><year>2026</year></pub-date><volume>11</volume><issue>1</issue><fpage>0</fpage><lpage>0</lpage><self-uri content-type="pdf" xlink:href="/media/information/2026/1/НР.ИТ_11.1_9.pdf" /><abstract xml:lang="ru"><p>Выявление аномалий стало базовой задачей анализа данных в условиях роста объёмов наблюдений, усложнения информационных систем и перехода к мониторингу в реальном времени. Аномальные события часто редки, но именно они связаны с наиболее значимыми рисками и эффектами: отказами оборудования, мошенничеством или кибератаками. Отклонение может быть абсолютным (выброс), условным (аномально только в конкретном контексте) или проявляться на уровне группы наблюдений. Ошибки в типизации аномалий приводят к неверному выбору алгоритма, некорректной настройке порогов и, как следствие, к ложным срабатываниям или пропускам редких событий. В работе систематизированы три базовых типа аномалий &amp;ndash; глобальные (точечные), контекстные и коллективные. Показано, как аномалии соотносятся с тремя ключевыми подходами к их детектированию: статистической, плотностно-дистанционной и модельной. Для каждого типа обсуждаются типичные алгоритмы (Z-score, IQR, Mahalanobis, kNN/LOF, Isolation Forest, кластеризация, модели временных рядов и последовательностей, автоэнкодеры, вариационные модели), а также требования к данным и вычислительным ресурсам. Предложена практическая схема выбора методов в зависимости от типа аномалии и модальности данных (табличные данные, временные ряды, потоки), приведены рекомендации по настройке порогов и по оценке качества на несбалансированных выборках (PR-AUC, MCC, событийные метрики). Классификация аномалий является необходимым этапом проектирования системы мониторинга; наилучшие результаты в прикладных задачах обычно достигаются каскадными и ансамблевыми решениями, сочетающими интерпретируемые базовые методы и гибкие модели машинного обучения.</p></abstract><trans-abstract xml:lang="en"><p>Anomaly detection has become a core component of modern data analysis due to the growth of data volumes, the increasing complexity of information systems, and the demand for real-time monitoring. Although anomalies are usually rare, they often correspond to high-impact events such as equipment failures, fraud, cyberattacks, and critical medical conditions. There is no universal notion of an anomaly: deviations can be absolute, context-dependent, or emergent at the level of groups and sequences. Misclassifying the anomaly type leads to inappropriate modeling assumptions, poorly calibrated thresholds, and a trade-off skewed toward false alarms or missed events. This paper reviews three major anomaly types - global (point), contextual, and collective &amp;ndash; and relates them to three detection paradigms: statistical tests, density/distance-based methods, and model-based approaches. For each type, we discuss representative algorithms (Z-score, IQR, Mahalanobis distance, kNN/LOF, Isolation Forest, clustering, time-series and sequence models, LSTM/autoencoders, and variational models), together with their data requirements and practical limitations. We provide a method-selection scheme aligned with data modality (tabular data, time series, streaming data), recommend threshold calibration strategies, and outline evaluation protocols for highly imbalanced settings (PR-AUC, MCC, event-based metrics). Correct anomaly typing is a prerequisite for effective monitoring; in applied scenarios, the most robust solutions are typically cascade and ensemble pipelines that combine interpretable baselines with flexible machine learning models.</p></trans-abstract><kwd-group xml:lang="ru"><kwd>аномалии данных</kwd><kwd>обнаружение аномалий</kwd><kwd>выбросы</kwd><kwd>контекст</kwd><kwd>временные ряды</kwd><kwd>автоэнкодер</kwd><kwd>Isolation Forest</kwd><kwd>LOF</kwd></kwd-group><kwd-group xml:lang="en"><kwd>data anomalies</kwd><kwd>anomaly detection</kwd><kwd>outliers</kwd><kwd>context</kwd><kwd>time series</kwd><kwd>autoencoder</kwd><kwd>Isolation Forest</kwd><kwd>LOF</kwd></kwd-group></article-meta></front><back><ref-list><title>Список литературы</title><ref id="B1"><mixed-citation>1.&amp;nbsp;Ларин Д.О. Информационные революции и их роль в развитии человечества / Д.О.&amp;nbsp;Ларин // Вестник Омского университета. &amp;ndash; 2025. &amp;ndash; Т. 30, № 1. &amp;ndash; С. 37-50. &amp;ndash; DOI 10.24147/1812-3996.2025.1.37-50. &amp;ndash; EDN GJVYOV.</mixed-citation></ref><ref id="B2"><mixed-citation>2.&amp;nbsp;Шкодырев В.П. Обзор методов обнаружения аномалий в потоках данных / В.П. Шкодырев, К.И.&amp;nbsp;Ягафаров, В.А. Баштовенко, Е.Э. Ильина // Труды Второй конференции по разработке программного обеспечения и информационному менеджменту (SEIM-2017). &amp;ndash;&amp;nbsp;СПб.: СПбГУТ, 2017. &amp;ndash; Т. 1864. &amp;ndash; С. 215-225.</mixed-citation></ref><ref id="B3"><mixed-citation>3.&amp;nbsp;Шоргин С.Я. Статистика и кластеры в поисках аномальных вкраплений в условиях больших данных&amp;nbsp;// Информатика и её применения. &amp;ndash; 2021. &amp;ndash; Т. 15, № 4. &amp;ndash; С. 142&amp;ndash;151. &amp;ndash; DOI: 10.15393/j12.art.2021.7987.</mixed-citation></ref><ref id="B4"><mixed-citation>4.&amp;nbsp;Андрианова Е.Г., Головин С.А., Зыков С.В., Лесько С.А., Чукалина Е.Р. Обзор современных моделей и методов анализа временных рядов динамики процессов в социальных, экономических и социотехнических системах // Российский технологический журнал. &amp;ndash; 2020. &amp;ndash; Т. 8, № 4. &amp;ndash; С. 7-45. &amp;ndash; DOI: 10.32362/2500-316X-2020-8-4-7-45.</mixed-citation></ref><ref id="B5"><mixed-citation>5.&amp;nbsp;Видищева Е.В., Копырин А.С., Василенко М.С. Анализ и уточнение классификации аномалий и выбросов на экономических данных // Вестник Алтайской академии экономики и права. &amp;ndash; 2019. &amp;ndash; № 6-1. &amp;ndash; С.&amp;nbsp;41&amp;ndash;46. &amp;ndash; URL: https://vaael.ru/ru/article/view?id=589 (дата обращения: 22.01.2026).</mixed-citation></ref><ref id="B6"><mixed-citation>6.&amp;nbsp;Андрианова Е.Г., Зыков С.В. и др. Обзор современных моделей и методов анализа временных рядов&amp;nbsp;// Российский технологический журнал. &amp;ndash; 2020. &amp;ndash; Т. 8, № 4. &amp;ndash; С. 7-45.</mixed-citation></ref><ref id="B7"><mixed-citation>7.&amp;nbsp;Бардасова И.А., Волкова Е.А. Обнаружение аномалий в электронных письмах с помощью машинного обучения // Вестник науки №5(74). &amp;ndash; Т. 4. &amp;ndash; С. 1350-1358. 2024 г. // URL: https://www.вестник-науки.рф/article/14991 (дата обращения: 22.01.2026 г.).</mixed-citation></ref><ref id="B8"><mixed-citation>8.&amp;nbsp;Михайлов А.Н. Обнаружение аномалий в сетевом трафике с использованием методов машинного обучения // Вестник науки №12(81). &amp;ndash; Т. 3. &amp;ndash; С. 1463-1466. 2024 г. // URL: https://www.вестник-науки.рф/article/19907 (дата обращения: 22.01.2026 г.).</mixed-citation></ref><ref id="B9"><mixed-citation>9.&amp;nbsp;Домашкин А.А. Применение двухэтапного метода кластеризации для обнаружения аномалий: тез. докл. / А.А. Домашкин // Международная конференция по компьютерным системам и технологиям (ICCSS-2024). &amp;ndash; М.: ИПУ, 2024. &amp;ndash; С. 112-120. &amp;ndash; URL: https://iccss2024.ipu.ru/proceedings/Домашкин.pdf (дата обращения: 22.01.2026).</mixed-citation></ref><ref id="B10"><mixed-citation>10.&amp;nbsp;Глухов К.А. Применение двухэтапного метода кластеризации / К.А. Глухов, А.А. Домашкин // Безопасные и информационные технологии. &amp;ndash; 2023. &amp;ndash; Т. 1, № 1. &amp;ndash; С. 1-10. &amp;ndash; URL: https://info-secur.ru/index.php/ojs/article/view/482 (дата обращения: 22.01.2026).</mixed-citation></ref><ref id="B11"><mixed-citation>11.&amp;nbsp;Краева Я.А. Нейросетевой метод обнаружения аномалий в многомерных потоковых временных рядах // Вестник СПбПУ. Сер. Радиотехника, телекоммуникации и средств вычислительной техники. &amp;ndash; 2024.&amp;nbsp;&amp;ndash; № 2. &amp;ndash; С. 45-58.</mixed-citation></ref><ref id="B12"><mixed-citation>12.&amp;nbsp;Гриценко А.В. Типы аномалий в видеоизображениях // Прикладная информатика. &amp;ndash; 2012. &amp;ndash; № 5.&amp;nbsp;&amp;ndash; С. 78-92.</mixed-citation></ref><ref id="B13"><mixed-citation>13.&amp;nbsp;Литвинович А.В., Смирнов С.В. Методы анализа многомерных данных в задачах обнаружения аномалий // Программные продукты и системы. &amp;ndash; 2022. &amp;ndash; Т. 135, № 3. &amp;ndash; С. 45-52.</mixed-citation></ref><ref id="B14"><mixed-citation>14.&amp;nbsp;Герасимов М.А., Петров И.В. Выявление аномалий в масштабных данных с применением Isolation Forest и автоэнкодера // Вестник СПбГУ. Серия 15. Вычислительная математика и информатика. &amp;ndash; 2024. &amp;ndash; Т.&amp;nbsp;20, № 1. &amp;ndash; С. 112-&amp;ndash;125.</mixed-citation></ref><ref id="B15"><mixed-citation>15.&amp;nbsp;Левшун Д.А., Попов Д.А., Козлов А.С. Обнаружение и объяснение аномалий в промышленных системах IoT на основе автоэнкодеров // Программные продукты и системы. &amp;ndash; 2023. &amp;ndash; Т. 141, № 4. &amp;ndash;</mixed-citation></ref><ref id="B16"><mixed-citation>С. 123-135.</mixed-citation></ref><ref id="B17"><mixed-citation>16.&amp;nbsp;Бутусов Д.Н. Численные методы анализа нестационарных сигналов в задачах обработки изображений: дис. канд. физ.-мат. наук: 05.12.04 / Бутусов Д.Н.; СПбГЭТУ &amp;laquo;ЛЭТИ&amp;raquo;. &amp;ndash; СПб., 2021. &amp;ndash; 150 с.</mixed-citation></ref><ref id="B18"><mixed-citation>17.&amp;nbsp;Носко В. П. Введение в регрессионный анализ временных рядов // [учебное пособие]. &amp;ndash; М.: ВШЭ, 2010. &amp;ndash; 120 с.</mixed-citation></ref><ref id="B19"><mixed-citation>18.&amp;nbsp;Брыкин Д.О. Исследование алгоритмов обработки временных рядов с учетом нестационарности: дис. канд. физ.-мат. наук: 05.13.18 / Брыкин Д.О.; МФТИ. &amp;ndash; М., 2023. &amp;ndash; 145 с.</mixed-citation></ref><ref id="B20"><mixed-citation>19.&amp;nbsp;Любушин А. А. Анализ данных систем геофизического и инженерного мониторинга. &amp;ndash; 3-е изд. &amp;ndash; М.: Наука, 2024. &amp;ndash; 320 с.</mixed-citation></ref></ref-list></back></article>