КЛАССИФИКАЦИЯ АНОМАЛИЙ В ДАННЫХ И ВЫБОР МЕТОДОВ ИХ ОБНАРУЖЕНИЯ
Выявление аномалий стало базовой задачей анализа данных в условиях роста объёмов наблюдений, усложнения информационных систем и перехода к мониторингу в реальном времени. Аномальные события часто редки, но именно они связаны с наиболее значимыми рисками и эффектами: отказами оборудования, мошенничеством или кибератаками. Отклонение может быть абсолютным (выброс), условным (аномально только в конкретном контексте) или проявляться на уровне группы наблюдений. Ошибки в типизации аномалий приводят к неверному выбору алгоритма, некорректной настройке порогов и, как следствие, к ложным срабатываниям или пропускам редких событий. В работе систематизированы три базовых типа аномалий – глобальные (точечные), контекстные и коллективные. Показано, как аномалии соотносятся с тремя ключевыми подходами к их детектированию: статистической, плотностно-дистанционной и модельной. Для каждого типа обсуждаются типичные алгоритмы (Z-score, IQR, Mahalanobis, kNN/LOF, Isolation Forest, кластеризация, модели временных рядов и последовательностей, автоэнкодеры, вариационные модели), а также требования к данным и вычислительным ресурсам. Предложена практическая схема выбора методов в зависимости от типа аномалии и модальности данных (табличные данные, временные ряды, потоки), приведены рекомендации по настройке порогов и по оценке качества на несбалансированных выборках (PR-AUC, MCC, событийные метрики). Классификация аномалий является необходимым этапом проектирования системы мониторинга; наилучшие результаты в прикладных задачах обычно достигаются каскадными и ансамблевыми решениями, сочетающими интерпретируемые базовые методы и гибкие модели машинного обучения.
Котов Д.В. Классификация аномалий в данных и выбор методов их обнаружения // Научный результат. Информационные технологии. – Т.11, №1, 2026. – С. 84-94. DOI: 10.18413/2518-1092-2026-11-1-0-8
















Пока никто не оставил комментариев к этой публикации.
Вы можете быть первым.
1. Ларин Д.О. Информационные революции и их роль в развитии человечества / Д.О. Ларин // Вестник Омского университета. – 2025. – Т. 30, № 1. – С. 37-50. – DOI 10.24147/1812-3996.2025.1.37-50. – EDN GJVYOV.
2. Шкодырев В.П. Обзор методов обнаружения аномалий в потоках данных / В.П. Шкодырев, К.И. Ягафаров, В.А. Баштовенко, Е.Э. Ильина // Труды Второй конференции по разработке программного обеспечения и информационному менеджменту (SEIM-2017). – СПб.: СПбГУТ, 2017. – Т. 1864. – С. 215-225.
3. Шоргин С.Я. Статистика и кластеры в поисках аномальных вкраплений в условиях больших данных // Информатика и её применения. – 2021. – Т. 15, № 4. – С. 142–151. – DOI: 10.15393/j12.art.2021.7987.
4. Андрианова Е.Г., Головин С.А., Зыков С.В., Лесько С.А., Чукалина Е.Р. Обзор современных моделей и методов анализа временных рядов динамики процессов в социальных, экономических и социотехнических системах // Российский технологический журнал. – 2020. – Т. 8, № 4. – С. 7-45. – DOI: 10.32362/2500-316X-2020-8-4-7-45.
5. Видищева Е.В., Копырин А.С., Василенко М.С. Анализ и уточнение классификации аномалий и выбросов на экономических данных // Вестник Алтайской академии экономики и права. – 2019. – № 6-1. – С. 41–46. – URL: https://vaael.ru/ru/article/view?id=589 (дата обращения: 22.01.2026).
6. Андрианова Е.Г., Зыков С.В. и др. Обзор современных моделей и методов анализа временных рядов // Российский технологический журнал. – 2020. – Т. 8, № 4. – С. 7-45.
7. Бардасова И.А., Волкова Е.А. Обнаружение аномалий в электронных письмах с помощью машинного обучения // Вестник науки №5(74). – Т. 4. – С. 1350-1358. 2024 г. // URL: https://www.вестник-науки.рф/article/14991 (дата обращения: 22.01.2026 г.).
8. Михайлов А.Н. Обнаружение аномалий в сетевом трафике с использованием методов машинного обучения // Вестник науки №12(81). – Т. 3. – С. 1463-1466. 2024 г. // URL: https://www.вестник-науки.рф/article/19907 (дата обращения: 22.01.2026 г.).
9. Домашкин А.А. Применение двухэтапного метода кластеризации для обнаружения аномалий: тез. докл. / А.А. Домашкин // Международная конференция по компьютерным системам и технологиям (ICCSS-2024). – М.: ИПУ, 2024. – С. 112-120. – URL: https://iccss2024.ipu.ru/proceedings/Домашкин.pdf (дата обращения: 22.01.2026).
10. Глухов К.А. Применение двухэтапного метода кластеризации / К.А. Глухов, А.А. Домашкин // Безопасные и информационные технологии. – 2023. – Т. 1, № 1. – С. 1-10. – URL: https://info-secur.ru/index.php/ojs/article/view/482 (дата обращения: 22.01.2026).
11. Краева Я.А. Нейросетевой метод обнаружения аномалий в многомерных потоковых временных рядах // Вестник СПбПУ. Сер. Радиотехника, телекоммуникации и средств вычислительной техники. – 2024. – № 2. – С. 45-58.
12. Гриценко А.В. Типы аномалий в видеоизображениях // Прикладная информатика. – 2012. – № 5. – С. 78-92.
13. Литвинович А.В., Смирнов С.В. Методы анализа многомерных данных в задачах обнаружения аномалий // Программные продукты и системы. – 2022. – Т. 135, № 3. – С. 45-52.
14. Герасимов М.А., Петров И.В. Выявление аномалий в масштабных данных с применением Isolation Forest и автоэнкодера // Вестник СПбГУ. Серия 15. Вычислительная математика и информатика. – 2024. – Т. 20, № 1. – С. 112-–125.
15. Левшун Д.А., Попов Д.А., Козлов А.С. Обнаружение и объяснение аномалий в промышленных системах IoT на основе автоэнкодеров // Программные продукты и системы. – 2023. – Т. 141, № 4. – С. 123-135.
16. Бутусов Д.Н. Численные методы анализа нестационарных сигналов в задачах обработки изображений: дис. канд. физ.-мат. наук: 05.12.04 / Бутусов Д.Н.; СПбГЭТУ «ЛЭТИ». – СПб., 2021. – 150 с.
17. Носко В. П. Введение в регрессионный анализ временных рядов // [учебное пособие]. – М.: ВШЭ, 2010. – 120 с.
18. Брыкин Д.О. Исследование алгоритмов обработки временных рядов с учетом нестационарности: дис. канд. физ.-мат. наук: 05.13.18 / Брыкин Д.О.; МФТИ. – М., 2023. – 145 с.
19. Любушин А. А. Анализ данных систем геофизического и инженерного мониторинга. – 3-е изд. – М.: Наука, 2024. – 320 с.