DOI: 10.18413/2518-1092-2026-11-1-0-8

КЛАССИФИКАЦИЯ АНОМАЛИЙ В ДАННЫХ И ВЫБОР МЕТОДОВ ИХ ОБНАРУЖЕНИЯ

Выявление аномалий стало базовой задачей анализа данных в условиях роста объёмов наблюдений, усложнения информационных систем и перехода к мониторингу в реальном времени. Аномальные события часто редки, но именно они связаны с наиболее значимыми рисками и эффектами: отказами оборудования, мошенничеством или кибератаками. Отклонение может быть абсолютным (выброс), условным (аномально только в конкретном контексте) или проявляться на уровне группы наблюдений. Ошибки в типизации аномалий приводят к неверному выбору алгоритма, некорректной настройке порогов и, как следствие, к ложным срабатываниям или пропускам редких событий. В работе систематизированы три базовых типа аномалий – глобальные (точечные), контекстные и коллективные. Показано, как аномалии соотносятся с тремя ключевыми подходами к их детектированию: статистической, плотностно-дистанционной и модельной. Для каждого типа обсуждаются типичные алгоритмы (Z-score, IQR, Mahalanobis, kNN/LOF, Isolation Forest, кластеризация, модели временных рядов и последовательностей, автоэнкодеры, вариационные модели), а также требования к данным и вычислительным ресурсам. Предложена практическая схема выбора методов в зависимости от типа аномалии и модальности данных (табличные данные, временные ряды, потоки), приведены рекомендации по настройке порогов и по оценке качества на несбалансированных выборках (PR-AUC, MCC, событийные метрики). Классификация аномалий является необходимым этапом проектирования системы мониторинга; наилучшие результаты в прикладных задачах обычно достигаются каскадными и ансамблевыми решениями, сочетающими интерпретируемые базовые методы и гибкие модели машинного обучения.

Ключевые слова: аномалии данных, обнаружение аномалий, выбросы, контекст, временные ряды, автоэнкодер, Isolation Forest, LOF.

Количество просмотров: 1 (смотреть статистику)

Количество скачиваний: 2

Скачать XML К списку статей

Информация для цитирования:

Котов Д.В. Классификация аномалий в данных и выбор методов их обнаружения // Научный результат. Информационные технологии. – Т.11, №1, 2026. – С. 84-94. DOI: 10.18413/2518-1092-2026-11-1-0-8

Комментарии
Список литературы

Пока никто не оставил комментариев к этой публикации.
Вы можете быть первым.

1. Ларин Д.О. Информационные революции и их роль в развитии человечества / Д.О. Ларин // Вестник Омского университета. – 2025. – Т. 30, № 1. – С. 37-50. – DOI 10.24147/1812-3996.2025.1.37-50. – EDN GJVYOV.

2. Шкодырев В.П. Обзор методов обнаружения аномалий в потоках данных / В.П. Шкодырев, К.И. Ягафаров, В.А. Баштовенко, Е.Э. Ильина // Труды Второй конференции по разработке программного обеспечения и информационному менеджменту (SEIM-2017). – СПб.: СПбГУТ, 2017. – Т. 1864. – С. 215-225.

3. Шоргин С.Я. Статистика и кластеры в поисках аномальных вкраплений в условиях больших данных // Информатика и её применения. – 2021. – Т. 15, № 4. – С. 142–151. – DOI: 10.15393/j12.art.2021.7987.

4. Андрианова Е.Г., Головин С.А., Зыков С.В., Лесько С.А., Чукалина Е.Р. Обзор современных моделей и методов анализа временных рядов динамики процессов в социальных, экономических и социотехнических системах // Российский технологический журнал. – 2020. – Т. 8, № 4. – С. 7-45. – DOI: 10.32362/2500-316X-2020-8-4-7-45.

5. Видищева Е.В., Копырин А.С., Василенко М.С. Анализ и уточнение классификации аномалий и выбросов на экономических данных // Вестник Алтайской академии экономики и права. – 2019. – № 6-1. – С. 41–46. – URL: https://vaael.ru/ru/article/view?id=589 (дата обращения: 22.01.2026).

6. Андрианова Е.Г., Зыков С.В. и др. Обзор современных моделей и методов анализа временных рядов // Российский технологический журнал. – 2020. – Т. 8, № 4. – С. 7-45.

7. Бардасова И.А., Волкова Е.А. Обнаружение аномалий в электронных письмах с помощью машинного обучения // Вестник науки №5(74). – Т. 4. – С. 1350-1358. 2024 г. // URL: https://www.вестник-науки.рф/article/14991 (дата обращения: 22.01.2026 г.).

8. Михайлов А.Н. Обнаружение аномалий в сетевом трафике с использованием методов машинного обучения // Вестник науки №12(81). – Т. 3. – С. 1463-1466. 2024 г. // URL: https://www.вестник-науки.рф/article/19907 (дата обращения: 22.01.2026 г.).

9. Домашкин А.А. Применение двухэтапного метода кластеризации для обнаружения аномалий: тез. докл. / А.А. Домашкин // Международная конференция по компьютерным системам и технологиям (ICCSS-2024). – М.: ИПУ, 2024. – С. 112-120. – URL: https://iccss2024.ipu.ru/proceedings/Домашкин.pdf (дата обращения: 22.01.2026).

10. Глухов К.А. Применение двухэтапного метода кластеризации / К.А. Глухов, А.А. Домашкин // Безопасные и информационные технологии. – 2023. – Т. 1, № 1. – С. 1-10. – URL: https://info-secur.ru/index.php/ojs/article/view/482 (дата обращения: 22.01.2026).

11. Краева Я.А. Нейросетевой метод обнаружения аномалий в многомерных потоковых временных рядах // Вестник СПбПУ. Сер. Радиотехника, телекоммуникации и средств вычислительной техники. – 2024. – № 2. – С. 45-58.

12. Гриценко А.В. Типы аномалий в видеоизображениях // Прикладная информатика. – 2012. – № 5. – С. 78-92.

13. Литвинович А.В., Смирнов С.В. Методы анализа многомерных данных в задачах обнаружения аномалий // Программные продукты и системы. – 2022. – Т. 135, № 3. – С. 45-52.

14. Герасимов М.А., Петров И.В. Выявление аномалий в масштабных данных с применением Isolation Forest и автоэнкодера // Вестник СПбГУ. Серия 15. Вычислительная математика и информатика. – 2024. – Т. 20, № 1. – С. 112-–125.

15. Левшун Д.А., Попов Д.А., Козлов А.С. Обнаружение и объяснение аномалий в промышленных системах IoT на основе автоэнкодеров // Программные продукты и системы. – 2023. – Т. 141, № 4. – С. 123-135.

16. Бутусов Д.Н. Численные методы анализа нестационарных сигналов в задачах обработки изображений: дис. канд. физ.-мат. наук: 05.12.04 / Бутусов Д.Н.; СПбГЭТУ «ЛЭТИ». – СПб., 2021. – 150 с.

17. Носко В. П. Введение в регрессионный анализ временных рядов // [учебное пособие]. – М.: ВШЭ, 2010. – 120 с.

18. Брыкин Д.О. Исследование алгоритмов обработки временных рядов с учетом нестационарности: дис. канд. физ.-мат. наук: 05.13.18 / Брыкин Д.О.; МФТИ. – М., 2023. – 145 с.

19. Любушин А. А. Анализ данных систем геофизического и инженерного мониторинга. – 3-е изд. – М.: Наука, 2024. – 320 с.

Все журналы

Отправить статью

Научный результат. Информационные технологии включен в научную базу РИНЦ (лицензионный договор № 765-12/2014 от 08.12.2014).

Журнал включен в перечень рецензируемых научных изданий, рекомендуемых ВАК

Журнал индексируется следующими научными базами и платформами

Научный результат. Научный результат. Информационные технологии (ISSN 2518-1092)

The journal materials and website are licensed under Creative Commons «Attribution» 4.0 International.

Учредитель: федеральное государственное автономное образовательное учреждение высшего образования «Белгородский государственный национальный исследовательский университет» (НИУ «БелГУ»). Адрес: 308015, Белгородская область, г. Белгород, ул. Победы, 85.

Издатель: федеральное государственное автономное образовательное учреждение высшего образования «Белгородский государственный национальный исследовательский университет» (НИУ «БелГУ»). Адрес: 308015, Белгородская область, г. Белгород, ул. Победы, 85.

Редакция: главный редактор Черноморец Андрей Алексеевич, e-mail: RR_IT@bsuedu.ru, тел.: +7 (4722) 30-13-92.

Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор)

Свидетельство о регистрации СМИ

Информационное письмо (русс. яз)

Приказ № 1097-ОД от 15.11.2023 "Об утверждении Регламента издания научных журналов НИУ «БелГУ»"

Приказ № 144-ОД от 16.03.2026 "Об утверждении состава редакционной коллегии журнала «Научный результат. Информационные технологии»"

Приказ № 145-ОД от 16.03.2026 "Об утверждении Устава редакции средства массовой информации научного журнала «Научный результат. Информационные технологии»"

Устав редакции средства массовой информации «Научный результат. Информационные технологии»

Остались вопросы?
Можете написать нам:

✉ Ответственный cекретарь

✉ Администратор сайта

✉ Контент менеджер