16+
DOI: 10.18413/2518-1092-2016-1-2-9-15

ИССЛЕДОВАНИЕ НЕКОТОРЫХ СТЕГАНОГРАФИЧЕСКИХ АЛГОРИТМОВ

Aннотация

В работе рассмотрены некоторые стеганографические методы, основанные на использовании частотных характеристик речевых сигналов. В частности, рассмотрены широко используемый стеганографический метод расширения спектра и новый метод субполосных проекций. Стеганографический метод субполосных проекций основан на использовании субполосного анализа с применением субполосных матриц. Для сравнения рассмотренных стеганографических методов в работе используется несколько различных мер различия. Для сравнения использовались среднеквадратическая ошибка, относительная погрешность, отношение сигнал-шум, коэффициент корреляции, мера расстояния Итакуры-Санто (расстояние наибольшего правдоподобия). Для исследования методов использованы реальные речевые сигналы. При этом исследования были проведены при различных длительностях отрезков анализа. В работе показано, что метод субполосных проекций вносит меньше искажений по сравнению с методом расширения спектра.


Развитие современных информационно-телекоммуникационных систем направлено на обеспечение возможности предоставления естественных для человека форм информационного обмена. Одной из таких форм, наиболее часто используемых удобных для человека, является речь. Современные информационные системы позволяют осуществлять хранение и передачу речевых сообщений на расстояние. Обеспечение такой возможности привело к бурному развитию технологий, обеспечивающих внедрение в аудиозаписи дополнительной информации, которая не будет восприниматься органами чувств человека. Это могут быть метки даты и времени, метки, подтверждающие авторское право и т.д. Внедрение дополнительной информации таким образом, чтобы сам факт внедрения не был обнаружен, занимается стеганография. Именно этот аспект и описывает основной принцип стеганографии [1, 5, 6, 9-12].

В случае использования в качестве объекта, в который будет внедряться информация (контейнера), речевого сигнала, результат внедрения, т.е. стегоконтейнер (контейнер вместе с внедренной информацией), «на слух» не должен отличаться от исходного контейнера.

Как известно, речевой сигнал представляет собой квазистационарный процесс, поэтому работа стегоалгоритма должна адаптироваться к изменениям в речевом сигнале. Одним из наиболее эффективных способов анализа речевых сигналов является частотный анализ. Результаты исследования частотных характеристик речевых сигналов, соответствующих различным звукам русской речи, позволил выявить возможность использования частотных характеристик для скрытого внедрения информации.

Одним из распространенных стеганографических методов, учитывающих частотные характеристики речевых сигналов, является метод расширения спектра. Суть метода заключается в добавлении к отрезку исходного речевого сигнала псевдослучайной последовательности (ПСП) в соответствии с выражением [2, 13, 14]:

,                                      (1)

где x(t) – исходный отрезок данных; u(t) – отрезок, соответствующий псевдослучайной последовательности; αm – весовой коэффициент;em – кодовое отображение двоичного бита контрольной информации, определяемое по формуле:

,                                   (2)

где em – бит контрольной информации в двоичной системе счисления, M – объем скрытно кодируемой контрольной информации; em – кодовое отображение двоичного бита контрольной информации, m – порядковый номер бита контрольной информации.

Весовой коэффициент αm определяет скрытность системы. В работах [2, 14] его предлагается выбирать равным:

.                                       (3)

Стоит отметить, что использование в качестве шума сигнальной конструкции u(t), не обладающей взаимной энергией с данными x(t), позволяет повысить помехоустойчивость стеганографически закодированной контрольной информации em, а использование коэффициента проекции  повышает скрытность контрольной информации.

Декодирование бита контрольной информации из данных происходит путем определения знака скалярного произведения отрезка данных и псевдослучайной последовательности:

,                                    (4)

где  – операция выделения знака.

Решение о декодированном сигнале принимается в соответствии с выражением:

.                                    (5)

На рисунке 1 приведены в виде сплошной исходный отрезок x(t) и отрезок  с закодированной методом расширения спектра контрольной информацией (пунктир). Отрезки длительностью 0.032 с записаны с вчастотой дискретизации 8кГц и разрядностью 16 бит, соответствуют звуку «а». Стеганографическое кодирование осуществлено для одного бита контрольной информации.

Результат стеганографического кодирования информации методом расширения спектра, представленный на рисунке 1, позволяет говорить о изменениях как во временной, так и в частотной областях. Во временной области преобразования проявляются в виде изменения амплитуды сигнала, как в максимальных, так и минимальных значениях амплитуды (рис. 1, а). В частотной области происходит перераспределение энергии между всеми частотными компонентами, особенно этот эффект проявляется в области частотных компонент с малой долей энергии (на рис. 1, б выделено штриховкой).

    

а                                        б

Рис. 1. Результат скрытного кодирования информации методом расширения спектра: а) отрезки x(t) и  
во временной области; б) энергетические спектры  и 

Fig. 1. Result of the hidden information encoding with the method of spreading: a) segments x(t) and  
in the time domain; b) energy spectra  and 

 

Экспериментальные исследования на отрезках речевых данных соответствующим звукам русской речи показали, что основным достоинством метода расширения спектра является помехоустойчивость при высокой скрытности. В качестве параметров внедрения для отрезков речевых данных использовалась ПСП с периодом равной частоте дискретизации , исследования проводились при варьировании коэффициентов  (от 0.1 до 0.001) и разных соотношениях шум/сигнал (от 0.001 до 1). Количество перекодированных отрезков составляло 60·106, результаты оценки вероятности появления ошибочного бита Рош при декодировании двоичных символов em приведены в таблице 1.

Стоит отметить, что метод предполагает скрытное кодирование контрольной информации без перехода в частотную область. К недостаткам метода нужно отнести необходимость хранения ПСП. Метод чувствителен к изменению разрядности данных. Так в результате изменения шага квантования (что эквивалентно добавлению шума квантования), стеганографически закодированная информация будет разрушена.

Метод расширения спектра позволяет учитывать энергетические свойства отрезка данных в целом, но не может учитывать распределение энергии по частотным компонентам. То есть не в полной мере использует закономерности в данных, т.к. энергия ПСП распределена по всему частотному диапазону.

Таблица 1

Значение вероятности Рош  появления ошибочного бита при декодировании двоичных символов em

Table 1

The value of the probability Рош  of occurrence of erroneous bits in the decoding of binary symbols em

коэффициент

шум/сигнал

=0.1=0.01=0.001
T=0.016 сT=0.032сT=0.016 сT=0.032сT=0.016 сT=0.032с
=0.001< 1×10-4< 1×10-40.12900.05210.36140.3170
=0.010.2×10-3< 1×10-40.12850.05080.34970.3013
=0.10.4×10-37.2×10-30.14390.07200.36610.3203
=15.5×10-30.13950.21330.12970.40110.3602

Учесть особенности распределения энергии по частотным интервалам позволяет использование субполосного анализа. При этом предполагается применение математического аппарата на основе использования субполосных матриц [3,4,7,8,15] с элементами вида:

, ,  ,            (6)

где N – длительность анализируемого отрезка; R – количество частотных интервалов, на которые разбивается ось частот; υ1rυ2r – нижняя и верхняя границы r-го частотного интервала.

Использование субполосных матриц позволяет выделять частотные компоненты, энергии которых сосредоточены в выбранных частотных интервалах. Для скрытого внедрения дополнительной информации целесообразно использовать субполосные проекции, представляющие собой скалярное произведение отрезка данных на собственные вектора субполосных матриц:

.                          (7)

где  – собственные вектора субполосной матрицы для r-го частотного интервала.

Свойства субполосных представлений, позволяют говорить об их адекватности и оптимальности для разработки методов и алгоритмов стеганографического кодирования/декодирования контрольной информации в речевые данные.

Для скрытого внедрения дополнительной информации в отрезок речевых сигналов предлагается модель, осуществляющая кодирование бит контрольной информации bm в отрезок речевых данных  в соответствии с выражением:

,                                   (8)

где M – объем контрольной информации в битах; Km – коэффициент пропорциональности определяющий скрытность; em – ортонормальное представление бита; bm – бит контрольной информации;  – операция выделения знака.

Декодирование контрольной информации методом субполосных проекций осуществляется путем определения знаков проекций  для собственных векторов  субполосной матрицы Ar, вычисленных для частотного пространства :

                                    (9)

где  – ортонормальное представление бита контрольной информации при декодировании методом субполосных проекций  – декодированный методом субполосных проекций бит контрольной информации.

Для сравнения эффективности метода расширения спектра и метода субполосных проекций предлагается использовать различные меры различия, каждая из которых обладает разной чувствительностью к различным изменениям. В рамках данной работы предлагается использовать такие оценки различия, как среднеквадратическая ошибка (СКО), относительная погрешность (НСКО), отношение сигнал-шум (ОСШ), коэффициент корреляции (cor), мера расстояния Итакуры-Санто (расстояние наибольшего правдоподобия, ISD).

Среднеквадратическая ошибка (СКО) отражает абсолютное различие энергии отрезков сигналов во временной области:

,                                      (10)

где  – значение амплитуды исходного отрезка данных;  – значение амплитуды отрезка данных содержащего дополнительную информацию, N – количество отсчетов сравниваемых отрезков сигналов.

Данная мера позволяет выявить различия в огибающих амплитуд отрезков речевых сигналов. Чем меньше изменений вносится при внедрении дополнительной информации, тем ближе значение этой оценки к нулю.

Однако чаще используют нормированную оценку СКО к норме исходного сигнала, которое учитывает энергию самого сигнала:

.                                (11)

Реакция данной оценки аналогична реакции СКО.

Также для учета степени отличия исходного сигнала и результата внедрения дополнительной информации используют оценку, чувствительную ко времени выравнивания сравниваемых отрезков сигналов:

.                                 (12)

Чем выше оценка ОСШ, тем меньше изменений было внесено. В случае равенства двух отрезков (исходного и подвергшегося изменениям при кодировании) оценка будет равна бесконечности (∞).

Для оценки степени схожести двух отрезков данных, часто используют оценку взаимной энергии этих сигналов, определяемую коэффициентом корреляции:

.                            (13)

Чем ближе значение корреляции к единице, тем выше схожесть отрезка данных содержащего контрольную информацию и исходного.

Мера Итакуры-Санто (расстояние наибольшего правдоподобия) учитывает различия в частотной области:

,                               (14)

где  – значение энергии частотной компоненты исходного отрезка данных;  – значение энергии частотной компоненты отрезка данных содержащего дополнительную информацию.

Мера имеет смысл расстояния между спектрами двух сигналов и оценивает несоответствие между энергией измененного и исходного отрезка данных. При равенстве отрезков данных мера обращается в ноль.

Таблица 2

Обобщенная оценка мер различия исходного сигнала и результатов внедрения при использовании стеганографического метода расширения спектра и метода субполосных проекций

Table 2

Generalized estimator of measures of the difference between a baseband signal and the results of implementation with the use of the steganographic method of spectrum extension and the subband method of steganography

  СКОНСКООСШcorISD
метод субполосных проекцийТ=0.016с0,003960,01399Inf0,993000,00120
Т=0.032с0,008570,00962Inf0,995190,00312
метод расширения спектраТ=0.016с0,011560,0154720,134220,992260,02022
Т=0.032с0,011330,0079222,111220,996040,00310

Для сравнения использовались речевые сигналы, записанные с частотой дискретизации 8кГц и разрядностью кода 16бит. При этом речевые сигналы разбивались на отрезки равной длительности T=0.016мс и T=0.032мс.

Анализ полученных результатов показывает, что использование метода субполосных проекций приводит к меньшим искажениям по сравнению с использованием метода расширения спектра.

Таким образом, для реализации скрытого внедрения дополнительной информации в речевые сигналы целесообразно использовать метод субполосных проекций.

Работа выполнена при поддержке грантов РФФИ № 15-07-01570 "Субполосная скрытная интеграция/извлечение дополнительной информации в аудио или видео контентах".

Список литературы

1. Грибунин В.Г., Оков И.Н., Туринцев И.В. Цифровая стеганография. Аспекты защиты. М.: Солон-Пресс, 2002. 261 с.

2.   Жарких А.А., Гурин А.В., Пластунов В.Ю. Метод стеганографии на основе прямого расширения спектра сигнала / Материалы VIIМеждународной научно-технической конференции, 7–11 декабря 2009 г. INTERMATIC. – М.: МИРЭАчасть 4, 2009, С. 78-83.

3.   Жиляков Е.Г., Лихолоб П.Г., Девицына С.Н. Определение возможного объёма внедряемой информации при скрытой передаче меток в речевых данных / Научные ведомости Белгородского государственного университета № 13 (132). Выпуск 23/1, серия История. Политология. Экономика. Информатика. – Белгород, 2012. С. 222-226.

4.  Жиляков Е.Г. Оптимальные субполосные методы анализа и синтеза сигналов конечной длительности / Автоматика и телемеханика. – М.: Академический научно-издательский, производствен­но-полиграфический и книгораспро­странительский центр Российской академии наук "Издательство "Наука" № 4, 2015 г. С. 51-66.

5.   Конахович Г.Ф., Пузыренко А.Ю. Компьютерная стеганография. Теория и практика / Киев: «МК-Пресс», 2006. 288с.

6.   Крыжевич Л.С. Белобородов Д.А. Стеганографические методы сокрытия данных в звуковых файлах на основе всплесковых преобразований / Auditorium: электронный научный журнал Курского государственного университета. – Курск: № 2, 2014г. «Аудиториум» электронный научный URL: http://auditorium.kursksu.ru/index.php?page=6&new=2 (дата обращения 28.04.2016)

7.   Об однозначности определения идентификационно-значимой частотной полосы в звуках русской речи, подверженных влиянию шума / Жиляков Е.Г., Лихолоб П.Г., Курлов А.В., Медведева А.А. // Научные ведомости Белгородского государственного университета № 2 (223). Выпуск 37, серия История. Политология. Экономика. Информатика. – Белгород, 2016. С. 167-174.

8.   О методе скрытного кодирования контрольной информации в речевые данные / Жиляков Е.Г., Белов С.П., Лихолоб П.Г., Пашинцев В.П. // Инфокоммуникационные технологии. – Саратов: Поволжский государственный университет телекоммуникаций и информатики. – Т.13, - №3 2015, С. 325-333.

9.   Fridrich, J. Steganography in digital media: Principles, algorithms, and applications, 2012, Steganography in Digital Media, pp. 1-441.

10. Furui, Sadaoki; Digital speech processing, synthesis, and recognition / Sadaoki Furui. – 2nd ed., rev. and expanded, 2000

11. Nedeljko Cvejic, Tapio Seppanen. Spread spectrum audio watermarking using frequency hopping and attack characterization/ Signal Processing 84. – 2004. – p. 207 – 213.

12. Stanković, S., Orović, I., Sejdić, E. Multimedia signals and systems, 2012, Multimedia Signals and Systems, pp. 1-349.

13. Thierry Dutoit, Ferran Marques. Applied Signal Processing A MATLAB TM-Based Proof of Concept 2009.

14. Vercoe B.L., Csound: A Manual for the Audio-Processing System, MIT Media Lab, Cambridge 1995.

15. Zhilyakov, E.G. Optimal sub-band methods for analysis and synthesis of finite-duration signals, Automation and remote control, pp. Vol. 76, No 4, p. 589-602.