Главная>Новости>Мир>Технологии>Как вычислить кибератаки по "шуму" в потоке данных

Как вычислить кибератаки по "шуму" в потоке данных

Как вычислить кибератаки по
Российские ученые разрабатывают устройство, способное считывать колебания в потоке данных и тем самым вычислять злоумышленников

Сложные системы, такие как сетевой трафик или живые организмы, не обладают детерминированными физическими законами для их точного описания и предсказания дальнейшего поведения. В этом случае важную роль играет корреляционный анализ, который описывает поведение системы в терминах наборов статистических параметров.

Описывают такие сложные системы бестрендовые последовательности, часто определяемые как долгосрочные временные ряды или «шум». Они представляют собой колебания, создаваемые совокупностью различных источников, и являются одними из наиболее сложных данных для анализа и извлечения надежной, стабильной информации. 

Одной из метрик, используемых в экономике и естественных науках при анализе временных рядов, является показатель Хёрста. Он позволяет предположить, сохранится ли тренд, присутствующий в данных. Например, продолжат ли значения возрастать, или рост сменится убыванием. Это предположение выполняется для многих природных процессов и объясняется инертностью природных систем. Скажем, изменение уровня воды в озере, которое согласуется с прогнозами, выведенным из анализа значения показателя Хёрста, определяется не только текущим количеством воды, но и интенсивностью испарения, выпадением осадков, таянием снега и т. д. Все перечисленное — растянутый во времени процесс.  

Уловить кибератаку

Объем трафика, проходящего через сетевые устройства, чудовищен. Это касается и конечных аппаратов — домашних персональных компьютеров, но особенно — промежуточных, таких как маршрутизаторы, а также высоконагруженных серверов. Часть этого трафика, например, видеоконференцсвязь, необходимо отправить с максимальным приоритетом, тогда как отправка файлов может и подождать. А может быть, это торрент-трафик, который забивает узкий канал. Или вовсе — идет сетевая атака, и ее нужно блокировать. 

Анализ трафика требует вычислительных ресурсов, места для хранения (буфера) и времени — задержки в передаче. Все это в дефиците, особенно если дело касается маломощных промежуточных устройств. В настоящее время используются либо относительно простые методы машинного обучения, которые страдают от недостатка точности, либо методы глубоких нейронных сетей, которые требуют достаточно мощных вычислительных станций с большим объемом памяти просто для разворачивания инфраструктуры для запуска, не говоря уже о самом анализе.

Идея, лежащая в основе работы группы ученых под руководством Равиля Нигматуллина, достаточно проста: обобщить показатель Хёрста, добавив в него большее количество коэффициентов, чтобы получить более полное описание изменяющихся данных. Это позволяет находить закономерности в данных, которые принято считать шумами и которые ранее было невозможно анализировать. Таким образом удается производить «на лету» выделение значимых признаков и применять элементарные методы машинного обучения для поиска сетевых атак. В совокупности получается точнее тяжелых нейронных сетей, и такой подход можно разворачивать на маломощных промежуточных устройствах.

«Шум» — это то, что принято отбрасывать, но выделение закономерностей в «шумах» может быть очень полезным. Так, учеными был проведен анализ тепловых шумов передатчика в системе связи.  Данный математический аппарат позволил выделить из данных набор параметров, характеризующих конкретный передатчик. Это может стать решением одной из задач криптографии: Алиса посылает сообщения Бобу, Чак — злоумышленник, который пытается выдать себя за Алису и отправить Бобу сообщение. Бобу нужно отличить сообщение от Алисы от сообщения от Чака. 

Работа с данными глубоко проникает во все сферы человеческой жизни, алгоритмы распознавания изображений и речи давно перешли из разряда научной фантастики во что-то, с чем мы сталкиваемся ежедневно. Данный метод описания позволяет получать признаки сигнала, которые могут использоваться в машинном обучении, существенно упрощая и ускоряя системы распознавания и улучшая точность решений. Результаты работы опубликованы в журнале Mathematics.

Александр Ивченко, сотрудник лаборатории мультимедийных систем и технологий МФТИ, один из авторов разработки, говорит: «Развитие данного математического аппарата может решить вопрос параметризации и анализа процессов, для которых нет точного математического описания. Это открывает огромные перспективы в описании, анализе и прогнозировании сложных систем».

Автор:popmech

Актуальные новости

05.01.2020, 15:16
195
Основные события, обозначившие развитие экономики в прошедшем десятилетии
17.05.2021, 13:13
177
Нейробиолог сравнил странность наших сновидений с процессом обучения искусственного интеллекта
27.04.2021, 08:14
143
В Биробиджане тушат пожар на городской свалке на площади 15 га
30.11.2021, 09:37
161
Цена нефти Brent упала ниже $71 за баррель
21.01.2022, 09:59
181
Сооснователь DeepMind ушел из Google
29.12.2021, 09:54
205
ProShares запустит ETF с фокусом на метавселенные
28.07.2021, 09:03
169
DeepMind создала универсальных ИИ-агентов в неограниченной игре
11.01.2022, 09:00
252
Binance раскрыла имена новых директоров в России и Украине
btc
$ 20449
+4.29%
eth
$ 1099.65
+3.97%
busd
$ 1.014
-0.27%
xrp
$ 0.333321
+0.8%
ltc
$ 55.4
+3.88%