Технология многомерных баз данных. Многомерные системы с потерями

В предыдущей секции мы рассматривали двухмерную диаграмму переходов состояний. Для увеличивающегося числа потоков нагрузки число состояний (и следовательно уравнений) увеличивается очень быстро. Однако, можно упростить проблему, используя структуру диаграммы переходов состояний. Рассмотрим двухмерную диаграмму переходов состояний, показанную в рис. 10.2. Для четырех соседних состояний поток в направлении по часовой стрелке должен равняться потоку в противоположном направлении (Kingman, 1969 ), (Sutton, 1980 ). Взглянем на рис. 10.2.


Рис. 10.2.

По часовой стрелке :


Против часовой стрелки :


Мы можем сократить оба выражения на вероятности состояния и затем получить условие (10.12). Необходимое и достаточное условие для обратимости - что следующие два выражения являются равными.

По часовой стрелке :

(10.12)

Против часовой стрелки :

Если эти два выражения равны, то имеется локальное или частичное равновесие . Таким образом, необходимым условием для обратимости является то, что если есть поток (стрелка) от состояния i к состоянию j , тогда должен также быть поток (стрелка) от состояния j до состояния i . Мы можем применить уравнения сечения между любыми двумя подключенными состояниями. Итак, из рисунка 10.2 мы получаем:

(10.13)

Мы можем выразить любую вероятность состояния с помощью вероятности состояния , выбирая любой путь между этими двумя состояниями (критерии Колмогорова ). Мы можем, например, выбрать путь :

Тогда получаем следующее уравнение равновесия:

(10.17)

Если мы рассматриваем многомерную систему с потерями, имеющую N потоков нагрузки, то любым потоком нагрузки может быть зависимый от состояния Пуассоновский процесс. В конкретном потоке могут быть нагрузки типа BPP (Бернулли, Пуассон, Паскаль ). Для N - мерных систем условия обратимости аналогичны (10.12). Критерий Колмогорова должен выполняться для всех возможных путей. Практически, мы не испытываем никаких проблем, потому что решение, полученное согласно предположению об обратимости, будет правильным решением тогда и только тогда, когда выполнены уравнения равновесия узла. В следующей секции мы используем это как основание , чтобы ввести общую многомерную модель нагрузки.

Многомерные Системы с потерями

В этой секции мы рассматриваем обобщения классической теории телетрафика для систем, которые состоят из нескольких типов потоков нагрузки, поступающих на единственный канал или группу каналов или пучков каналов. Каждый поток нагрузки может иметь отдельные параметры и может быть зависимыми от состояния Пуассоновскими потоками вызовов с ограниченными классами и мультислотовым трафиком. Этот общий класс моделей нечувствителен к распределению времени пребывания в системе, которое может быть классом. Мы вводим обобщения по одному и представляем маленькое социологическое исследование, чтобы проиллюстрировать основные идеи.

Ограничение класса

По сравнению со случаем, который рассматривают в секции 10.1, мы теперь ограничим число одновременных запросов для каждого потока нагрузки (класса). Таким образом, не будет полной доступности, но в отличие от систем перегрузки, где физически существует доступ только к заданным каналам, теперь возможно использование всех каналов, но в любой момент мы можем занять только ограниченное их число. Это обеспечивает сервисная защита (защита числа виртуальных каналов = ограничение на класс обслуживания = приоритетная пороговая стратегия). Таким образом, мы вводим ограничения числа одновременных вызовов в классе j следующим образом:

(10.18)

Если последнее ограничение не выполнено, то мы получаем отдельные группы, соответствующие N обычным независимым одномерным системам с потерями . Из-за ограничений диаграмма переходов состояний усечена. Для двух потоков нагрузки она показана на рис.10.3 .


Рис. 10.3.

Заметим, что усеченная диаграмма переходов состояний все еще является обратимой и что значение относительно значения при усечении не изменяется. Изменяется только нормировочная константа. Фактически, из-за локального свойства равновесия мы можем удалить любое состояние, не изменяя вышеупомянутые свойства. Можно рассмотреть больше общих ограничений класса к наборам потоков нагрузки так, чтобы любой поток нагрузки имел минимум (гарантируемый) числа распределенных каналов.

Обобщенные процессы обслуживания нагрузки

Мы можем рассматривать PCT -I нагрузку только как в секции 10.1. Каждый поток нагрузки может быть зависимым от состояния, например, Пуассоновский поток вызовов с линейной зависимостью от состояния и своей скоростью выхода из системы (гибели), см. (10.16) и (10.17)

Система удовлетворяет условиям обратимости, см. (10.12). Таким образом, форма произведения также существует для BPP -потоков нагрузки и более общих Пуассоновских процессов, зависимых от состояния. Если все потоки нагрузки - энгсетовские (Биноминальные) процессы, то мы получаем многомерную формулу Энгсета (Jensen, 1948). Как уже упомянуто выше, система нечувствительна к распределениям времени пребывания в системе. Каждый поток нагрузки может иметь свое собственное отдельное распределение времени пребывания в системе.

Мультислотовая нагрузка

В системах с интеграцией служб требуемая пропускная способность может зависеть от типа обслуживания. Например, для обслуживания телефонного соединения с передачей только речи требуется один канал (слот), тогда как, например, для передачи видеоизображения может потребоваться каналов одновременно. Мы получаем дополнительные ограничения:

(10.19)
(10.20)

где - фактическое число вызовов типа . Результирующая диаграмма переходов состояний будет обратима, и будет иметь форму произведения.

Реляционная модель данных, которая была предложена Э.Ф. Коддом в 1970 году, и за которую десятилетие спустя он получил премию Тьюринга, служит основой современной многомиллиардной отрасли баз данных. За последние десять лет сложилась многомерная модель данных, которая используется, когда целью является именно анализ данных, а не выполнение транзакций. Технология многомерных баз данных - ключевой фактор интерактивного анализа больших массивов данных с целью поддержки принятия решения. Подобные базы данных трактуют данные как многомерные кубы, что очень удобно именно для их анализа.

Многомерные модели рассматривают данные либо как факты с соответствующими численными параметрами, либо как текстовые измерения, которые характеризуют эти факты. В розничной торговле, к примеру, покупка - это факт, объем покупки и стоимость - параметры, а тип приобретенного продукта, время и место покупки - измерения. Запросы агрегируют значения параметров по всему диапазону измерения, и в итоге получают такие величины, как общий месячный объем продаж данного продукта. Многомерные модели данных имеют три важных области применения, связанных с проблематикой анализа данных.

  • Хранилища данных интегрируют для анализа информации из нескольких источников на предприятии.
  • Системы оперативной аналитической обработки (online analytical processing - OLAP) позволяют оперативно получить ответы на запросы, охватывающие большие объемы данных в поисках общих тенденций.
  • Приложения добычи данных служат для выявления знаний за счет полуавтоматического поиска ранее неизвестных шаблонов и связей в базах данных.

Исследователи предложили формальные математические модели многомерных баз данных, а затем эти предложения нашли уточненное отражение в конкретном программном инструментарии, реализующем эти модели . Врезка описывает эволюцию многомерной модели данных.

Электронные таблицы и отношения

Электронные таблицы, аналогичные показанной в таблице 1, представляют собой удобный инструмент для анализа данных о продажах: какие продукты проданы, сколько совершено сделок и где. Главная таблица (pivot table) - двумерная электронная таблица с соответствующими промежуточными и итоговыми результатами, которая используется для просмотра более комплексных данных путем вложения нескольких измерений по осям x и y и отображения данных на нескольких страницах. Главные таблицы, как правило, поддерживают итеративный выбор подмножеств данных и изменение отображаемого уровня детализации.

Электронные таблицы не подходят для управления и хранения многомерных данных, поскольку они слишком жестко связывают данные с их внешним видом, не отделяя структурную информацию от желаемого представления информации. Скажем, добавление третьего измерения, такого как время, или группировка данных по обобщенным типам продуктов требует значительно более сложной настройки. Очевидное решение состоит в использовании отдельной электронной таблицы для каждого измерения. Но такое решение оправдано только в ограниченной степени, поскольку анализ подобных наборов таблиц быстро становится чересчур громоздким.

Использование баз данных, поддерживающих SQL, значительно увеличивает гибкость обработки структурированных данных. Однако сформулировать многие вычисления, такие как совокупные показатели (объем продаж за год к текущему моменту), сочетание итоговых и промежуточных результатов, ранжирование, например, определение десяти самых продаваемых продуктов, посредством стандартного варианта SQL весьма сложно, если вообще возможно. При перестановке строк и столбцов необходимо вручную специфицировать и комбинировать различные представления. Расширения SQL, такие как оператор кубов данных и окна запросов частично решают эти задачи, в целом чистая реляционная модель не позволяет на приемлемом уровне работать с иерархическими измерениями.

Электронные таблицы и реляционные базы данных адекватно обрабатывают массивы данных, которые имеют незначительное число измерений, но они не полностью отвечают требованиям углубленного анализа данных. Решение же состоит в том, чтобы использовать технологию, которая предусматривает поддержку полного спектра средств многомерного моделирования данных.

Кубы

Многомерные базы данных рассматривают данные как кубы, которые являются обобщением электронных таблиц на любое число измерений. Кроме того, кубы поддерживают иерархию измерений и формул без дублирования их определений. Набор соответствующих кубов составляет многомерную базу данных (или хранилище данных).

Кубами легко управлять, добавляя новые значения измерений. В обычном обиходе этим термином обозначают фигуру с тремя измерениями, однако теоретически куб может иметь любое число измерений. На практике чаще всего кубы данных имеют от 4 до 12 измерений . Современный инструментарий часто сталкивается с нехваткой производительности, когда так называемый гиперкуб имеет свыше 10-15 измерений.

Комбинации значений измерений определяют ячейки куба. В зависимости от конкретного приложения ячейки в кубе могут располагаться как разрозненно, так и плотно. Кубы, как правило, становятся разрозненными по мере увеличения числа размерностей и степени детализации значений измерений.

На рис. 1 показан куб, содержащий данные по продажам в двух датских городах, указанных в таблице 1 с дополнительным измерением - «Время». В соответствующих ячейках хранятся данные об объеме продаж. В примере можно обнаружить «факт» - непустую ячейку, содержащую соответствующие числовые параметры - для каждой комбинации время, продукт и город, где была совершена, по крайней мере, одна продажа. В ячейке размещаются числовые значения, связанные с фактом - в данном случае, это объем продаж - единственный параметр.

В общем случае куб позволяет представить только два или три измерения одновременно, но можно показывать и больше за счет вложения одного измерения в другое. Таким образом, путем проецирования куба на двух- или трехмерное пространство можно уменьшить размерность куба, агрегировав некоторые размерности, что ведет к работе с более комплексными значениями параметров. К примеру, рассматривая продажи по городам и времени, мы агрегируем информацию для каждого сочетания город и время. Так, на рис. 1, сложив поля 127 и 211, получаем общий объем продаж для Копенгагена в 2001 году.

Измерения

Измерения - ключевая концепция многомерных баз данных. Многомерное моделирование предусматривает использование измерений для предоставления максимально возможного контекста для фактов . В отличие от реляционных баз данных, контролируемая избыточность в многомерных базах данных, в общем, считается оправданной, если она увеличивает информационную ценность. Поскольку данные в многомерный куб часто собираются из других источников, например, из транзакционной системы, проблемы избыточности, связанные с обновлениями, могут решаться намного проще. Как правило, в фактах нет избыточности, она есть только в измерениях.

Измерения используются для выбора и агрегирования данных на требуемом уровне детализации. Измерения организуются в иерархию, состоящую из нескольких уровней, каждый из которых представляет уровень детализации, требуемый для соответствующего анализа.

Иногда бывает полезно определять несколько иерархий для измерения. Например, модель может определять время как в финансовых годах, так и в календарных. Несколько иерархий совместно используют один или несколько общих, самых низких уровней, например, день и месяц, и модель группирует их в несколько более высоких уровней - финансовый квартал и календарный квартал. Чтобы избежать дублирования определений, метаданные многомерной базы данных определяют иерархию измерений.

На рис. 2 показана схема «Местоположение» для данных продаж из таблицы 1. Из трех уровней измерений местоположения самый низкий - «Город». Значения уровня «Город» группируются в значения на уровне «Страна», к примеру, Аалборг и Копенгаген находятся в Дании. Уровень T представляет все измерения.

В некоторых многомерных моделях уровень имеет несколько связанных свойств, которые содержат простую, неиерархическую информацию. Например, «Размер пакета» может быть свойством уровня в измерении «Продукт». Измерение «Размер пакета» может также получать эту информацию. Использование механизма свойств не приводит к увеличению числа измерений в кубе.

В отличие от линейных пространств, с которыми имеет дело алгебра матриц, многомерные модели, как правило, не предусматривают функций упорядочивания или расстояния для значений измерения. Единственное «упорядочивание» состоит в том, что значения более высокого уровня содержат значения более низких уровней. Однако для некоторых измерений, таких как время, упорядоченность значений размерности может использоваться для вычисления совокупной информации, такой как общий объем продаж за определенный период. Большинство моделей требуют определения иерархии измерений для формирования сбалансированных деревьев - иерархии должны иметь одинаковую высоту по всем ветвям, а каждое значение не корневого уровня - только одного родителя.

Факты

Факты представляют субъект - некий шаблон или событие, которые необходимо проанализировать. В большинстве многомерных моделей данных факты однозначно определяются комбинацией значений измерений; факт существует только тогда, когда ячейка для конкретной комбинации значений не пуста. Однако некоторые модели трактуют факты как «объекты первого класса» с особыми свойствами. Большинство многомерных моделей также требуют, чтобы каждому факту соответствовало одно значение на более низком уровне каждого измерения, но в некоторых моделях это не является обязательным требованием .

Каждый факт обладает некоторой гранулярностью, определенной уровнями, из которых создается их комбинация значений измерений. Например, гранулярность факта в кубе, представленном на рис. 1 - это (Год x Продукт x Город). (Год x Тип x Город) и (День x Продукт x Город) - соответственно более грубая и более тонкая гранулярности.

Хранилища данных, как правило, содержат следующие три типа фактов .

  • События (event), по крайней мере, на уровне самой большой гранулярности, как правило, моделируют события реального мира, при этом каждый факт представляет определенный экземпляр изучаемого явления. Примерами могут служить продажи, щелчки мышью на Web-странице или движение товаров на складе.
  • Мгновенные снимки (snapshot) моделируют состояние объекта в данный момент времени, такие как уровни наличия товаров в магазине или на складе и число пользователей Web-сайта. Один и тот же экземпляр явления реального мира, например, конкретная банка бобов, может возникать в нескольких фактах.
  • Совокупные мгновенные снимки (cumulative snapshot) содержат информацию о деятельности организации за определенный отрезок времени. Например, совокупный объем продаж за предыдущий период, включая текущий месяц, можно легко сравнить с показателями за соответствующие месяцы прошлого года.

Хранилище данных часто содержит все три типа фактов. Одни и те же исходные данные, например, движение товаров на складе, могут содержаться в трех различных типах кубов: поток товаров на складе, список товаров и поток за год к текущей дате.

Параметры

Параметры состоят из двух компонентов:

  • численная характеристика факта, например, цена или доход от продаж;
  • формула, обычно простая агрегативная функция, скажем, сумма, которая может объединять несколько значений параметров в одно.

В многомерной базе данных параметры, как правило, представляют свойства факта, который пользователь хочет изучить. Параметры принимают различные значения для разных комбинаций измерений. Свойство и формула выбираются таким образом, чтобы представлять осмысленную величину для всех комбинаций уровней агрегирования. Поскольку метаданные определяют формулу, данные, в отличие от случая электронных таблиц, не тиражируются.

При вычислениях три различных класса параметров ведут себя совершенно по-разному.

  • Аддитивные параметры могут содержательным образом комбинироваться в любом измерении. Например, имеет смысл суммировать общий объем продаж для продукта, местоположения и времени, поскольку это не вызывает наложения среди явлений реального мира, которые генерируют каждое из этих значений.
  • Полуаддитивные параметры, которые не могут комбинироваться в одном или нескольких измерениях. Например, суммирование запасов по разным товарам и складам имеет смысл, но суммирование запасов товаров в разное время бессмысленно, поскольку одно и то же физическое явление может учитываться несколько раз.
  • Неаддитивные параметры не комбинируются в любом измерении, обычно потому, что выбранная формула не позволяет объединить средние значения низкого уровня в среднем значении более высокого уровня.

Аддитивные и неаддитивные параметры могут описывать факты любого рода, в то время как полуаддитивные параметры, как правило, используются с мгновенными снимками или совокупными мгновенными снимками.

Запросы

Многомерная база данных естественным образом предназначена для определенных типов запросов.

  • Запросы вида slice-and-dice осуществляют выбор, сокращающий куб. К примеру, можно рассмотреть сечение куба на рис. 1, приняв во внимание только те ячейки, которые касаются хлеба, а затем еще больше сократить его, оставив ячейки, относящиеся только к 2000 году. Фиксация значения измерения сокращает размерность куба, но при этом возможны и более общие операции выбора.
  • Запросы вида drill-down и roll-up - взаимообратные операции, которые используют иерархию измерений и параметры для агрегирования. Обобщение до высших значений соответствует исключению размерности. Например, свертка от уровня «Город» до уровня «Страна» на рис. 2 агрегирует значения для Аалборга и Копенгагена в одно значение - Дания.
  • Запросы вида drill-across комбинируют кубы, которые имеют одно или несколько общих измерений. С точки зрения реляционной алгебры такая операция выполняет слияние (join).
  • Запросы вида ranking возвращает только те ячейки, которые появляются в верхней или нижней части упорядоченного определенным образом списка, например, 10 самых продаваемых продуктов в Копенгагене в 2000 году.
  • Поворот (rotating) куба дает пользователям возможность увидеть данные, сгруппированные по другим измерениям.

Реализация

Многомерные базы данных реализуют в двух основных формах.

  • Системы многомерной оперативной аналитической обработки (MOLAP) хранят данные в специализированных многомерных структурах. Системы MOLAP, как правило, содержат средства для обработки разреженных массивов и применяют усовершенствованную индексацию и хеширование для поиска данных при выполнении запросов .
  • Реляционные системы OLAP (ROLAP) для хранения данных используют реляционные базы данных, а также применяют специализированные индексные структуры, такие как битовые карты, чтобы добиться высокой скорости выполнения запросов.

Системы MOLAP, как правило, позволяют добиться более эффективного использования дискового пространства, а также меньшего времени ответов при обработке запросов.

Сокращение времени ответа при обработке запросов

Самые важные методы увеличения производительности в многомерных базах данных - это предвычисления (precomputation). Их специализированный аналог - предагрегирование (preaggregation), которое позволяет сократить время ответа на запросы, охватывающие потенциально огромные объемы данных, в степени, достаточной для проведения интерактивного анализа данных.

Вычисление и сохранение, или «материализация», сводных объемов продаж по странам и месяцам, - пример предагрегирования. Такой подход позволяет быстро получать ответы на запросы, касающиеся общего объема продаж, к примеру, в одном месяце, в одной стране или по кварталу и стране одновременно. Эти ответы можно получить из предварительно вычисленных данных и нет необходимости обращаться к информации, размещенной в хранилище данных.

Современные коммерческие реляционные базы данных, а также специализированные многомерные системы, содержат средства оптимизации запросов на основе предварительно вычисленных агрегатов (aggregate) и автоматического перевычисления хранимых агрегатов при обновлении базовых данных .

Полное предагрегирование - материализация всех сочетаний агрегатов - невозможно, поскольку требует слишком большого дискового пространства и времени на предварительные вычисления. Вместо этого современные системы OLAP следуют более практическому подходу к предагрегированию, материализуя только избранные комбинации агрегатов, а затем используя их для более эффективного вычисления других агрегатов . Повторное использование агрегатов требует поддержания корректной многомерной структуры данных.

Литература
  1. R. Winter, «Databases: Back in the OLAP Game», Intelligent Enterprise Magazine, vol. 1, no. 4, 1998
  2. E. Thomsen, G. Spofford, D. Chase, Microsoft OLAP Solutions, John Wiley & Sons, New York, 1999

Torben Bach Pedersen, Christian S. Jensen, Multidimensional Database Technology. IEEE Computer, December 2001. Copyright IEEE Computer Society, 2001. All rights reserved. Reprinted with permission.

Многомерный стационарный случайный процесс определяется как совокупность стационарных и стационарно связанных между собой случайных процессов . Такой процесс принято обозначать в виде случайного вектора-столбца, зависящего от времени:

.

Многомерные случайные процессы используются при описании многомерных (многоканальных) систем. В настоящем параграфе рассматривается задача цифрового моделирования нормальных многомерных стационарных случайных процессов. Результатом решения этой задачи, как и в одномерном случае, является алгоритм, позволяющий формировать на ЦВМ многомерные дискретные реализации заданного процесса. -мерный непрерывный нормальный стационарный случайный процесс задается обычно либо в виде его корреляционной матрицы

либо в виде спектральной матрицы

где - автокорреляционные (при ) и взаимно корреляционные (при ) функции случайных процессов - преобразование Фурье от . При этом, поскольку , элементы и спектральной матрицы комплексно-сопряженные,

.

Дискретные многомерные нормальные случайные процессы задаются аналогично непрерывным с помощью корреляционных и спектральных матриц (35, 70]

где , причем .

Задачу цифрового моделирования многомерного нормального случайного процесса целесообразно сформулировать следующим образом. Задана корреляционная или спектральная матрица случайного процесса. Требуется отыскать алгоритм для формирования на ЦВМ дискретных реализаций случайного процесса с заданными корреляционными (спектральными) свойствами.

Для решения этой задачи воспользуемся, как и ранее, идеей формирующего линейного фильтра. В рассматриваемом случае речь идет о синтезе многомерного формирующего фильтра.

Мерный линейный фильтр определяется как линейная динамическая система с входами и выходами . Если - входное воздействие и - реакция системы, то связь между входом и выходом -мерного линейного непрерывного фильтра описывается с помощью передаточной матрицы в виде

где и - изображения входного и выходного сигналов соответственно в смысле преобразования Лапласа; - передаточная матрица -мерного фильтра, у которой элементы являются передаточными функциями каналов -й вход - -й выход.

Аналогично описывается связь вход - выход в дискретных -мерных линейных фильтрах:

,

где и - изображения в смысле дискретного преобразования Лапласа входного и выходного сигналов; - передаточная матрица дискретного -мерного фильтра.

Структурная схема многомерного фильтра на примере двумерного фильтра приведена на рис. 2.9, согласно которому

(2.107)

Видим, что каждый из выходных сигналов и является суммой линейных операторов от входных сигналов и . Аналогичные соотношения имеют место и в общем случае. В этом и состоит идентификация передаточных матриц .

Пусть воздействие на входе -мерного линейного фильтра представляет собой -мерный белый шум, т. е. случайный процесс с корреляционной матрицей вида

для непрерывного времени и

для дискретного времени, где - дельта-функция. -мерный белый шум определен здесь как совокупность независимых между собой -коррелированных случайных процессов.

Можно показать (см., например, ), что при воздействии белого шума спектральная матрица процесса на выходе - мерного фильтра для непрерывного и дискретного времени соответственно связана с передаточной матрицей фильтра соотношениями

(2.108)

где символом обозначена транспонированная матрица.

Следовательно, для получения -мерного случайного процесса с заданной спектральной матрицей нужно пропустить -мерный белый шум через -мерный формирующий фильтр, передаточная матрица которого удовлетворяет уравнениям (2.108). Для нахождения передаточной матрицы по заданной спектральной матрице требуется разбиение последней на два сомножителя вида (2.108). Эта процедура называется факторизацией спектральных матриц. Она может быть реализована по известным алгоритмам .

Многомерная фильтрация белого шума осуществляется достаточно просто: каждая составляющая случайного процесса на выходе -мерного фильтра с передаточной матрицей получается путем суммирования по составляющих входного процесса , профильтрованных одномерными фильтрами с передаточными функциями [см. формулу (2.107)]. Алгоритмы одномерной фильтрации рассмотрены выше.

При данном способе моделирования возможны два пути: 1) заданную спектральную матрицу непрерывного -мерного случайного процесса можно непосредственно подвергнуть факторизации для получения передаточной матрицы непрерывного формирующего фильтра, а затем, используя описанные выше точные или приближенные методы дискретизации непрерывных, фильтров, осуществить многомерную фильтрацию непрерывного белого шума; 2) по заданной спектральной матрице непрерывного -мерного процесса , используя -преобразование, можно найти спектральную матрицу соответствующего дискретного случайного процесса (см. § 2.3), далее путем факторизации найти передаточную, функцию дискретного формирующего фильтра, а затем произвести многомерную фильтрацию дискретного белого шума.

Наибольшие трудности встречаются при факторизации спектральных матриц. В настоящее время разработаны алгоритмы факторизации лишь рациональных спектральных матриц, т. е. таких матриц, элементы которых являются дробно-рациональными функциями аргументов или .

Опишем, опуская доказательства, один из алгоритмов факторизации рациональных спектральных матриц, взятый из .

Пусть задана рациональная спектральная матрица

.

Матрица может быть приведена к виду

путем следующих преобразований.

1. Определяется ранг матрицы , затем один из главных миноров порядка располагается в левом верхнем углу матрицы .

2. Матрица приводится к диагональному виду. Для этого к -й строке матрицы , , прибавляется первая строка, умноженная на - , затем к -му столбцу прибавляется первый столбец, умноженный на ; получается матрица

, (2.109)

где элементы матрицы

имеют вид

(2.110)

С матрицей проделываются те же преобразования, что с исходной матрицей . При продолжении этого процесса на -м шаге получается диагональная матрица

такая, что .

3. Находится вспомогательная матрица

элементы которой имеют следующий вид:

(2.111)

где определяются из рекуррентных соотношений

(2.112)

4. Находятся вспомогательные полиномы

где - нули полиномов , лежащих в нижней полуплоскости, считаемые столько раз, какова их максимальная кратность, причем - знаменатели дробно-рациональных функций, представляющих собой элементы матрицы :

.

5. По способу, рассмотренному в § 2.9, п. 2, дробно-рациональные функции

представляются в виде

,

где полиномы и не имеют нулей в нижней полуплоскости.

На этом процесс факторизации заканчивается. Окончательно передаточная матрица формирующего фильтра записывается в виде

(2.113)

Здесь описан алгоритм факторизации рациональных спектральных матриц непрерывных многомерных процессов. Факторизация спектральных матриц дискретных процессов осуществляется аналогично, только вместо корней, расположенных в нижней полуплоскости, берутся корни, расположенные в единичном круге.

Пример 1. Пусть задан двумерный непрерывный стационарный центрированный случайный процесс с корреляционной матрицей

, (2.114)

где - некоторые положительные константы, причем .

Корреляционная матрица, соответствующая спектральной матрице (2.114), имеет вид

, (2.115)

где и - автокорреляционные и взаимно корреляционный моменты процессов и соответственно; - коэффициент взаимной корреляции процессов и совпадающие моменты времени. Коэффициенты и представляют собой в данном случае ширину (на уровне 0,5) энергетических спектров и взаимного энергетического спектра процессов и .

Требуется произвести факторизацию спектральной матрицы (2.114) для получения передаточной матрицы формирующего фильтра.

Будем осуществлять процедуру факторизации поэтапно в соответствии с приведенным выше алгоритмом факторизации.

1. В данном случае ранг спектральной матрицы .

2. Для приведения матрицы к диагональной требуется один шаг. По формулам (2.109) и (2.110) получаем

.

3. В соответствии с выражениями (2.111) и (2.112) вспомогательная матрица имеет вид

4. В рассматриваемом случае нужно найти лишь один вспомогательный полином . Для этого требуется найти корни знаменателя у элемента матрицы , т. е. корни полинома . Эти корни равны

Следовательно,

.

5. На заключительном этапе требуется произвести факторизацию дробно-рациональных функций

В данном случае корни числителей и знаменателей у дробно-рациональных функций и легко вычисляются. Используя корни, лежащие в верхней полуплоскости (корни с положительными мнимыми частями), получим и к переменной :

.

На рис. 2.9 показана структурная схема двумерного формирующего фильтра, на выходе которого образуется двумерный случайный процесс с требуемыми спектральными характеристиками, если на вход фильтра воздействует белый шум. Заменяя непрерывный двумерный фильтр соответствующим дискретным фильтром, получим алгоритм для формирования на ЦВМ дискретных реализаций двумерного случайного нормального процесса, т. е. дискретных реализаций двух стационарных и стационарно-связанных нормальных случайных процессов с экспоненциальными авто- и взаимно корреляционными функциями вида (2.115).

При другом подходе к синтезу формирующего фильтра нужно сначала найти спектральную матрицу соответствующего дискретного многомерного случайного процесса . В рассматриваемом примере эта матрица имеет вид

И матрицы (2.116).

Рассмотренный пример показывает, что факторизация спектральных матриц осуществляется сравнительно просто, если удается аналитически найти нули соответствующих полиномов. При факторизации спектральной матрицы непрерывного двумерного процесса это не представляло труда, так как для определения нулей требовалось решать только квадратные и биквадратные уравнения. При факторизации спектральной матрицы дискретного двумерного процесса были квадратные уравнения и возвратное уравнение четвертой степени, также допускающее аналитическое решение.

В других, более сложных случаях нули полинома не всегда удается найти аналитически. В этих случаях прибегают к численным методам решения уравнений - й степени. В общем виде процесс факторизации можно реализовать на ЦВМ как стандартную программу. Для этой цели кроме приведенного здесь могут быть использованы и другие алгоритмы факторизации .

Следует заметить, что все существующие в настоящее время алгоритмы факторизации спектральных матриц, вообще говоря, весьма трудоемки.

© 2005 г. А. И. Саичев*, С. Г. Уткин*

ПЕРЕХОД МНОГОМЕРНЫХ СКАЧКООБРАЗНЫХ ПРОЦЕССОВ ОТ АНОМАЛЬНОЙ К ЛИНЕЙНОЙ ДИФФУЗИИ

Рассматриваются многомерные процессы "квазианомальных" случайных блужданий, имеющие линейно-диффузионную асимптотику на больших временах и подчиняющиеся аномально-диффузионным закономерностям на промежуточных (также достаточно больших относительно микроскопических масштабов) временах. Демонстрируется переход скачкообразного процесса от аномальной к линейной диффузии. С помощью численного счета подтверждается справедливость аналитических расчетов для двумерного и трехмерного случаев. , .....

Ключевые слова: аномальная субдиффузия, аномальная супердиффузия, уравнения в частных дробных производных, промежутоная асимптотика, квазианомальные случайные блуждания.

1. ВВЕДЕНИЕ

Главным признаком аномальной диффузии служит нелинейный рост среднего квадрата случайного процесса со временем: >г: V» „

характерный, например, для таких физических явлений, как турбулентная диффузия , хаотическая динамика гамильтоновых систем , , перенос заряда в аморфных полупроводниках и др. Динамика подобных явлений адекватно моделируется скачкообразными случайными процессами с теми или иными распределениями / (г) интервалов между скачками и распределениями w(x) величины скачков.

Известно также, что аномальная диффузия возникает из-за нарушения центральной предельной теоремы (ЦПТ) или закона больших чисел (ЗБЧ) (см., например, ). В свою очередь, неприменимость ЗБЧ обусловлена бесконечностью первых моментов времени ожидания скачков, а нарушение ЦПТ связано с бесконечностью вторых моментов скачков. Эти обстоятельства служат объектом критики теории аномальной диффузии со стороны физиков, справедливо замечающих, что для большинства физических явлений указанные моменты ограничены.

"Нижегородский государственный университет, Нижний Новгород, Россия. E-mail: [email protected]; [email protected]

Цена 18 ^уб. Переплет 1 р.

456 А. И. САИЧЕВ, С. Г. УТКИН;

Целью данной работы является демонстрация того факта, что аномальная субдиффузия может возникать и в "классическом случае", когда ЗБЧ и ЦПТ справедливы. А именно, наряду с детально исследованными "чисто" аномальными диффузионными процессами существуют и "квазианомальные" случайные процессы, подчиняющиеся законам линейной диффузии на очень больших временах и пространственных масштабах, а на "промежуточных" временах демонстрирующие универсальные аномально-диффузионные асимптотики. Данная работа посвящена анализу именно таких квазианомальных случайных процессов в пространствах разной размерности. Обнаружено, в частности, что, в отличие от классической многомерной диффузии, случайные координаты аномально-диффузионного скачкообразного процесса статистически зависимы даже при независимых компонентах векторов случайных скачков.

2. СЛУЧАЙНЫЕ БЛУЖДАНИЯ

Рассмотрим типичный процесс случайных блужданий, подчиняющийся простейшему стохастическому уравнению чч-.

*-----. < к 1

Без ограничения общности предположим, что случайные интервалы ожидания скачков т~к = tk - ifc-i и сами случайные скачки hk взаимно независимы, а также имеют одинаковые распределения /(т) и w(x), соответственно. Очевидно, что

где N(t) - число скачков к моменту t. Это функция, обратная времени n-го скачка Т(п):

t = T(n) = ] " "

Используя очевидное соотношение эквивалентности для этих функций ~ !! N(t)^n T{n)

и разбиение единицы - м. .„ >».. л ■ >.

1= ^IIn(z) = ^, z>0, "У ■

где x(z) - функция ступеньки, выведем уравнение для характеристической функции рассматриваемого процесса X (f):

©(«; t) = (¿»ХМ) = £ /ехр (ш £ hk) V п=0 ^ ^ fc=1 " "

Цена 18 дуб. Переплет Í р.

■го) аномальная субдиф-и ЦПТ справедливы. А ми диффузионными про-л, подчиняющиеся зако-анственных масштабах, ьные аномально-диффу-но таких квазианомаль-1. Обнаружено, в част-I, случайные координа-гически зависимы даже

шяющиися простеише-

1лы ожидания скачков а также имеют одина-)

1ени п-го скачка Т(п):

г > О, ^ " ической функции рас-

ПЕРЕХОД МНОГОМЕРНЫХ СКАЧКООБРАЗНЫХ ПРОЦЕССОВ. ..

Применим к обеим частям равенства преобразование Лапласа и просуммируем полученную геометрическую прогрессию:

Найденное выражение для лаплас-образа 0(u; s) характеристической функции представляет собой многомерный аналог уравнения Монтролла-Вейсса . Здесь f(s) -лаплас-образ распределения интервалов между скачками, a w(u) - характеристическая функция скачков. Из последнего равенства видно, что Q(u; s) подчиняется уравнению

0(u;s) - w(u)Q(u;s) =

........... ÎM (2-2)

Применив к нему обратные преобразования Фурье и Лапласа, легко получить (в зависимости от вида распределений /(г) и w(x)) как классическое уравнение Колмогоро-ва-Феллера, так и кинетические уравнения аномальной диффузии.

3. АСИМПТОТИЧЕСКИЕ УРАВНЕНИЯ ДЛЯ ПЛОТНОСТИ ВЕРОЯТНОСТЕЙ БЛУЖДАНИЙ X(t)

Как уже было отмечено выше, вид уравнения для плотности вероятностей W(x; t) зависит от вида распределений /(г) и tu (ж), а точнее - от их лаплас-образа f(s) и характеристической функции w(u). Далее будут получены асимптотические уравнения для W(x; t), справедливые на различных временных масштабах, в случае распределения/(г) с лаплас-образом

V "I + sp " >

где S - малый параметр. Все моменты /(г) ограничены, что делает его физически более корректным, нежели родственное ему дробно-экспоненциальное распределение - (отвечающее значению 6 = 0), являющееся одним из ключевых в теории аномальной диффузии. Рассмотрим случай, когда параметр 6 мал настолько, что временной интервал между 1 и 1/(5 достаточно велик. Тогда процесс X(t) проходит последовательно три стадии. Вначале, на временах t 1, поведение процесса зависит от тонкой структуры распределений / (г) ию(х) ияе отражает универсальных законов диффузии. Далее, на временах между 1 и 1/6, за счет медленно спадающих степенных хвостов распределения /(т) процесс подчиняется аномально-диффузионным законам. Затем, при t 3> 1/6, процесс подчиняется нормальному линейно-диффузионному закону благодаря экспоненциально убывающим при т 1/6 хвостам распределения /(г).

Подставим f(s) (3.1) в уравнение (2.2) и обсудим его асимптотику при s 1, что соответствует вероятностным свойствам скачкообразного процесса на больших временах.

Применительно к лаплас-образу распределения /(т) выделим случай s оо, а также случай 6 s 1, ответственный за "промежуточный" режим 1

Цена 18 ^уб. Переплет 1 р.

и (2.2) примет вид

А. И. САИЧЕВ, С. Г. УТКИН

в ©(«;«) + - ш(«)]в(«; 5) = 1,

а во втором/(в) ~ 1 - (1 + 8$) и, соответственно,

«"§(«; э) + (1 + - й(«)]в(и; «) = в"-1.

Применяя к полученным равенствам обратное преобразование Фурье и Лапласа, придем к уравнению Колмогорова-Феллера

> + [цг{х.^ _ * Ц*)] = < оо,

или к обобщенному уравнению Колмогорова-Феллера

А+б0)т*м) - ж{х-л)*ю(,х)} = 1«*«

характерной, например, для многомерного нормального распределения с независимыми координатами и одинаковой дисперсией а2 по всем осям. Тогда из приведенных выше уравнений вытекают соответственно уравнения линейной и аномальной диффузии для разных временных асимптотик:

е- л ".(< "■

т? 2ч* "" ч"#""" " г(1 -0)

Решение первого из них хорошо известно:

хШх), !«*<-. (3.3)

* " И" (х О- (1 + 1 + -

где п - размерность пространства случайного процесса. Решение второго уравнения приведено в следующем разделе.

Для того ч в п-мерном щ

компонентам ного аргуме! /3-устойчиво

Многомерна таг-Леффле

Таким обрг диффузии }