Каноническая матрица пример. Приведение к каноническому виду

Определение. Многочленной матрицей или -матрицей называется прямоугольная матрица, элементы которой являются многочленами от одного переменногос числовыми коэффициентами.

Над -матрицами можно совершать элементарные преобразования. К ним относятся:


Две -матрицы
и
одинаковых размеров называются эквивалентными:
, если от матрицы
к
можно перейти с помощью конечного числа элементарных преобразований.

Пример. Доказать эквивалентность матриц

,

.

Решение.


.


.

    Умножим вторую строку на (–1) и заметим, что

.


.

Множество всех -матриц данных размеров
разбивается на непересекающиеся классы эквивалентных матриц. Матрицы, эквивалентные между собой, образуют один класс, не эквивалентные – другой.

Каждый класс эквивалентных матриц характеризуется канонической, или нормальной, -матрицей данных размеров.

Определение. Канонической, или нормальной, -матрицей размеров
называется-матрица, у которой на главной диагонали стоят многочлены, гдер – меньшее из чисел m и n (
), причем не равные нулю многочлены имеют старшие коэффициенты, равные 1, и каждый следующий многочлен делиться на предыдущий. Все элементы вне главной диагонали равны 0.

Из определения следует, что если среди многочленов имеются многочлены нулевой степени, то они в начале главной диагонали. Если имеются нули, то они стоят в конце главной диагонали.

Матрица
предыдущего примера есть каноническая. Матрица

также каноническая.

Каждый класс -матриц содержит единственную каноническую-матрицу, т.е. каждая-матрица эквивалентна единственной канонической матрице, которая называется канонической формой или нормальной формой данной матрицы.

Многочлены, стоящие на главной диагонали канонической формы данной -матрицы, называются инвариантными множителями данной матрицы.

Один из методов вычисления инвариантных множителей состоит в приведении данной -матрицы к канонической форме.

Так, для матрицы
предыдущего примера инвариантными множителями являются

,
,
,
.

Из сказанного следует, что наличие одной и той же совокупности инвариантных множителей является необходимым и достаточным условием эквивалентности -матриц.

Приведение -матриц к каноническому виду сводится к определению инвариантных множителей

,
;
,

где r – ранг -матрицы;
– наибольший общий делитель миноровk -го порядка, взятый со старшим коэффициентом, равным 1.

Пример. Пусть дана -матрица

.

Решение. Очевидно, наибольший общий делитель первого порядка D 1 =1, т.е.
.

Определим миноры второго порядка:

,

Уже этих данных достаточно для того, чтобы сделать вывод: D 2 =1, следовательно,
.

Определяем D 3

,

Следовательно,
.

Таким образом, канонической формой данной матрицы является следующая -матрица:

.

Матричным многочленом называется выражение вида

где – переменное;
– квадратные матрицы порядкаn с числовыми элементами.

Если
, тоS называют степенью матричного многочлена, n – порядком матричного многочлена.

Любую квадратичную -матрицу можно представить в виде матричного многочлена. Справедливо, очевидно, и обратное утверждение, т.е. любой матричный многочлен можно представить в виде некоторой квадратной-матрицы.

Справедливость данных утверждений со всей очевидностью вытекает из свойств операций над матрицами. Остановимся на следующих примерах:

Пример. Представить многочленную матрицу

в виде матричного многочлена можно следующим образом

.

Пример. Матричный многочлен

можно представить в виде следующей многочленной матрицы (-матрицы)

.

Эта взаимозаменяемость матричных многочленов и многочленных матриц играет существенную роль в математическом аппарате методов факторного и компонентного анализа.

Матричные многочлены одинакового порядка можно складывать, вычитать и умножать аналогично обычным многочленам с числовыми коэффициентами. Следует, однако, помнить, что умножение матричных многочленов, вообще говоря, не коммутативно, т.к. не коммутативно умножение матриц.

Два матричных многочлена называются равными, если равны их коэффициенты, т.е. соответствующие матрицы при одинаковых степенях переменного .

Суммой (разностью) двух матричных многочленов
и
называется такой матричный многочлен, у которого коэффициент при каждой степени переменногоравен сумме (разности) коэффициентов при той же степенив многочленах
и
.

Чтобы умножить матричный многочлен
на матричный многочлен
, нужно каждый член матричного многочлена
умножить на каждый член матричного многочлена
, сложить полученные произведения и привести подобные члены.

Степень матричного многочлена – произведения

меньше или равна сумме степеней сомножителей.

Операции над матричными многочленами можно осуществлять с помощью операций над соответствующими -матрицами.

Чтобы сложить (вычесть) матричные многочлены, достаточно сложить (вычесть) соответствующие -матрицы. То же относится к умножению.-матрица произведения матричных многочленов равна произведению-матриц сомножителей.

Пример.

С другой стороны
и
можно записать в виде

Так как умножение матриц не коммутативно, для матричных многочленов определяются два деления с остатком – правое и левое.

Пусть даны два матричных многочлена порядка n

где В 0 – невырожденная матрица.

При делении
на
существует однозначно определенное правое частное
и правый остаток

где степень R 1 меньше степени
, или
(деление без остатка), а также левое частное
и левый остаток

где степень
меньше степени
, или
=0 (деление без остатка).

Обобщённая теорема Безу. При делении матричного многочлена
на многочлен
правый остаток равен правому значению делимого
при
, т.е. матрице

а левый остаток – левому значению делимого
при
, т.е. матрице

Доказательство. Доказательство справедливости обеих формул (3.4.1) и (3.4.2) осуществляется одинаково, непосредственной подстановкой. Докажем одну из них.

Итак, делимое –
, делитель –
, в качестве частного имеем многочлен

Определим произведение
:

или

что и требовалось доказать.

Следствие.
делится справа (слева) на многочлен
тогда и только тогда, когда
равно 0.

Пример. Показать, что матричный многочлен

делится на матричный многочлен
,

где
, слева без остатка.

Решение. В самом деле, справедливо равенство

Где


Подсчитаем значение левого остатка по теореме Безу

Раздел 3. Матрицы

3.1 Основные понятия

Матрицей называется прямоугольная таблица чисел, содержащая т строк одинаковой длины (или п столбцов одинаковой длины). Матрица записывается в виде:

или, сокращенно,
, где
(т.е.
) – номер строки,
(т.е.
) – номер столбца.

Матрицу А называют матрицей размера
и пишут
. Числа, составляющие матрицу, называются ее элементами. Элементы, стоящие на диагонали, идущей из верхнего левого угла, образуют главную диагональ.

Пример 1. Элемент
расположен в 1-й строке и 2-м столбце, а элементнаходится в 3-й строке и 1-м столбце.

Пример 2. Матрица
имеет размер
, так как она содержит 2 строки и 4 столбца. Матрица
имеет размер
, так как она содержит 3 строки и 2 столбца.

Матрицы равны между собой, если равны все соответствующие элементы этих матриц, т.е.
, если
, где
,
.

Матрица, у которой число сток равно числу столбцов, называется квадратной . Квадратную матрицу размера
называют матрицей п-го порядка.

Пример 3. Матрицы ииз примера 2 называются прямоугольными. Матрица
– это квадратная матрица 3-го порядка. Она содержит 3 строки и 3 столбца.

Квадратная матрица, у которой все элементы, кроме элементов главной диагонали, равны нулю, называется диагональной . Диагональная матрица, у которой каждый элемент главной диагонали равен единице, называется единичной. Обозначается буквой Е .

Пример 4.
– единичная матрица 3-го порядка.

Квадратная матрица называется треугольной , если все элементы, расположенные по одну сторону от главной диагонали, равны нулю. Матрица, все элементы которой равны нулю, называется нулевой . Обозначается буквой О .

В матричном исчислении матрицы О и Е играют роль 0 и 1 в арифметике.

,
.

Матрица размера
, состоящая из одного числа, отождествляется с этим числом, т.е.
есть 5.

Матрица, полученная из данной, заменой каждой ее строки столбцом с тем же номером, называется матрицей, транспонированной к данной. Обозначается
. Так, если
, то
если
, то
. Транспонированная матрица обладает следующим свойством:
.

3.2 Операции над матрицами

Сложение

Операция сложения матриц вводится только для матриц одинаковых размеров.

Суммой двух матриц
и
называется матрица
такая, что
(
,
).

Пример 5. .

Аналогично определяется разность матриц.

Умножение на число

Произведением матрицы
на число k называется матрица
такая, чтоb ij = ka ij (i =
,
j =).

Пример 6.
,
,
.

Матрица
называетсяпротивоположной матрице А.

Разность матриц
можно определить так:
.

Операции сложения матриц и умножение матрицы на число обладают следующими свойствами:


где А , В , С – матрицы, α и β – числа.

Элементарные преобразования матриц

Элементарными преобразованиями матриц являются:

      перестановка местами двух параллельных рядов матрицы;

      умножение всех элементов ряда матрицы на число, отличное от нуля;

      прибавление ко всем элементам ряда матрицы соответствующих элементов параллельного ряда, умноженных на одно и то же число.

Две матрицы А и В называются эквивалентными , если одна из них получается из другой с помощью элементарных преобразований. Записывается А ~В .

При помощи элементарных преобразований любую матрицу можно привести к матрице, у которой в начале главной диагонали стоят подряд несколько единиц, а все остальные элементы равны нулю. Такую матрицу называют канонической , например
.

Пример 7. Привести к каноническому виду матрицу
.

Решение: Выполняя элементарные преобразования, получаем

(поменяли местами I и III столбцы) ~
(I строку сложили со II строкой и результат записали во вторую строку; после этого I строку сложили с III строкой и результат записали в третью строку) ~
(I столбец умножили на (-3), сложили со II столбцом и результат записали во II столбец; затем I столбец умножили на (-2), сложили с III столбцом и результат записали в III столбец; после этого I столбец снова умножили на (-2) и сложили с IV столбцом, а результат записали в IV столбец) ~
(III столбец умножили на (-2), сложили со II столбцом и результат записали во II столбец; III столбец разделили на 2 и результат записали в III столбец; III столбец умножили на (-1), сложили с IV столбцом и результат записали в IV столбец) ~
(II строку умножили на 3, сложили с III строкой и результат записали в III строку) ~
(II столбец умножили на (-1), сложили последовательно с III и IV столбцами и результат записали соответственно в III и IV столбец) ~
. Получили матрицу канонического вида.

Произведение матриц

Операция умножения двух матриц вводится только для случая, когда число столбцов первой матрицы равно числу строк второй матрицы.

Произведением матрицы А т×п =(а ij ) на матрицу В п×р =(b jk ) называется матрица С т×р =(с ik ) такая, что

c ik = a i 1 b 1 k + a i 2 b 2 k + ∙∙∙+ a in b nk , где i =
,
k =
,

т.е. элемент i -ой строки и k -го столбца матрицы произведения С равен сумме произведений элементов i -ой строки матрицы А на соответствующие элементы k -го столбца матрицы В.

Если матрицы А и В квадратные одного размера, то произведения АВ и ВА всегда существуют. Легко показать, что А Е = Е А = А , где А – квадратная матрица, Е – единичная матрица того же размера.

Пример 4.

=.

Матрицы А и В называются перестановочными (коммутирующими ), если АВ =ВА .

Умножение матриц обладает следующими свойствами:

    А ∙(В С ) = (А В )∙С ;

    А ∙(В + С ) = АВ + АС ;

    (А + В )∙С = АС + ВС ;

    α (АВ ) = (αА )В ,

если, конечно, написанные суммы и произведения матриц имеют смысл.

Для операции транспонирования верны свойства:

    (А + В ) Т =А Т + В Т;

    (АВ ) Т = В Т ∙А Т.

Если задан многочлен , томатричным многочленом f (A ) называется выражение вида , где
для любого натуральногоп . Значением матричного многочлена f (A ) при заданной матрице А является матрица.

Элемент строки назовем крайним , если он отличен от нуля, а все элементы этой строки, находящиеся левее его, равны нулю. Матрица называется ступенчатой , если крайний элемент каждой строки находится правее крайнего элемента предыдущей строки.

Пример 5. В матрицах А и В отмечены крайние элементы каждой строки:

–не ступенчатая

–ступенчатая

Говорят, что матрица размерности имеет канонический вид, если её можно разбить на четыре блока (некоторые из них могут оказаться пустыми), каждый из которых представляет собой подматрицуопределённого типа (подматрицей называется матрица, являющаяся частью исходной матрицы). Левый верхний блок – единичная матрица k -го порядка, два нижних блока – матрицы размерностей и , состоящие из нулей (на схеме эти матрицы обозначены большими жирными нулями). Правый верхний блок – произвольная матрица размерности . Число k > 0 и не превосходит чисел m и n .

Если , правые блоки отсутствуют, если , отсутствуют нижние (нулевые) блоки. Если , матрица состоит из одного (единичного) блока.

Приведём конкретные примеры матриц, имеющих канонический вид (точками обозначены те элементы матриц, конкретные значения которых роли не играют):

а) , б) , в) , г) .

В примере а) , (k совпадает с количеством строк), обе нулевые подматрицы отсутствуют; в примере б) (k совпадает с количеством столбцов), , оба правых блока отсутствуют, нулевая подматрица является матрицей-строкой; в примере в) , первая нулевая подматрица является матрицей-строкой, вторая нулевая подматрица состоит из одного элемента; в примере г) , , .

Часто в определении матрицы канонического вида вместо единичной подматрицы фигурирует треугольная подматрица. В этом случае говорят о матрице почти канонического вида. Поскольку единичная матрица – частный случай треугольной, матрицы канонического вида – частный случай матриц почти канонического вида. Если в схематическом изображении матрицы канонического вида единичную матрицу в левом верхнем блоке заменить треугольной, получится схемаматрицыпочти канонического вида.

Приведём примеры матриц, имеющих почти канонический вид:

а) , б) , в) , г) .

Следующие преобразования матриц называются допустимыми : перестановка строк; перестановка столбцов; умножение элементов строки матрицы на одно и то же число, отличное от нуля; прибавление к одной из строк матрицы другой строки, предварительно умноженной на некоторое число (в частности, вычитание одной строки из другой и прибавление одной строки к другой). Как будет показано далее, допустимые преобразования матриц отвечают тем действиям с системами линейных уравнений, которые не нарушают равносильности.

При помощи допустимых преобразований любую матрицу A можно привести к матрице , имеющей канонический вид .

Приведение матрицы к каноническому виду можно разбить на этапы, каждый из которых состоит из двух шагов – получения очередной единицы на главной диагонали и превращения соответствующего столбца в единичный столбец, то есть такой, у которого все элементы, за исключением диагонального, равны нулю.

Первый шаг осуществляется следующим образом. Если рассматриваемый диагональный элемент равен единице, переходим ко второму шагу. Если диагональный элемент не равен единице, но отличен от нуля, поделим на него все элементы его строки. Если диагональный элемент равен нулю, то поищем ненулевой элемент, расположенный либо в его (диагонального элемента) столбце, но ниже, либо в его строке, но правее, либо ниже и правее одновременно. Если такой элемент найдётся, сделаем его диагональным, переставив соответствующие строки (в первом случае), или столбцы (во втором), или строки и столбцы по очереди (в третьем). Если же такого элемента не найдётся, это будет означать, что процесс закончен.

Если первый шаг выполнен, а столбец, в котором стоит новый единичный диагональный элемент, содержит другой ненулевой элемент, прибавим к его строке строку диагонального элемента, умноженную на подлежащий уничтожению элемент, взятый с противоположным знаком.

Рассмотрим пример приведения матрицы к каноническому виду.

~ ~ ~

Первый диагональный Первый диагональный

элемент равен нулю. элемент отличен от нуля.

~ ~ ~ ~

Первый диагональный

элемент стал равным единице

~ ~ ~ ~

1. Выясним сначала, к какому сравнительно простому виду можно привести прямоугольную многочленную матрицу путем применения одних только левых элементарных операций.

Допустим, что в первом столбце матрицы имеются элементы, не равные тождественно нулю. Возьмем среди них многочлен наименьшей степени и путем перестановки строк сделаем его элементом . После этого разделим многочлен на ; частное и остаток обозначим через и

Вычтем теперь из -й строки первую строку, предварительно умноженную на . Если при этом не все остатки равны тождественно нулю, то тот из них, который не равен нулю и имеет наименьшую степень, может быть перестановкой строк поставлен на место . В результате всех этих операций степень многочлена понизится.

Теперь мы снова повторим этот процесс и т. д. Так как степень многочлена конечна, то на некотором этапе этот процесс уже нельзя будет продолжить, т. е. на этом этапе все элементы окажутся равными тождественно нулю.

После этого возьмем элемент и применим ту же процедуру к строкам с номерами . Тогда добьемся того, что и . Продолжая так далее, мы в конце концов приведем матрицу к следующему виду:

(5)

Если многочлен не равен тождественно нулю, то, применяя левую элементарную операцию второго типа, мы сделаем степень элемента меньшей, нежели степень (если имеет нулевую степень, то станет тождественно равен нулю). Точно так же, если , то при помощи левых элементарных операций второго типа мы сделаем степени элементов меньшими, нежели степень , не изменив при этом элемента , и т. д.

Мы установили следующую теорему:

Теорема 1. Произвольная прямоугольная многочленная матрица с размерами при помощи левых элементарных операций всегда может быть приведена к виду (5), где многочлены имеют меньшую степень, нежели , если только , и все равны тождественно нулю, если .

Совершенно аналогично доказывается

Теорема 2. Произвольная прямоугольная многоценная матрица с размерами при помощи правых элементарных операций всегда может быть приведена к виду

(6)

где многочлены имеют меньшую степень, нежели , если только , и все равны тождественно нулю, если .

2. Из теорем 1 и 2 вытекает следующее

Следствие. Если определитель квадратной многоценной матрицы не зависит от и отличен от нуля, то эту матрицу можно представить в виде произведения конечного числа элементарных матриц.

Действительно, согласно теореме 1 матрицу при помощи левых элементарных операций можно привести к виду

(7)

где – порядок матрицы . Так как при применении элементарных операций к квадратной многочленной матрице определитель этой матрицы умножается лишь на постоянный отличный от нуля множитель, то определитель матрицы (7), как и определитель , не зависит от и отличен от нуля, т. е.

.

Но тогда в силу той же теоремы 1 матрица (7) имеет диагональный вид и потому может быть приведена при помощи левых элементарных операций типа 1 к единичной матрице . Тогда и обратно, единичную матрицу можно привести к при помощи левых элементарных операций с матрицами . Следовательно,

Из доказанного следствия получаем (см. стр. 137 – 138) равносильность двух определений 2 и 2" эквивалентности многочленных матриц.

3. Вернемся к нашему примеру системы дифференциальных уравнений (4). Применим теорему 1 к матрице операторных коэффициентов . Тогда, как было указано на стр. 138, система (4) заменится равносильной системой

(4")

где . В этой системе мы функции можем выбрать произвольно, после чего последовательно определятся функции , причем на каждом этапе этого определения приходится интегрировать одно дифференциальное уравнение с одной неизвестной функцией.

4. Перейдем теперь к установлению «канонического» вида, к которому можно привести прямоугольную многочленную матрицу , применяя к ней как левые, так и правые элементарные операции.

Среди всех не равных тождественно нулю элементов матрицы возьмем тот элемент, который имеет наименьшую степень относительно , и путем соответствующей перестановки строк и столбцов сделаем его элементом . После этого найдем частные и остатки от деления многочленов и на :

Если хотя бы один из остатков , например , не равен тождественно нулю, то, вычитая из -го столбца первый столбец, предварительно помноженный на , мы заменим элемент остатком , который имеет меньшую степень, нежели . Тогда мы имеем возможность снова уменьшить степень элемента, стоящего в левом верхнем углу матрицы, поместив на это место элемент с наименьшей степенью относительно .

Если же все остатки ; равны тождественно нулю, то, вычитая из -й строки первую, помноженную предварительно на , а из -го столбца – первый, предварительно помноженный на , мы приведем нашу многочленную матрицу к виду

Если при этом хотя бы один из элементов не делится без остатка на , то, прибавляя к первому столбцу тот столбец, который содержит этот элемент, мы придем к предыдущему случаю и, следовательно, снова сможем заменить элемент многочленом меньшей степени., мы матрицу (8) приведем к виду строк на соответствующие отличные от нуля числовые множители, мы сможем добиться того, чтобы старшие коэффициенты многочленов, и установим формулы, связывающие эти многочлены с элементами матрицы .



Последние материалы раздела:

Развитие критического мышления: технологии и методики
Развитие критического мышления: технологии и методики

Критическое мышление – это система суждений, способствующая анализу информации, ее собственной интерпретации, а также обоснованности...

Онлайн обучение профессии Программист 1С
Онлайн обучение профессии Программист 1С

В современном мире цифровых технологий профессия программиста остается одной из самых востребованных и перспективных. Особенно высок спрос на...

Пробный ЕГЭ по русскому языку
Пробный ЕГЭ по русскому языку

Здравствуйте! Уточните, пожалуйста, как верно оформлять подобные предложения с оборотом «Как пишет...» (двоеточие/запятая, кавычки/без,...