# Determinants

**Определитель**, или **детерминант**, представляет собой важную числовую характеристику квадратной матрицы. Определителем матрицы называется **полилинейная кососимметричная** функция от строк матрицы. Точнее говоря, определитель — это функция $\det \colon \mathbb R^{n\times n} \to \mathbb R$, удовлетворяющая трём аксиомам:

1. (кососимметричность) $\det \boldsymbol B = -\det \boldsymbol A$, если матрица $\boldsymbol B$ получена перестановкой каких-либо двух строк матрицы $\boldsymbol A$;

2. (полилинейность) определитель линеен по каждой строке: 
    
    * если матрица $\boldsymbol B$ получена из матрицы $\boldsymbol A$ умножением некоторой её строки на число $\lambda$, то $\det \boldsymbol B = \lambda \det \boldsymbol A$;

    * если $i$-я строка матрицы $\boldsymbol A$ равна сумме $i$-ых строк матриц $\boldsymbol B$ и $\boldsymbol C$, а все остальные строки этих матриц совпадают, то $\det \boldsymbol A = \det \boldsymbol B + \det \boldsymbol C$.

3. (нормировка) $\det \boldsymbol I = 1$.

Можно показать, что существует только одна функция, удовлетворяющая этим трём свойствам.
Определитель матрицы $\boldsymbol A$ обозначают также $\vert \boldsymbol A\vert$.

## Properties of determinants

Из аксиом 1-3 напрямую выводятся следующие свойства определителя:

* $\det \boldsymbol A = 0$, если матрица $\boldsymbol A$ содержит нулевую строку или две пропорциональные строки;

* определитель не меняется при основном элементарном преобразовании вида

    $$
        \boldsymbol a_i^\top := \boldsymbol a_i^\top - \lambda \boldsymbol a_j^\top;
    $$

* $\det (\lambda\boldsymbol A) = \lambda^n \det \boldsymbol A$;

* определитель диагональной матрицы равен произведению диагональных элементов.

Перечислим ещё несколько широко используемых свойств детерминантов.

1. Определитель треугольной матрицы равен произведению диагональных элементов.

    ```{admonition} Proof
    :class: dropdown
    Если все элементы главной диагонали $u_1, \ldots, u_n$ треугольной матрицы $\boldsymbol U$ не равны нулю, то основными элементарными преобразованиями матрица $\boldsymbol U$ приводится к диагональному виду $\boldsymbol \Lambda = \mathrm{diag}\{u_1, \ldots, u_n\}$ с теми же самыми элементами на диагонали. Эти элементарные преобразования не меняют определитель, поэтому $\det \boldsymbol U = \det\boldsymbol \Lambda = u_1\cdot\ldots \cdot u_n$. 

    Если же хотя бы один диагональный элемент $u_k = 0$, то в ходе диагонализации методом Гаусса образуется нулевая строка, поэтому $\det \boldsymbol U = 0$.
    ```

2. $\det \boldsymbol A = 0$ тогда и только тогда, когда матрица $\boldsymbol A$ вырождена.
    ```{admonition} Proof
    :class: dropdown
    Прямой ход метода Гаусса превращает матрицу $\boldsymbol A$ в верхнюю треугольную матрицу $\boldsymbol U$, задействуя преимущественно основные элементарные преобразования; иногда к ним добавляются перестановки строк. Первые не меняют определитель, а вторые меняют его знак, поэтому
    $\det \boldsymbol A =\pm \det \boldsymbol U$. Матрица $\boldsymbol A \in \mathbb R^{n\times n}$ невырождена тогда и только тогда, когда $\mathrm{rank}(\boldsymbol A) = \mathrm{rank}(\boldsymbol U) = n$, что свою очередь эквивалентно тому, что все диагональные элементы матрицы $\boldsymbol U$ не равны нулю. Таким образом, наше утверждение следует из предыдущего свойства.
    ``` 

3. $\vert\boldsymbol{AB}\vert = \vert\boldsymbol{A}\vert \cdot \vert\boldsymbol{B}\vert$.
    ```{admonition} Proof
    :class: dropdown
    
    Если матрица $\boldsymbol B$ вырождена, то обе части доказываемого равенства равны нулю. В противном случае положим $D(\boldsymbol A) = \frac{\vert\boldsymbol{AB}\vert}{\vert\boldsymbol B\vert}$ и покажем, что функция $D(\boldsymbol A)$ удовлетворяет всем трём аксиомам, характеризующим определитель. 

    * Обмен строк матрицы $\boldsymbol A$ влечёт обмен тех же строк матрицы $\boldsymbol{AB}$, поэтому $\vert\boldsymbol{AB}\vert $ меняет знак, и то же самое делает $D(\boldsymbol A)$.

    * При умножении $i$-й строки матрицы $\boldsymbol A$ на число $\lambda$ $i$-я строка матрицы $\boldsymbol{AB}$ тоже умножается на $\lambda$, что приводит к умножению $D(\boldsymbol A)$ на $\lambda$.

    * Если $i$-я строка матрицы $\boldsymbol A$ представлена в виде суммы двух строк, $\boldsymbol a_i^\top = \boldsymbol c^\top + \boldsymbol d^\top$, то $i$-я строка матрицы $\boldsymbol{AB}$ равна

        $$
        \boldsymbol a_i^\top \boldsymbol B = (\boldsymbol c^\top + \boldsymbol d^\top)\boldsymbol B = \boldsymbol c^\top \boldsymbol B + \boldsymbol d^\top \boldsymbol B.
        $$

        Если обозначить через $\boldsymbol C$ и $\boldsymbol D$ матрицы, полученные заменой $i$-й строки матрицы $\boldsymbol A$ на $\boldsymbol c^\top$ и $\boldsymbol d^\top$ соответствено, то получим

        $$
            D(\boldsymbol A) = \frac{\vert \boldsymbol{CB} \vert + \vert\boldsymbol{DB}\vert}{\vert \boldsymbol{B}\vert} =  D(\boldsymbol C) + D(\boldsymbol D).   
        $$

    * Наконец, $D(\boldsymbol I) = \frac{\vert\boldsymbol{B}\vert}{\vert\boldsymbol B\vert} = 1$.
    ```  

4. $\det \boldsymbol A^\top = \det \boldsymbol A$.
    ```{admonition} Proof
    :class: dropdown
    Справедливо LU-разложение вида $\boldsymbol{PA} = \boldsymbol{LU}$. После транспонирования получаем $\boldsymbol A^\top \boldsymbol P^\top = \boldsymbol U^\top \boldsymbol L^\top$. Из предыдущего свойства вытекает, что

    $$
        \vert \boldsymbol P\vert \vert \boldsymbol A\vert = \vert \boldsymbol L\vert \vert \boldsymbol U\vert, \quad
        \vert \boldsymbol A^\top\vert \vert \boldsymbol P^\top\vert = \vert \boldsymbol U^\top\vert \vert \boldsymbol L^\top\vert.
    $$

    Заметим следующее:
    * $\det \boldsymbol L = \det \boldsymbol L^\top = 1$, так как нижняя треугольная матрица $\boldsymbol L$ содержит только единицы на главной диагонали;

    * $\det \boldsymbol U = \det \boldsymbol U^\top$, так как главные диагонали треугольных матриц $\boldsymbol U$ и $\boldsymbol U^\top$ совпадают;

    * $\det \boldsymbol P = \det \boldsymbol P^\top = \pm 1$, так как для матрицы перестановки $\boldsymbol P$ справедливо равенство $\boldsymbol P \boldsymbol P^\top = \boldsymbol I$.

    Следовательно, $\det \boldsymbol A^\top = \det \boldsymbol A$.
    ``` 

Инвариантность определителя относительно транспонирования означает, что во всех перечисленных выше свойствах детерминантов можно заменить «строки» на «столбцы», и утверждения останутся верными.

Из формулы для определителя произведения матриц вытекает, что детерминант обратной матрицы равен $\det \boldsymbol A^{-1} = \frac 1{\det \boldsymbol A}$.

## Oriented volume

У определителя есть любопытная геометрическая интерпретация в лице **ориентированного объёма**. Обозначим через $V(\boldsymbol u_1, \ldots, \boldsymbol u_n)$ объём параллелепипеда, построенного на векторах $\boldsymbol u_1, \ldots, \boldsymbol u_n \in \mathbb R^n$.
Если записать эти векторы в виде матрицы по столбцам, то оказывается, что модуль её определителя равен объёму параллелепипеда:

```{math}
:label: oriented-volume
V(\boldsymbol u_1, \ldots, \boldsymbol u_n) = \big\vert\det([\boldsymbol u_1 \ldots \boldsymbol u_n])\big\vert. 
```
    


Если же модуль не ставить, то получится ориентированный объём, или объём со знаком: он может быть как положительным, так и отрицательным в зависимости от того, как ориентирован набор векторов $\boldsymbol u_1, \ldots, \boldsymbol u_n$. 

Почему же формула {eq}`oriented-volume` вообще верна? Убедимся, что объём параллелепипеда на векторах удовлетворяет аксиомам определителя.

1. Обмен двух векторов местами, очевидно, не меняет значение объёма.

2. Если какое-то ребро параллелепипеда равно сумме двух других, то и объёмы складываются:

    $$
    V(\boldsymbol u_1, \ldots, \boldsymbol v + \boldsymbol w, \ldots \boldsymbol u_n) =  V(\boldsymbol u_1, \ldots, \boldsymbol v,\ldots,  \boldsymbol u_n) + V(\boldsymbol u_1, \ldots, \boldsymbol w, \ldots,  \boldsymbol u_n).
    $$

    А при умножении одного из рёбер на число $\alpha$ весь объём умножается на него:

    $$
    V(\boldsymbol u_1, \ldots, \alpha\boldsymbol u_i, \ldots, \boldsymbol u_n) = \alpha V(\boldsymbol u_1, \ldots, \boldsymbol u_i, \ldots, \boldsymbol u_n).
    $$

3. Наконец, объём единичного куба соответствует определителю единичной матрицы, и оба они равны единице.

## Big Formula

Иногда детерминант матрицы

$$
    \boldsymbol A  = \begin{pmatrix}
        a_{11} & a_{12} & \dots & a_{1n} \\
        a_{21} & a_{22} & \dots & a_{2n} \\
        \vdots & \vdots & \ddots & \vdots \\
        a_{n1} & a_{n2} & \dots & a_{nn} \\
    \end{pmatrix}
$$

определяют по явной формуле

```{math}
:label: big-formula
\det \boldsymbol A = \sum\limits_{\sigma \in S_n} (-1)^\sigma a_{1\sigma(1)}\ldots a_{n\sigma(n)}, 
```

где $S_n$ — множество [перестановок](https://ru.wikipedia.org/wiki/%D0%9F%D0%B5%D1%80%D0%B5%D1%81%D1%82%D0%B0%D0%BD%D0%BE%D0%B2%D0%BA%D0%B0) множества $\{1, 2, \ldots, n\}$, $(-1)^\sigma = +1$, если перестановка чётная и $-1$ в противном случае. 

**Упражнение**. Проверьте, что определение детерминанта по формуле {eq}`big-formula` согласуется с приведёнными выше аксиомами 1-3.

```{admonition} Proof
:class: dropdown

Линейность по строкам вытекает из самого вида формулы  {eq}`big-formula`, ведь элемент каждой строки входит в каждое слагаемое ровно один раз. 

Если $\boldsymbol A = \boldsymbol I$, то единственное ненулевое слагаемое в сумме  {eq}`big-formula` соответствует тождественной перестановке $\sigma$, поэтому вся сумма равна $1$.

Наконец, разберёмся с перестановкой строк. Формула  {eq}`big-formula` для матрицы, полученной обменом $i$-й и $j$-й строки матрицы $\boldsymbol A$, примет вид

$$
    \sum\limits_{\sigma \in S_n} (-1)^\sigma a_{1\sigma(1)}\ldots a_{i\sigma(j)} \ldots a_{j\sigma(i)} \ldots a_{n\sigma(n)}.
$$

В каждом слагаемом перестановка $\sigma$ отличается от перестановки в исходной формуле  {eq}`big-formula` лишь одной транспозицией. Добавление одной транспозиции меняет знак перестановки, поэтому знак каждого слагаемого должен измениться, и, следовательно, меняется знак всего определителя.
``` 

Формула  {eq}`big-formula` содержит $n!$ слагаемых, что делает её бесполезной для практики при хоть сколько-нибудь больших значениях $n$. Однако при малых $n$ она довольно удобна: имеем

$$
    \begin{vmatrix}
    a_{11} & a_{12} \\
    a_{21} & a_{22} 
    \end{vmatrix} = 
    a_{11}a_{22} - a_{12}a_{21},
$$

$$
    \begin{vmatrix}
    a_{11} & a_{12} & a_{13} \\
    a_{21} & a_{22} & a_{23} \\
    a_{31} & a_{32} & a_{33} \\
    \end{vmatrix} = 
    a_{11}a_{22}a_{33} + a_{12}a_{23}a_{31} + a_{13}a_{21}a_{32} - 
    a_{13}a_{22}a_{31} - a_{12}a_{21}a_{33} - a_{11}a_{23}a_{32}.
$$

## Cofactor formula

Определитель матрицы размера $3\times 3$ можно переписать как

$$
    a_{11}(a_{22}a_{33}-a_{23}a_{32}) + a_{12}(a_{23}a_{31} - a_{21}a_{33}) + a_{13}(a_{21}a_{32} - a_{22}a_{31}),
$$

или же как

$$
    a_{11}\begin{vmatrix}
    a_{22} & a_{23} \\
    a_{32} & a_{33} 
    \end{vmatrix} - a_{12}\begin{vmatrix}
    a_{21} & a_{23} \\
    a_{31} & a_{33} 
    \end{vmatrix} + a_{13}\begin{vmatrix}
    a_{21} & a_{22} \\
    a_{31} & a_{32} 
    \end{vmatrix}.
$$

Получилась сумма произведений элементов первой строки на **дополнительные миноры** — определители подматриц исходной матрицы, полученные вычёркиванием первой строки и столбца, в котором находится умножаемый на минор элемент. Заметим также, что второе слагаемое взято со знаком «минус». Такой способ подсчёта детерминанта называется **разложением по строке**. В общем случае справедливо равенство

```{math}
:label: cofactor-formula
    \begin{vmatrix}
        a_{11} & a_{12} & \dots & a_{1n} \\
        a_{21} & a_{22} & \dots & a_{2n} \\
        \vdots & \vdots & \ddots & \vdots \\
        a_{n1} & a_{n2} & \dots & a_{nn} \\
    \end{vmatrix} =
    \sum\limits_{j = 1}^n (-1)^{i+j}a_{ij} M_{ij},
```

где $M_{ij}$ — дополнительный минор, полученный вычёркиванием $i$-й строки и $j$-го столбца. Аналогичная формула справедлива и для **разложения по столбцу**.

**Упражнение**. Докажите формулу разложения детерминанта по строке, проверив, что для правой части равенства {eq}`cofactor-formula` выполняются аксиомы 1-3 определителя.

```{admonition} Proof
:class: dropdown

Заметим, то минор $M_{ij}$ не зависит от $i$-й строки матрицы $\boldsymbol A$ и линеен по всем остальным строкам (это же определитель). Следовательно, выражение $(-1)^{i+j}a_{ij} M_{ij}$ линейно по каждой строке матрицы $\boldsymbol A$, равно как и их сумма.

Если $\boldsymbol A = \boldsymbol I_n$, то

$$
    \sum\limits_{j = 1}^n (-1)^{i+j}a_{ij} M_{ij} = \sum\limits_{j = 1}^n (-1)^{i+j}\delta_{ij} M_{ij} = M_{ii} = \det \boldsymbol I_{n-1} = 1.
$$

На десерт у нас снова обмен строк. Если $i$-я строка не участвует в обмене, то знак каждого слагаемого в правой части {eq}`cofactor-formula` меняется за счёт изменения знака минора $M_{ij}$. Пусть теперь $i$-я строка обменялась с $k$-й, $i < k$. Тогда правая часть {eq}`cofactor-formula` превращается в

$$
    \sum\limits_{j=1}^n (-1)^{i+j}a_{kj} \widehat M_{ij},
$$

где минор $\widehat M_{ij}$ отличается от минора $M_{ij}$ тем, что на месте $k$-й строки у него
находится $i$-я. Переставляя соседние строки $k-i - 1$ раз, превратим минор $\widehat M_{ij}$ в $M_{kj}$, не забыв умножить на $(-1)^{k-i-1}$ за счёт смены знака при каждой перестановке. В итоге получаем, что

$$
    \sum\limits_{j=1}^n (-1)^{i+j}a_{kj} \widehat M_{ij} = 
    \sum\limits_{j=1}^n (-1)^{i+j}a_{kj} (-1)^{k-i-1} M_{kj} = 
    -\sum\limits_{j=1}^n (-1)^{k+j}a_{kj} M_{kj},
$$

то есть знак действительно поменялся в результате обмена строк.
```

Особенно удобно разлагать определитель по таким строкам/столбцам, которые содержат много нулей, поскольку число слагаемых в таком разложении равно количеству ненулевых элементов.

**Пример**. Вычислим определитель трёхдиагональной матрицы $\boldsymbol A_n$

$$
    D_n = \det \boldsymbol A_n = \begin{vmatrix}
		2 & -1 & 0 & 0 & \dots & 0 & 0 \\
		-1 & 2 & -1 & 0 & \dots & 0 & 0 \\
		0 & -1 & 2 & -1 &\dots & 0 & 0 \\
		\vdots & \vdots & \ddots & \ddots & \ddots & \vdots & \vdots \\
		0 & 0 & \dots & -1 & 2 & -1 & 0 \\
		0 & 0 & \dots & 0 & -1 & 2 & -1 \\
		0 & 0 & \dots & 0 & 0 & -1 & 2 \\
	\end{vmatrix}
$$

Имеем $D_1 = 2$, $D_2 = 4 -1 = 3$. Похоже, что $D_n = n+1$. Чтобы это доказать, выведем рекуррентную формулу для $D_n$, разложив его по первой строке:

$$
    D_n = 2D_{n-1} - (-1) \begin{vmatrix}
    -1 & -1 & 0 & \dots & 0 \\
    \begin{matrix} 
    0 \\
    \vdots\\
    0
    \end{matrix} &  &\boldsymbol A_{n-2} 
    \end{vmatrix} = 2D_{n-1} - D_{n-2}.
$$

По индукции отсюда получаем, что $D_n = 2n - (n-1) = n+1$.


## Cofactors and inverse matrix

Коэффициент при $a_{ij}$ в разложении определителя по строке называется **алгебраическим дополнением**: $C_{ij} = (-1)^{i+j} M_{ij}$. Таким образом,

```{math}
:label: cofactor-inverse
\det\boldsymbol A = \sum\limits_{j=1}^n a_{ij}C_{ij}. 
```
    
С помощью матрицы алгебраических дополнений $\boldsymbol C$ можно явно выписать формулу для обратной матрицы:

$$
    \boldsymbol A^{-1} = \frac{\boldsymbol C^\top}{\det \boldsymbol A}.
$$

Чтобы её доказать, надо проверить равенство

$$
    \begin{pmatrix}
        a_{11} & a_{12} & \dots & a_{1n} \\
        a_{21} & a_{22} & \dots & a_{2n} \\
        \vdots & \vdots & \ddots & \vdots \\
        a_{n1} & a_{n2} & \dots & a_{nn} \\
    \end{pmatrix}
    \begin{pmatrix}
        C_{11} & C_{21} & \dots & C_{n1} \\
        C_{12} & C_{22} & \dots & C_{n1} \\
        \vdots & \vdots & \ddots & \vdots \\
        C_{1n} & C_{2n} & \dots & C_{nn} \\
    \end{pmatrix} =

    \begin{pmatrix}
        \det \boldsymbol A & 0 & \dots & 0 \\
        0 & \det \boldsymbol A & \dots & 0 \\
        \vdots & \vdots & \ddots & \vdots \\
        0 & 0 & \dots & \det \boldsymbol A \\
    \end{pmatrix}.
$$

Наличие $\det \boldsymbol A$ везде на главной диагонали следует из формулы {eq}`cofactor-inverse`.

**Вопрос на подумать**. Почему все остальные внедиагональные элементы равны нулю?

```{admonition} Answer
:class: dropdown

Каждый такой элемент равен
    
$$
    \sum\limits_{j=1}^n a_{ij}C_{kj}, \quad i \ne k,
$$

а эта сумма представляет собой разложение по $k$-й строке определителя матрицы $\boldsymbol A'$, полученной заменой в матрице $\boldsymbol A$ $k$-й строки на $i$-ю. Такая матрица содержит две одинаковые строки, поэтому её определитель равен нулю. 
```

To calculate a determinant, use `np.linalg.det`:

In [9]:
import numpy as np
from scipy.linalg import hilbert

A = hilbert(2)
A

array([[1.        , 0.5       ],
       [0.5       , 0.33333333]])

In [10]:
np.linalg.det(A)

0.08333333333333333

## Exercises

1. Prove that $\det(\boldsymbol A) = 0$ if $\boldsymbol A$ is a skew-symmetric matrix of odd shape.

2. Prove that $\vert\det \boldsymbol Q\vert = 1$ if $\boldsymbol Q$ is an orthogonal matrix.

3. Matrices $\boldsymbol A$ and $\boldsymbol B$ are **similar** ($\boldsymbol A \sim \boldsymbol B$) if there exists a nonsingular matrix $\boldsymbol M$ such that $\boldsymbol B = \boldsymbol M^{-1} \boldsymbol {AM}$. Prove that $\det \boldsymbol A = \det \boldsymbol B$ if $\boldsymbol A \sim \boldsymbol B$.