* ์ด ๊ธ์ ๋ค์ด๋ฒ ๋ถ์คํธ ์ฝ์ค์ ์ธ๊ณต์ง๋ฅ(AI) ๊ธฐ์ด ๋ค์ง๊ธฐ ๊ฐ์๋ฅผ ์๊ฐํ๋ฉฐ ์ ๋ฆฌํ ๊ธ์ ๋๋ค.
์ค๋์ ๋ฒกํฐ์ ํ๋ ฌ์ ๋ํด ์์๋ณด์.
1. ๋ฒกํฐ๋?
- ์ซ์๋ฅผ ์์๋ก ๊ฐ์ง๋ ๋ฆฌ์คํธ ๋๋ ๋ฐฐ์ด์ ์๋ฏธํ๋ค.
[1, 2, 3]
np.array([1, 2, 3]) #shape : (3, )
- ๊ณต๊ฐ์์์ ํ ์ ์ ์๋ฏธํ๋ค.
- ํ๋ฒกํฐ $ \begin{bmatrix}1 & 2 & 3 \end{bmatrix}$
- ์ด๋ฒกํฐ $\begin{bmatrix}1\\2\\3 \end{bmatrix}$
- ์์ ์ผ๋ก๋ถํฐ ์๋์ ์์น๋ฅผ ์๋ฏธํ๋ค. (๊ธธ์ด+๋ฐฉํฅ)
- ํน์ง
์ฐจ์์ด ๊ฐ์ผ๋ฉด ๋ง์ , ๋บ์ , ๊ณฑ์ ์ ๊ณ์ฐํ ์ ์๋ค.
- ์ฃผ์ ์ฐ์ฐ
โ ์ฑ๋ถ๊ณฑ(Hadamard product)
$X=\begin{bmatrix}x_1\\x_2\end{bmatrix}$, $Y=\begin{bmatrix}y_1\\y_2\end{bmatrix}$ ์ผ ๋, $X \odot Y=\begin{bmatrix}x_1y_1\\x_2y_2\end{bmatrix}$
โก ์์ ์์๋ถํฐ์ ๊ฑฐ๋ฆฌ(Vector Norm)
$X = \begin{bmatrix}a & b &c\end{bmatrix}$ ์ผ ๋,
- L-1 norm
: ๊ฐ ์ฑ๋ถ์ ๋ณํ๋์ ์ ๋๊ฐ์ ํฉ
$$ L1-norm = \| X \| _1= \sum_{i=1}^3 | x_i|=|a|+|b|+|c| $$
- L-2 norm : ํผํ๊ณ ๋ผ์ค ์ ๋ฆฌ๋ฅผ ์ด์ฉํ ์ ํด๋ฆฌ๋ ๊ฑฐ๋ฆฌ
$$ L2-norm = \| X \| _2= \sqrt{\sum_{i=1}^3 | x_i|^2}= \sqrt{|a|^2+|b|^2+|c|^2 } $$
โข ๋ ๋ฒกํฐ ์ฌ์ด์ ๊ฑฐ๋ฆฌ (L1-norm, L2-norm ๋ฐฉ์์ผ๋ก ๊ตฌํ ์ ์์)
๋ฒกํฐ์ ๋บ์ ์ ์ด์ฉํ์ฌ ๊ณ์ฐํ๋ค.
$$ \| y-x \|= \| x-y \| $$
โฃ ๋ ๋ฒกํฐ ์ฌ์ด์ ๊ฐ๋ (L2-norm ๋ฐฉ์์ผ๋ก ๊ตฌํ ์ ์์)
$$ cos \theta = \frac{\| x\|_2^2+\| y\|_2^2 -\| x-y\|_2^2}{2\| x\|_2^2\| y\|_2^2} = \frac{2<x, y>}{2\| x\|_2^2\| y\|_2^2} =\frac{<x, y>}{\| x\|_2^2\| y\|_2^2} $$
numpy ๋ชจ๋์ ํ์ฉํ๋ฉด
$$ cos \theta = \frac{np.inner(x, y)}{np.linalg.norm(x)*np.linalg.norm(y)} $$
$$∴ \theta = arccos(cos \theta)$$
2. ํ๋ ฌ์ด๋?
- ๋ฒกํฐ๋ฅผ ์์๋ก ๊ฐ์ง๋ 2์ฐจ์ ๋ฐฐ์ด์ ์๋ฏธํ๋ค.
[1, 2, 3]
np.array([1, 2, 3]) #shape : (3, )
- ๊ณต๊ฐ์์์ ์ฌ๋ฌ๊ฐ์ ์ ๋ค์ ์๋ฏธํ๋ค. (๋ฒกํฐ ๊ฐ๊ฐ์ด ํ๋์ ์ )
- ์ฃผ์ ์ฐ์ฐ
โ ์ฑ๋ถ๊ณฑ ($ X\bigodot Y $)
: ์์น๊ฐ ๊ฐ์ ์์์ ๊ณฑ
์กฐ๊ฑด) ํ๋ ฌ์ ํฌ๊ธฐ๊ฐ ๊ฐ์์ผ ํ๋ค.
โก ํ๋ ฌ ๊ณฑ ($ XY $)
: ํ๋ ฌ์์ ์ฌ์ฉํ๋ ๋ณ๋์ ๊ท์น
: ๋ฒกํฐ ๊ณต๊ฐ์์ ์ฌ์ฉ๋๋ ์ฐ์ฐ์๋ก, ํ๋ ฌ ๊ณฑ์ ํตํด ๋ฒกํฐ๋ฅผ ๋ค๋ฅธ ์ฐจ์์ ๊ณต๊ฐ์ผ๋ก ๋ณด๋ผ ์ ์๋ค.
- ๊ตฌํ 1. ํ๋ ฌ ๊ณฑ์
์กฐ๊ฑด) X(n*k) Y(k*m) : ์ ํ๋ ฌ์ ์ด์ ๊ธธ์ด์ ๋ท ํ๋ ฌ์ ํ์ ๊ธธ์ด๊ฐ ๊ฐ์์ผ ํ๋ค.
- ๊ตฌํ 2. ํ๋ ฌ ๋ด์
: ์ํ์ ๋ด์ ๊ณผ๋ ๋ค๋ฅธ ์๋ฏธ๋ก, $ XY^T $ ์ฐ์ฐ๊ณผ ๋์ผ
์กฐ๊ฑด) X(n*k) Y(m*k) : ์ ํ๋ ฌ์ ์ด์ ๊ธธ์ด์ ๋ท ํ๋ ฌ์ ์ด์ ๊ธธ์ด๊ฐ ๊ฐ์์ผ ํ๋ค.
- ์ข ๋ฅ
โ ์ ์นํ๋ ฌ ($ A^{T} $)
: ํ๋ ฌ์ ํ๊ณผ ์ด์ ๋ฐ๊พธ๋ ํ๋ ฌ
ํ๋ ฌ A์ ์์ $x_{ij}$์ ๋ํ์ฌ
$$ x_{ij}=x_{ji} $$
โก ์ญํ๋ ฌ ($ A^{-1} $)
: ํ๋ ฌ์ ์ฐ์ฐ์ ๋๋๋ฆฌ๋ ํ๋ ฌ
์กฐ๊ฑด1) ํ๊ณผ ์ด์ ๊ฐฏ์๊ฐ ๊ฐ์์ผ ํ๋ค. m์ฐจ์ -> m์ฐจ์
์กฐ๊ฑด 2) ํ๋ ฌ์์ด 0์ด ์๋์ด์ผ ํ๋ค.
$$ AA^{-1} = A^{-1}A = I $$
๊ตฌํ
np.linalg.inv(A)
โข ์ ์ฌ ์ญํ๋ ฌ ($ A^{+} $), ๋ฌด์ดํ ๋ก์ฆ์ ์ญํ๋ ฌ
: ํ๊ณผ ์ด์ ๊ฐฏ์๊ฐ ๋ฌ๋ผ๋ ์ฐ์ฐ ๋๋๋ฆฌ๊ธฐ๊ฐ ๊ฐ๋ฅํ ํ๋ ฌ. m์ฐจ์ -> n์ฐจ์
- ํ์ ๊ฐ์ > ์ด์ ๊ฐ์ $ A^{+} = ( A^{T} A )^{-1} A^{T} $
- ํ์ ๊ฐ์ < ์ด์ ๊ฐ์ $ A^{+} = A^{T} ( A^{T} A )^{-1} $
๊ตฌํ
np.linalg.pinv(A)
ํ๋ ฌ์ ํ์ฉ : np.linalg.pinv (์ ์ฌ ์ญํ๋ ฌ ์ด์ฉ)
- ์ฐ๋ฆฝ๋ฐฉ์ ์
์ฐ๋ฆฝ๋ฐฉ์ ์์ coef(๊ณ์๋ค์ ๋ชจ์)๋ฅผ A, ๊ฐ์ b ํ๋ ฌ์ด๋ผ๊ณ ํ์.
$ Ax = b $ ⇒ $ x = A^{+}b $
n : ์์ ๊ฐฏ์ m : uniqueํ x($x_{1}, x_{2} ...$)์ ๊ฐฏ์ ๋ผ๊ณ ํ๋ฉด,
i) $n\leqslant m$ => $A^{T}(AA^{T})^{-1}b $
ii) $ n>m$ => $(A^{T}A)^{-1}A^{T}b $
- ์ ํํ๊ท๋ถ์
์ ํํ๊ท๋ถ์์ ์ฌ๋ฌ ์ ๋ค์ด ์ฃผ์ด์ง ์ํฉ์์ ์ ๋ค์ ๋ํํ๋ ์ ์ ์ฐพ๋ ๊ณผ์ ์ด๋ค.
$ Xb = y $ ⇒ $ b = X^{+}y $
n : ์์ ๊ฐฏ์ m : uniqueํ b์ ๊ฐฏ์ ๋ผ๊ณ ํ๋ฉด,
i) $n\leqslant m$ => $X^{T}(XX^{T})^{-1}y $
ii) $n>m$ => $(X^{T}X)^{-1}X^{T}y $