์ธ๊ณต์ง€๋Šฅ๐Ÿพ/๊ธฐ์ดˆ์ˆ˜ํ•™

[์ธ๊ณต์ง€๋Šฅ ๊ธฐ์ดˆ์ˆ˜ํ•™] 0. ๋ฒกํ„ฐ์™€ ํ–‰๋ ฌ

๐Ÿช„ํ•˜๋ฃจ๐Ÿช„ 2023. 3. 4. 18:46
728x90

* ์ด ๊ธ€์€ ๋„ค์ด๋ฒ„ ๋ถ€์ŠคํŠธ ์ฝ”์Šค์˜ ์ธ๊ณต์ง€๋Šฅ(AI) ๊ธฐ์ดˆ ๋‹ค์ง€๊ธฐ ๊ฐ•์˜๋ฅผ ์ˆ˜๊ฐ•ํ•˜๋ฉฐ ์ •๋ฆฌํ•œ ๊ธ€์ž…๋‹ˆ๋‹ค.

 

์˜ค๋Š˜์€ ๋ฒกํ„ฐ์™€ ํ–‰๋ ฌ์— ๋Œ€ํ•ด ์•Œ์•„๋ณด์ž.

 

1. ๋ฒกํ„ฐ๋ž€?

  • ์ˆซ์ž๋ฅผ ์›์†Œ๋กœ ๊ฐ€์ง€๋Š” ๋ฆฌ์ŠคํŠธ ๋˜๋Š” ๋ฐฐ์—ด์„ ์˜๋ฏธํ•œ๋‹ค.
[1, 2, 3]
np.array([1, 2, 3]) #shape : (3, )
  • ๊ณต๊ฐ„์—์„œ์˜ ํ•œ ์ ์„ ์˜๋ฏธํ•œ๋‹ค.
    • ํ–‰๋ฒกํ„ฐ $ \begin{bmatrix}1 & 2 & 3 \end{bmatrix}$
    • ์—ด๋ฒกํ„ฐ $\begin{bmatrix}1\\2\\3 \end{bmatrix}$

 

  • ์›์ ์œผ๋กœ๋ถ€ํ„ฐ ์ƒ๋Œ€์  ์œ„์น˜๋ฅผ ์˜๋ฏธํ•œ๋‹ค. (๊ธธ์ด+๋ฐฉํ–ฅ)

๋ฒกํ„ฐ์˜ ์ขŒํ‘œ์ƒ์—์„œ์˜ ํ‘œํ˜„

 

- ํŠน์ง•

 

์ฐจ์›์ด ๊ฐ™์œผ๋ฉด ๋ง์…ˆ, ๋บ„์…ˆ, ๊ณฑ์…ˆ์„ ๊ณ„์‚ฐํ•  ์ˆ˜ ์žˆ๋‹ค.

 

- ์ฃผ์š” ์—ฐ์‚ฐ

 

โ‘  ์„ฑ๋ถ„๊ณฑ(Hadamard product)

 

 $X=\begin{bmatrix}x_1\\x_2\end{bmatrix}$, $Y=\begin{bmatrix}y_1\\y_2\end{bmatrix}$ ์ผ ๋•Œ, $X \odot Y=\begin{bmatrix}x_1y_1\\x_2y_2\end{bmatrix}$

 

โ‘ก ์›์ ์—์„œ๋ถ€ํ„ฐ์˜ ๊ฑฐ๋ฆฌ(Vector Norm)

 

$X = \begin{bmatrix}a & b &c\end{bmatrix}$ ์ผ ๋•Œ,

  • L-1 norm

: ๊ฐ ์„ฑ๋ถ„์˜ ๋ณ€ํ™”๋Ÿ‰์˜ ์ ˆ๋Œ“๊ฐ’์˜ ํ•ฉ

$$ L1-norm =  \| X \| _1= \sum_{i=1}^3  | x_i|=|a|+|b|+|c| $$
  • L-2 norm : ํ”ผํƒ€๊ณ ๋ผ์Šค ์ •๋ฆฌ๋ฅผ ์ด์šฉํ•œ ์œ ํด๋ฆฌ๋“œ ๊ฑฐ๋ฆฌ
$$ L2-norm =  \| X \| _2=  \sqrt{\sum_{i=1}^3  | x_i|^2}= \sqrt{|a|^2+|b|^2+|c|^2 }  $$

 

โ‘ข ๋‘ ๋ฒกํ„ฐ ์‚ฌ์ด์˜ ๊ฑฐ๋ฆฌ (L1-norm, L2-norm ๋ฐฉ์‹์œผ๋กœ ๊ตฌํ•  ์ˆ˜ ์žˆ์Œ)

๋ฒกํ„ฐ์˜ ๋บ„์…ˆ์„ ์ด์šฉํ•˜์—ฌ ๊ณ„์‚ฐํ•œ๋‹ค.

$$ \| y-x \|= \| x-y \| $$

 

โ‘ฃ ๋‘ ๋ฒกํ„ฐ ์‚ฌ์ด์˜ ๊ฐ๋„ (L2-norm ๋ฐฉ์‹์œผ๋กœ ๊ตฌํ•  ์ˆ˜ ์žˆ์Œ)

$$ cos \theta = \frac{\| x\|_2^2+\| y\|_2^2 -\| x-y\|_2^2}{2\| x\|_2^2\| y\|_2^2} = \frac{2<x, y>}{2\| x\|_2^2\| y\|_2^2} =\frac{<x, y>}{\| x\|_2^2\| y\|_2^2} $$
numpy ๋ชจ๋“ˆ์„ ํ™œ์šฉํ•˜๋ฉด

$$ cos \theta = \frac{np.inner(x, y)}{np.linalg.norm(x)*np.linalg.norm(y)} $$
$$∴ \theta = arccos(cos \theta)$$

 

2. ํ–‰๋ ฌ์ด๋ž€?

  • ๋ฒกํ„ฐ๋ฅผ ์›์†Œ๋กœ ๊ฐ€์ง€๋Š” 2์ฐจ์› ๋ฐฐ์—ด์„ ์˜๋ฏธํ•œ๋‹ค.
[1, 2, 3]
np.array([1, 2, 3]) #shape : (3, )
  • ๊ณต๊ฐ„์—์„œ์˜ ์—ฌ๋Ÿฌ๊ฐœ์˜ ์ ๋“ค์„ ์˜๋ฏธํ•œ๋‹ค. (๋ฒกํ„ฐ ๊ฐ๊ฐ์ด ํ•˜๋‚˜์˜ ์ )

 

ํ–‰๋ ฌ์˜ ํ‘œํ˜„

- ์ฃผ์š” ์—ฐ์‚ฐ

 

โ‘  ์„ฑ๋ถ„๊ณฑ ($ X\bigodot Y $)

: ์œ„์น˜๊ฐ€ ๊ฐ™์€ ์š”์†Œ์˜ ๊ณฑ

์กฐ๊ฑด) ํ–‰๋ ฌ์˜ ํฌ๊ธฐ๊ฐ€ ๊ฐ™์•„์•ผ ํ•œ๋‹ค.

 

์„ฑ๋ถ„๊ณฑ์˜ ์›๋ฆฌ

โ‘ก ํ–‰๋ ฌ ๊ณฑ ($ XY $)

: ํ–‰๋ ฌ์—์„œ ์‚ฌ์šฉํ•˜๋Š” ๋ณ„๋„์˜ ๊ทœ์น™

: ๋ฒกํ„ฐ ๊ณต๊ฐ„์—์„œ ์‚ฌ์šฉ๋˜๋Š” ์—ฐ์‚ฐ์ž๋กœ, ํ–‰๋ ฌ ๊ณฑ์„ ํ†ตํ•ด ๋ฒกํ„ฐ๋ฅผ ๋‹ค๋ฅธ ์ฐจ์›์˜ ๊ณต๊ฐ„์œผ๋กœ ๋ณด๋‚ผ ์ˆ˜ ์žˆ๋‹ค.

  • ๊ตฌํ˜„ 1. ํ–‰๋ ฌ ๊ณฑ์…ˆ

์กฐ๊ฑด) X(n*k) Y(k*m) : ์•ž ํ–‰๋ ฌ์˜ ์—ด์˜ ๊ธธ์ด์™€ ๋’ท ํ–‰๋ ฌ์˜ ํ–‰์˜ ๊ธธ์ด๊ฐ€ ๊ฐ™์•„์•ผ ํ•œ๋‹ค. 

 

ํ–‰๋ ฌ๊ณฑ ๊ตฌํ˜„ 1

  • ๊ตฌํ˜„ 2. ํ–‰๋ ฌ ๋‚ด์ 

: ์ˆ˜ํ•™์˜ ๋‚ด์ ๊ณผ๋Š” ๋‹ค๋ฅธ ์˜๋ฏธ๋กœ, $ XY^T $ ์—ฐ์‚ฐ๊ณผ ๋™์ผ

์กฐ๊ฑด) X(n*k) Y(m*k) : ์•ž ํ–‰๋ ฌ์˜ ์—ด์˜ ๊ธธ์ด์™€ ๋’ท ํ–‰๋ ฌ์˜ ์—ด์˜ ๊ธธ์ด๊ฐ€ ๊ฐ™์•„์•ผ ํ•œ๋‹ค. 

 

ํ–‰๋ ฌ๊ณฑ ๊ตฌํ˜„ 2

- ์ข…๋ฅ˜

 

โ‘  ์ „์น˜ํ–‰๋ ฌ ($ A^{T} $)

: ํ–‰๋ ฌ์˜ ํ–‰๊ณผ ์—ด์„ ๋ฐ”๊พธ๋Š” ํ–‰๋ ฌ

ํ–‰๋ ฌ A์˜ ์›์†Œ $x_{ij}$์— ๋Œ€ํ•˜์—ฌ

$$ x_{ij}=x_{ji} $$

 

โ‘ก ์—ญํ–‰๋ ฌ ($ A^{-1} $)

: ํ–‰๋ ฌ์˜ ์—ฐ์‚ฐ์„ ๋˜๋Œ๋ฆฌ๋Š” ํ–‰๋ ฌ

์กฐ๊ฑด1) ํ–‰๊ณผ ์—ด์˜ ๊ฐฏ์ˆ˜๊ฐ€ ๊ฐ™์•„์•ผ ํ•œ๋‹ค. m์ฐจ์› -> m์ฐจ์›

์กฐ๊ฑด 2) ํ–‰๋ ฌ์‹์ด 0์ด ์•„๋‹ˆ์–ด์•ผ ํ•œ๋‹ค.

$$ AA^{-1} = A^{-1}A = I $$

 

๊ตฌํ˜„

np.linalg.inv(A)

 

โ‘ข ์œ ์‚ฌ ์—ญํ–‰๋ ฌ ($ A^{+} $), ๋ฌด์–ดํŽ ๋กœ์ฆˆ์˜ ์—ญํ–‰๋ ฌ

: ํ–‰๊ณผ ์—ด์˜ ๊ฐฏ์ˆ˜๊ฐ€ ๋‹ฌ๋ผ๋„ ์—ฐ์‚ฐ ๋˜๋Œ๋ฆฌ๊ธฐ๊ฐ€ ๊ฐ€๋Šฅํ•œ ํ–‰๋ ฌ. m์ฐจ์› -> n์ฐจ์›

  • ํ–‰์˜ ๊ฐœ์ˆ˜ > ์—ด์˜ ๊ฐœ์ˆ˜ $ A^{+} = ( A^{T} A )^{-1} A^{T} $
  • ํ–‰์˜ ๊ฐœ์ˆ˜ < ์—ด์˜ ๊ฐœ์ˆ˜ $ A^{+} = A^{T} ( A^{T} A )^{-1} $

 

๊ตฌํ˜„

np.linalg.pinv(A)

 

 

ํ–‰๋ ฌ์˜ ํ™œ์šฉ : np.linalg.pinv (์œ ์‚ฌ ์—ญํ–‰๋ ฌ ์ด์šฉ)

  • ์—ฐ๋ฆฝ๋ฐฉ์ •์‹

์—ฐ๋ฆฝ๋ฐฉ์ •์‹์˜ coef(๊ณ„์ˆ˜๋“ค์˜ ๋ชจ์Œ)๋ฅผ A, ๊ฐ’์„ b ํ–‰๋ ฌ์ด๋ผ๊ณ  ํ•˜์ž.

$ Ax = b $ ⇒ $ x = A^{+}b $

n : ์‹์˜ ๊ฐฏ์ˆ˜ m : uniqueํ•œ x($x_{1}, x_{2} ...$)์˜ ๊ฐฏ์ˆ˜ ๋ผ๊ณ  ํ•˜๋ฉด,

i) $n\leqslant m$ => $A^{T}(AA^{T})^{-1}b $

ii) $ n>m$ => $(A^{T}A)^{-1}A^{T}b $

 

  • ์„ ํ˜•ํšŒ๊ท€๋ถ„์„

์„ ํ˜•ํšŒ๊ท€๋ถ„์„์€ ์—ฌ๋Ÿฌ ์ ๋“ค์ด ์ฃผ์–ด์ง„ ์ƒํ™ฉ์—์„œ ์ ๋“ค์„ ๋Œ€ํ‘œํ•˜๋Š” ์„ ์„ ์ฐพ๋Š” ๊ณผ์ •์ด๋‹ค.

$ Xb = y $ $ b = X^{+}y $

n : ์‹์˜ ๊ฐฏ์ˆ˜ m : uniqueํ•œ b์˜ ๊ฐฏ์ˆ˜ ๋ผ๊ณ  ํ•˜๋ฉด,

i) $n\leqslant m$ => $X^{T}(XX^{T})^{-1}y $

ii) $n>m$ => $(X^{T}X)^{-1}X^{T}y $

728x90