๐๋ค์ด๊ฐ๋ฉฐ
์ด๋ฒ ํฌ์คํ ์์๋ ์ ๋ฒ ํฌ์คํ Backpropagation์ ์ดํดํ๊ธฐ ์ํด ์์์ผ ํ๋ Chain Rule์ ๋ํด ๋ฐฐ์๋ณธ๋ค.
Chain Rule
Chain Rule ์ฐ๋ฆฌ ๋ง๋ก ์ฐ์ ๋ฒ์์ธ ์ฒด์ธ๋ฃฐ์ ํฉ์ฑ ํจ์์ ๋ฏธ๋ถ์ ๋ํ ์ฑ์ง์ด๋ค. ํฉ์ฑ ํจ์์ ๋ํด ๊ฐ๋จํ๊ฒ ์ค๋ช ํ๋ฉด f(t)ํจ์์ ๋งค๊ฐ๋ณ์๊ฐ g(x)๋ผ๋ ํจ์์ ๊ฒฐ๊ณผ๊ฐ์ธ ํจ์๋ฅผ ๋งํ๋ค. ์ฆ, t = g(x)๋ผ๊ณ ํ๋ฉด f(g(x))์ ๊ฐ์ด ํํํ ์ ์๊ณ (fโg)(x)๋ผ๊ณ ๋ ํํํ ์ ์๋ค.
์ฒด์ธ๋ฃฐ์ ์๋์ ๊ฐ๋ค.
ํฉ์ฑ ํจ์์ ๋ฏธ๋ถ์ ํฉ์ฑ ํจ์๋ฅผ ๊ตฌ์ฑํ๋ ๊ฐ ํจ์์ ๋ฏธ๋ถ์ ๊ณฑ์ผ๋ก ๋ํ๋ผ ์ ์๋ค.
์ฐ๋ฆฌ๊ฐ ๋ฐฐ์ ๋ ํฉ์ฑ ํจ์์ ๋ํจ์ ๊ณต์์ ๋ค์๊ณผ ๊ฐ๋ค.
์์ ๊ณต์์ ๋ณด๋ฉด f(g(x))'์ ํํํ ๊ฒ์ธ๋ฐ ์ด๋ ํฉ์ฑ ํจ์๋ฅผ ๊ตฌ์ฑํ๋ ๊ฐ ํจ์๋ f(g(x))์ g(x)์ด๊ณ ๋๋ฌธ์ f'(g(x))์ g'(x)์ ๊ณฑ์ผ๋ก ์ฒด์ธ๋ฃฐ์ ์ํด ํํ๋๋ค.
๋ค๋ฅธ ์๋ฅผ ๋ค์ด ์ค๋ช ํ๋ฉด z = (x + y)^2์ด๋ผ๋ ์์ด ์์๋ ์๋์ ๋ ์์ผ๋ก ๊ตฌ์ฑํ ์ ์๋ค.
ํฉ์ฑ ํจ์์ ๋ฏธ๋ถ์ ํฉ์ฑ ํจ์๋ฅผ ๊ตฌ์ฑํ๋ ๊ฐ ํจ์์ ๋ฏธ๋ถ์ ๊ณฑ์ผ๋ก ๋ํ๋ผ ์ ์๊ธฐ ๋๋ฌธ์ x์ ๋ํ z์ ๋ฏธ๋ถ์ t์ ๋ํ z์ ๋ฏธ๋ถ๊ณผ x์ ๋ํ t์ ๋ฏธ๋ถ์ ๊ณฑ์ผ๋ก ๋ํ๋ผ ์ ์๋ค.
๋๋ฌธ์
๊ณ์ฐ๋ ๋ฏธ๋ถ ๊ฐ์ด ๋ค์๊ณผ ๊ฐ๋ค๋ฉด
๋ ๋ฏธ๋ถ๊ฐ์ ๊ณฑํด ๊ณ์ฐ ๊ฐ๋ฅํ๋ค๋ ๋ฒ์น์ด๋ค. ์ฌ์ค ์ฒด์ธ๋ฃฐ์ ๋ช ์นญ์ ๋ชจ๋ฅด๊ณ ์์์ ๋ฟ ์ฐ๋ฆฌ๋ ๋ชจ๋ฅด๊ฒ ํฉ์ฑ ํจ์์ ๋ํจ์๋ฅผ ๊ตฌํ ๋ ์ฒด์ธ๋ฃฐ์ ์ด์ฉํ๊ณ ์์๋ค.
์๊ฒฌ๊ณผ ์ง๋ฌธ์ ์ธ์ ๋ ๊ฐ์ฌํฉ๋๋ค.
'ML & DL > Deep Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[DL] CNN ํฉ์ฑ๊ณฑ ์ ๊ฒฝ๋ง ์์ด๋ณด ๊ธฐ์ด ๊ฐ๋ (0) | 2023.10.03 |
---|---|
[DL] Backpropagation ์ญ์ ํ ์ดํดํ๊ธฐ (0) | 2023.09.21 |