인공신경망 #

퍼셉트론(Perceptron)
TLU(Threshold Logic Unit)이라고도 불리며 입력들에 대하여 출력을 구하는 유닛이다. 출력은 활성화 함수에 의하여 발생이 되며 heavyside, sgn과 같은 함수가 활용된다.
다중 퍼셉트론
하나의 층으로 구성이된 퍼셉트론은 XOR과 같은 문제를 해결할 수 없고 이를 해결하기 위해 2개 이상의 층으로 구성이된 퍼셉트론을 만드는것이다.
역전파(backpropagation)
다중 퍼셉트론의 학습법으로 효율적인 계산법은 경사 하강법을 사용할 수 있다.
역전파 기법의 서순은 아래와 같이 작용한다.
1. 미니배치들로 1epoch가 될때까지 반복
2. 각 미니배치들을 순차적으로 1개의 레이어씩 진행함
3. 출력층에 도달(정방향 계산)
4. 오차 측정
5. 순처적으로 되돌아가며 가중치를 계산
6. 경사 하강법으로 가중치를 변경
활성함수의 필요성
활성함수가 없으면 모든 층이 선형성을 가지기 때문에 비선형성을 가지는 복잡한 문제를 해결 할 수 없다.

심층신경망(DNN) #

은닉층을 2개 이상 가지는 신경망(다중 퍼셉트론)

Recurrent Neural Network로 순차적(sequential) 학습의 한 종류이다.
과거의 학습에 Weight를 가하여 현재 학습에 반영하는 신경망

단점
중요한 정보가 오래될 경우 영향력을 크게 상실할 수 있다.
이를 보완하기 위해 LSTM(Long Short-Term Memory)와 간소화된 GRU(Gated Recurrent Unit)가 있다.

Convolutional Neural Network로 이미지 처리에 효과적인 학습법이다.
아래의 두가지 구조로 구성된다.

Graph Neural Network로 그래프 데이터를 활용하는 신경망이다.
비정형의 복잡한 형태로 인하여 분석이 힘들다.

Weight initialization은 학습 초기 가중치를 결정하는 방법으로 효율적이지 못한값을 제공할 경우 미분값의 소실, 발산이 생길 수 있다.
아래의 초기화 기법들은 이와 같은 문제를 효율적으로 다룰 수 있다.

가중치 초기화는 초기의 가중치를 통하여 이후의 안정성을 제공하지만 완전히 안정적이지는 않다. 그렇기 때문에 배치 정규화를 이용해서 은닉층 내부에서 안정화를 제공할 수 있다.

그래디언트 폭주가 발생하지 않게 역전파에서 임계값을 초과하지 않게한다.

transfer learning이라고도 하며 이전에 학습한 층을 재활용하는 것이다. 상위층의 경우 재사용시 다른 모델에 최적화 되어 있기때문에 하위층을 주로 활용한다.