05. Transformer 모델을 통한 파형 예측

SK AI Data Academy 1기 중급/[SK하이닉스] DRAM 내부 회로의 파형 예측

05. Transformer 모델을 통한 파형 예측

Donghun Kang 2024. 7. 21. 17:29

Sequence-to-Sequence (Seq2Seq)

- sequence를 다른 sequence로 바꾸어 주는 모델
- Encoder와 Decoder로 구성
Encoder: 입력 데이터(한국어)를 context vector로 압축
Decoder: context vector에서 출력 데이터(영어)를 유추
- 문제점
Context vector의 크기는 고정/ sequence가 길어지면 정보 손실이 발생

Attention

특정 출력값을 만들어내기 위해 입력값 중 관련 있는 부분을 더 집중

Transformer

- 일반적인 Seq2Seq 모델과 마찬가지로 Encoder-Decoder 구조
- 데이터를 병렬적으로 처리 가능
=> How? - Positional encoding!

Positional Encoding

- 입력 데이터의 순서(pos)를 데이터에 반영하여 모델에 입력
- 짝수 번째 차원은 sin을, 홀수 번째 차원은 cos을 적용

- 입력 순서의 low frequency ~ high frequency 까지의 정보를 모두 모델링

- Attention의 종류

Self-Attention

- 입력값끼리, 출력값 끼리 attention 수행

Cross-Attention

- 입력값과 출력값 간에 attention 수행

Multi-Head Attention

- Ensemble의 개념과 유사
- Value, Key, Query를 N개의 각각 다른 matrix로 곱하여 서로 다른 N개의 Value, Key, Query 생성 후 개별적으로 Attention수행
- 마지막 N개의 state를 concatenate한 후 matrix 연산을 이용하여 linear transform 한 후 최종 context vector계산

Add & Norm

- Multi-Head asttention을 통해 계산한 context vector와 입력값을 단순히 더한 후 normalization 수행
- ResNet의 residual connection의 개념과 유사

Feed Forward

두 개의 layer로 구성된 Multi layer perceptron network

class PositionalEncoding(torch.nn.Module):
	def _init__(self, num_dimension = 10, num_sequences = 150):
    		super(PositionalEncoding, self).__init____()
		
        	pe= torch.zeros(num_sequences, num_dimension)
		position = torch.arange(0, num_sequences).unsqueeze(1) 
        	div_term = torch.exp(torch.arange(0, num_dimension, 2) * \ - (torch.log(torch.Tensor([10000.0])) / num_dimension))
		pe[, 0::2] = torch.sin(position * div_term) 
		pe[:, 1::2] = torch.cos(position * div_term)
		self.pe = pe.unsqueeze (0)
        
	def forward(self, x):
    		x = x + self.pe
		return x

class Transformer(torch.nn.Module):
	def __init__(self, input_size, hidden_size, output_size, num_sequences, num_heads, num_layers):
		super(Transformer, self).__init__()
		self.embedding = torch.nn.Linear(input_size, embedding_size)
        	self.positional_encoder = PositionalEncoding(num_dimension = input_size, num_sequences = num_sequences)
		self.transformer = torch.nn.Transformer(d_model input_size,
							nhead = num_heads,
							num_encoder_layers = num_layers, 
							num_decoder_layers = num_layers,
							dim_feedforward hidden_size,
							batch_first = True)
		self.fc = torch.nn.Linear(input_size, output_size)

class Transformer (torch.nn.Module): 
	def forward(self, X):
		X = self.embedding(X)
		tgt_input = torch.zeros_like(X[:, :1, :], dtype = X.dtype).to(X.device)
		X = self.positional_encoder(X)
		y = self.transformer(X, tgt_input) 
       		y = self.fc(y[:, -1])
		return y

'SK AI Data Academy 1기 중급 > [SK하이닉스] DRAM 내부 회로의 파형 예측' 카테고리의 다른 글

04. 시계열 모델을 통한 파형 예측 (2)	2024.07.21
03. 회귀 분석을 통한 파형 예측 (1)	2024.07.14
02. 데이터 이해 및 전처리 (1)	2024.07.13
01. 프로젝트 소개 (0)	2024.07.13

현재글05. Transformer 모델을 통한 파형 예측

donghunkang

UNIVERSITY OF SEOUL, AI

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

donghunkang

05. Transformer 모델을 통한 파형 예측

'SK AI Data Academy 1기 중급 > [SK하이닉스] DRAM 내부 회로의 파형 예측' 카테고리의 다른 글

'SK AI Data Academy 1기 중급/[SK하이닉스] DRAM 내부 회로의 파형 예측'의 다른글

티스토리툴바

05. Transformer 모델을 통한 파형 예측

'SK AI Data Academy 1기 중급 > [SK하이닉스] DRAM 내부 회로의 파형 예측' 카테고리의 다른 글

'SK AI Data Academy 1기 중급/[SK하이닉스] DRAM 내부 회로의 파형 예측'의 다른글

관련글

티스토리툴바