[250207] 퍼셉트론(Perceptron)이란?

퍼셉트론(Perceptron)이란?

1. 퍼셉트론 정의

퍼셉트론(Perceptron)은 인공 신경망(Artificial Neural Network, ANN)의 가장 기초적인 형태로, 1958년에 프랑크 로젠블라트(Frank Rosenblatt)가 개발한 알고리즘이다. 퍼셉트론은 입력 데이터를 받아 가중치를 적용하고, 활성화 함수를 사용하여

최종 출력을 결정하는 구조를 갖는다.

퍼셉트론은 인공 뉴런 모델이며, 생물학적 뉴런(Neuron)에서 영감을 받아 설계되었다. 이 모델은 이진 분류 문제를 해결하는 데

주로 사용된다.

2. 퍼셉트론의 구조

퍼셉트론은 다음과 같은 구성 요소를 가진다:

1) 입력(Input)

여러 개의 입력 신호(`x1, x2, ..., xn`)를 받음

2) 가중치(Weight)

각 입력에 가중치(`w1, w2, ..., wn`)를 곱하여 중요도를 부여함

3) 편향(Bias)

모델이 좀 더 유연하게 학습할 수 있도록 추가되는 상수 값(`b` = 바이어스)

4) 가중합(Weighted Sum)

입력 값과 가중치를 곱한 값들을 모두 더하고 편향을 추가
수식:

5) 활성화 함수(Activation Function)

가중합을 특정 기준(임계값)에 따라 이진 출력(0 또는 1)으로 변환하는 역할임
가장 기본적인 활성화 함수로 계단 함수(Step Function)가 사용됨

이때 계단 함수에 사용된 이 임계치값을 수식으로 표현할 때는 보통 세타(Θ)로 표현함
식으로 표현하면 다음과 같음

6) 출력(Output)

최종적으로 0 또는 1의 결과를 출력

3. 퍼셉트론의 동작 원리

퍼셉트론은 다음 과정을 거쳐 데이터를 처리한다:

입력 데이터 수집: `x1, x2, ..., xn` 값을 입력받음
가중합 계산: 각 입력 값에 가중치를 곱하고 편향을 더함
활성화 함수 적용: 가중합 결과가 임계값을 넘으면 1, 그렇지 않으면 0을 출력
결과 출력: 최종적으로 0 또는 1을 반환하여 이진 분류를 수행

4. 퍼셉트론 학습 알고리즘

퍼셉트론은 지도 학습(Supervised Learning) 방식으로 학습하며, 주어진 데이터를 통해 가중치를 조정하는 과정이 포함된다.

학습 과정은 다음과 같다:

초기화
- 가중치(`w1, w2, ..., wn`)와 편향(`b`)을 작은 랜덤 값으로 설정
예측 및 오차 계산
- 현재 가중치와 편향으로 예측 값을 계산함
- 예측 값과 실제 값(정답) 사이의 오차를 계산
가중치 업데이트
- 오차를 줄이기 위해 가중치를 업데이트
반복
- 일정 조건(에포크 수 도달 또는 오차 최소화)까지 반복

5. 퍼셉트론의 한계

퍼셉트론은 단순하지만 몇 가지 한계를 가진다:

1) 선형 분리 문제만 해결 가능

퍼셉트론은 선형적으로 분리 가능한 문제(예: AND, OR 게이트)만 해결할 수 있음
BUT! XOR 문제와 같은 비선형 문제는 해결할 수 없음

2) 다층 퍼셉트론(MLP)의 필요성

퍼셉트론의 한계를 극복하기 위해 여러 개의 뉴런을 쌓은 다층 퍼셉트론(MLP, Multi-Layer Perceptron)이 등장
MLP는 은닉층(Hidden Layer)을 추가하여 비선형 문제도 해결 가능

3) 다른 활성화 함수 필요

단순한 계단 함수(Step Function) 대신, 연속적인 활성화 함수인 시그모이드(Sigmoid), ReLU, tanh 등이 사용되면서 퍼셉트론이 더 강력해짐

6. 퍼셉트론 구현 (Python 코드)

import numpy as np

class Perceptron:
    def __init__(self, input_size, lr=0.1, epochs=10):
        self.weights = np.zeros(input_size + 1)  # 가중치 + 편향
        self.lr = lr  # 학습률
        self.epochs = epochs  # 학습 반복 횟수

    def activation(self, x):
        return 1 if x >= 0 else 0  # 계단 함수

    def predict(self, x):
        x = np.insert(x, 0, 1)  # 편향 추가
        return self.activation(np.dot(self.weights, x))

    def train(self, X, y):
        for _ in range(self.epochs):
            for i in range(len(X)):
                x_i = np.insert(X[i], 0, 1)  # 편향 추가
                y_pred = self.activation(np.dot(self.weights, x_i))
                self.weights += self.lr * (y[i] - y_pred) * x_i  # 가중치 업데이트

✅ 사용 예제:

# AND 게이트 학습
X = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
y = np.array([0, 0, 0, 1])

p = Perceptron(input_size=2)
p.train(X, y)

print(p.predict([0, 0]))  # 0
print(p.predict([1, 1]))  # 1

퍼셉트론 정리:
1️⃣ 퍼셉트론은 가장 기본적인 인공 신경망 모델이다~
2️⃣ 입력 → 가중치 → 활성화 함수 → 출력 구조를 가진다~
3️⃣ 학습 알고리즘을 통해 가중치를 업데이트하며 이진 분류 문제를 해결할 수 있다~
4️⃣ 비선형 문제(XOR 등)는 해결할 수 없어서 다층 퍼셉트론(MLP)으로 확장되었다~
아~ 그렇구나~~

'AI 🤖 > ML & DL 🧠' 카테고리의 다른 글

[250212] LangChain이 뭔데~ (2)	2025.02.12
[250210] LLM 특강 두번째 시간~ (1)	2025.02.10
[250207] LLM 특강 정리~ (0)	2025.02.07
[241226] 데이터 시각화 정리 (2)	2024.12.26
[241217] 머신러닝 개념 정리 두번째 (0)	2024.12.17