목록전체 글 (24)
아무것도 모르는 공대생의 지식 탐험기
모델 성능 검증하기 과적합 피하기: 데이터 분석과 해결 방법머신러닝과 딥러닝 모델을 개발하는 과정에서 중요한 문제 중 하나는 "과적합(overfitting)"이다. 모델이 훈련 데이터에 지나치게 맞춰지면 새로운 데이터에서는 일반화되지 못하는 현상이 발생한다. 이 글에서는 과적합의 개념과 원인, 그리고 이를 방지하기 위한 대표적인 방법들을 소개하고, 실습 코드와 함께 해결책을 제시한다.1. 과적합이란?과적합이란 모델이 훈련 데이터에서 높은 성능을 보이지만, 실제 새로운 데이터에서는 성능이 떨어지는 현상을 의미한다. 모델이 데이터의 일반적인 패턴을 학습하는 것이 아니라, 훈련 데이터에 포함된 불필요한 세부 사항(노이즈)까지 학습하는 것이 원인이다.과적합이 발생하는 주요 원인:훈련 데이터의 양이 부족한 경우..
다중 분류 뮨제 해결하기다중 분류 문제 해결하기 - 아이리스 품종 예측1. 다중 분류 문제란?딥러닝을 이용한 분류 문제는 크게 이항 분류(binary classification)와 다중 분류(multi-class classification)로 나뉜다.이항 분류: 두 개의 클래스(예: 스팸 메일 여부)를 예측하는 문제다중 분류: 세 개 이상의 클래스 중 하나를 예측하는 문제이번에는 대표적인 다중 분류 문제인 아이리스(Iris) 품종 예측 문제를 다룰 것이다. 아이리스 데이터셋은 꽃잎의 길이, 너비, 꽃받침의 길이, 너비 등의 속성을 이용해 세 가지 품종(Setosa, Versicolor, Virginica)을 예측하는 문제이다.아이리스 데이터셋 구성 꽃받침 길이꽃받침 너비꽃잎 길이꽃잎 너비품종5...
데이터 다루기1. 데이터 분석과 전처리데이터의 중요성머신러닝과 딥러닝 모델이 좋은 성능을 내기 위해서는 충분한 양의 데이터뿐만 아니라, 대표성(representative)이 있는 균형 잡힌 데이터가 필요하다. 특히, 데이터 편향성(bias) 문제를 해결하지 않으면 모델이 한쪽 데이터에 치우쳐 학습될 가능성이 크다.예를 들어, 전체 데이터셋에서 당뇨병 환자의 비율이 매우 낮다면 모델이 대부분을 "비당뇨"라고 예측해도 정확도가 높아 보일 수 있다. 그러나 이런 모델은 실제로 중요한 당뇨병 환자를 제대로 식별하지 못하는 심각한 문제를 초래할 수 있다.데이터의 편향성 해결 방법언더샘플링(Under-sampling): 건강한 사람의 데이터를 일부 제거하여 균형을 맞춤오버샘플링(Over-sampling): 당뇨병 ..

딥러닝 모델 설계 하기신경망을 활용한 모델을 설계하는 것은 머신러닝과 딥러닝의 핵심 과정 중 하나이다. 이번 장에서는 폐암 수술 환자의 생존율 예측을 예제로 삼아 딥러닝 모델을 설계하는 과정을 살펴보겠다.1. 모델의 정의우리가 설계할 모델은 폐암 수술 환자의 다양한 특성을 입력으로 받아 수술 후 생존 가능성을 예측하는 이진 분류(Binary Classification) 모델이다. 이 모델을 구현하기 위해 다음과 같은 주요 개념들을 다룰 것이다.입력층, 은닉층, 출력층활성화 함수(ReLU, Sigmoid)손실 함수(Binary Crossentropy)경사 하강법(Adam Optimizer)학습 과정(Epochs, Batch Size)2. 환경 및 데이터 준비먼저, 모델을 구현하기 위해 필요한 라이브러리를 ..

오차 역전파에서 딥러닝으로 1. 오차 역전파란?오차 역전파는 딥러닝에서 가장 핵심적인 개념 중 하나로, 다층 퍼셉트론(MLP)이 효과적으로 학습할 수 있도록 도와주는 알고리즘이다. 신경망 모델이 주어진 입력 데이터를 기반으로 예측한 출력값과 실제 값 사이의 오차를 계산한 뒤, 이 오차를 역방향으로 전파하여 각 층의 가중치와 바이어스를 조정하는 방식이다.XOR 문제를 해결할 때는 가중치와 바이어스를 미리 알고 직접 설정할 수 있었지만, 실제 딥러닝 프로젝트에서는 이러한 최적 가중치를 사전에 알 수 없다. 따라서 오차 역전파 알고리즘을 활용하여 학습 과정을 통해 최적의 가중치를 찾아야 한다.2. 오차 역전파의 원리1) 기본 개념오차 역전파는 경사 하강법을 기반으로 동작하며, 출력층에서 발생한 오차를 역방향으..

다층 퍼셉트론1. 다층 퍼셉트론의 등장단층 퍼셉트론은 선형적으로 분리 가능한 문제를 해결할 수 있지만, XOR 문제와 같은 비선형 문제는 해결할 수 없다. XOR 문제를 해결하기 위해서는 좌표 평면 자체를 변형하거나, 추가적인 연산을 수행하는 구조가 필요하다. 이를 해결하기 위해 다층 퍼셉트론(Multi-layer Perceptron, MLP)이 등장했다.다층 퍼셉트론이 필요한 이유단층 퍼셉트론은 직선 하나로 데이터를 구분하는 선형 분류만 가능하다.XOR 문제는 하나의 직선으로 데이터를 나눌 수 없는 비선형 문제이다.다층 퍼셉트론은 은닉층(Hidden Layer)을 추가하여 데이터를 변형하고, 기존의 좌표 평면을 새로운 공간으로 매핑하여 문제를 해결한다.2. 다층 퍼셉트론의 설계다층 퍼셉트론의 핵심은 입..