목록전체 글 (24)
아무것도 모르는 공대생의 지식 탐험기

[기본 미션 ]k-평균 알고리즘 작동 방식 설명하기 1) 무작위로 k개의 클러스터 중심을 설정한다 2) 각 샘플에서 가장 가까운 클러스터 중심을 찾아 해당 클러스터의 샘플로 지정한다 3)클러스터에 속한 샘플의 평균 등의 연산을 통해 중심을 재정의한다 4) 클러스터 중심에 변화가 없을 때까지 2번으로 돌아가서 반복한다. [선택 미션]Ch.06(06-3) 확인 문제 풀고, 풀이 과정 정리하기 Q1. 특성이 20개인 대량의 데이터셋이 있습니다. 이 데이터셋에서 찾을 수 있는 주성분 개수는 몇개일까요? ① 10개, ② 20개, ③ 50개, ④ 100개 A1. ② 20개, 일반적으로 데이터 셋에서 주성분은 특성의 개수만큼 찾을 수 있기 때문이다. Q2. 샘플 개수가 1000개이고 특성 개수가 100개인 데이터셋이..

1. 로지스틱 회귀로 와인 분류하기먼저, 와인 데이터를 불러오자import pandas as pdwine = pd.read_csv('')wine.head() alcoholsugarpHclass09.41.93.510.019.82.63.200.029.82.33.260.039.81.93.160.049.41.93.510.0만약, 데이터를 잘 불러왔다면, 처음 열 3개에는 각각 알콜의 도수, 당도, ph 값을 나타낸다.네번째 열은 타깃값으로 0이면 레드와인, 1이면 화이트 와인이다. 레드와 화이트 와인 중 어떤 것인지 구분하는 이진 분류 문제이며, 화이트 와인이 양성 클래스이다.즉, 전체 와인에서 화이트 와인이 어떤 것인지 골라내는 문제이다.wine.info()#아래는 결과#RangeIndex: 6497 ent..

안녕하세요 ! 오늘은 혼공머신 3주차 chapter 4로 돌아왔습니다 ! 로지스틱 회귀 로지스틱 회귀로지스틱 회귀는 이름은 회귀이지만, 분류 모델이 분류 알고리즘은 선형 회귀와 동일하게 선형 방정식을 학습𝑧 = 𝑎 ∗ (𝑊𝑒𝑖𝑔ℎ𝑡) + 𝑏 ∗ (𝐿𝑒𝑛𝑔𝑡ℎ) + 𝑐 ∗(𝐷𝑖𝑎𝑔𝑜𝑛𝑎𝑙) + 𝑑 ∗ (𝐻𝑒𝑖𝑔ℎ𝑡) + 𝑒 ∗ (𝑊𝑖𝑑𝑡ℎ) + 𝑓 확률 처리를 위한 0~1(또는 0~100%) 사이 값으로 만들기 위해 시그모이드 함수 (Sigmoid function) (또는 로지스틱 함수 logistic function)을 사용 ( 즉, 시그모이드 함수 : 선형 방정식의 출력을 0과 1 사이의 값으로 압축한다. ) 더보기 𝑧 = 𝑎 ∗ (𝑊..

안녕하세요 ! 오늘은 혼공머신 2주차 회귀 알고리즘과 규제에 대해서 알아보겠습니다 ! 지도 학습 알고리즘- 분류 (Classification) : 샘플을 몇 개의 클래스 중 하나로 구별하는 문제- 회귀(Regression) : 기존 데이터 X가 주어졌을 때, 적절한 Y를 예측하는 알고리즘 k-최근접 이웃 분류 알고리즘 예측하려는 샘플에 가장 가까운 샘플 k개를 선택한다샘플들의 클래스를 살펴보고, 다수의 클래스를 새로운 클래스로 예측한다k-최근접 이웃 회귀 ( K-Nearest Neighbor Regression )예측하고자 하는 샘플에 가장 가까운 샘플 k개 선택 (여기서 말하는 이웃 샘플의 타깃은 클래스가 아닌 임의의 수치이웃 샘플의 수치를 확인한다수치들의 평균을 구하고, 새로운 샘플의 타깃을 예측한..

이번에, 새롭게 혼공단 12기에 참여할 수 있게 되어 기쁜 마음으로 공부를 시작해보도록 하겠습니다 ! :) 그러면 빠르게 공부한 내용을 정리해보겠습니다 ! - 인공지능과 머신러닝, 딥러닝 인공지능 ( Artificial Intelligence ) : 사람처럼 학습하고, 추론할 수 있는 지능을 가진 컴퓨터 시스템을 만드는 기술머신러닝 ( Machine Learning ) : 1. 규칙을 하나 하나 일일이 프로그래밍하지 않아도 자동으로 데이터에서 규칙을 학습하는 알고리즘을 연구하는 분 2. 인공지능의 하위 분애 중에서 지능을 구현하기 위한 소프트웨어를 담당하는 핵심 분야 3. 컴퓨터 과학 분야의 대표적인 머신러닝 라이브러리 : 사이킷런 ( Scikit-learn ) 딥러닝 (Deep Learning ) : ..
1. Solve the exercise problem 14 of the chapter 7. 합병정렬 알고리즘은 분할정복(divide and conquer) 방식을 사용하여 리스트를 반으로 나눈 후, 각각을 재귀적으로 정렬하고 다시 합병(merge)하는 과정을 반복하여 정렬을 수행합니다. 합병하는 과정에서 레코드를 비교하고 저장하게 되는데, 두 개의 리스트를 비교하면서 작은 값을 새로운 리스트에 저장하는 것을 반복합니다. 이때 레코드의 저장 횟수는 입력 크기 n에 비례합니다. 따라서, 합병정렬 알고리즘의 시간 복잡도는 두 개의 리스트를 합병하는 과정에서 레코드를 저장하는 횟수인 2n에 로그를 씌운 nlgn이 됩니다. 따라서, T(n) = 2nlgn으로 나타낼 수 있습니다. 파이썬에서 구현된 합병정렬 알고리..