[라이트 머신러닝] Session 6. 사이킷런 입문!
·
🐬 ML & Data/🎫 라이트 머신러닝
이번 세션에서는 사이킷런 라이브러리를 이용해서 퍼셉트론을 훈련해봄으로써 사이킷런을 시작하도록 하겠습니다. 이번 세션도 전과 마찬가지로 저는 Google Colab으로 실습합니다. Colab에는 이미 사이킷런이 설치되어있으므로 별도의 설치없이 사용하시면 됩니다! https://colab.research.google.com Google Colaboratory colab.research.google.com 1. 데이터 주입과 표준화 이번 세션에서는 세션 4와 5에서 구현한 것과 비슷한 퍼셉트론 모델을 사용할 것입니다. 사용할 붓꽃 데이터 셋은 이미 사이킷런에 포함되어있으므로, 따로 다운받을 필요는 없습니다. 꽃 샘플 중에 꽃입 길이와 너비를 행렬 X에, 꽃 품종을 벡터 Y에 할당합니다. from sklearn..
[라이트 머신러닝] Session 2. 머신러닝 시작 전에 알아두면 좋은 것들
·
🐬 ML & Data/🎫 라이트 머신러닝
이번 포스트에서는 머신러닝을 시작하기 전에 알아두면 유용한 표기법과 용어, 머신러닝 모델을 만드는 과정과 사용하게 될 패키지에 대해서 알아보도록 하겠습니다. 내용에 대한 피드백은 언제나 환영합니다! 1. 알아두면 좋은 용어와 표기법 데이터셋은 행렬과 벡터를 통해서 표현됩니다. 일반적으로 샘플을 행으로, 특성은 열로 저장됩니다. 위 그림에서 첫 열에 보이는 숫자들은 샘플들을 나타냅니다. 각 샘플별로 특성들은 행 단위로, 각 특성에 대한 샘플들의 값은 열 단위로 표현됩니다. 보통 소문자는 벡터를, 대문자는 행렬을 나타내며, 위 첨자는 i번째 훈련 샘플을, 아래 첨자 j는 훈련 데이터의 j번째 차원을 나타냅니다. 2. 머신러닝 시스템 작업순서 머신러닝 작업은 크게 전처리 - 학습 - 평가 - 예측의 수순을 밟..