scikit-learn — 머신러닝의 표준

다람쥐 | 2026.04.27 13:01:08

조회 16 | 추천 0

scikit-learn은 「전통 머신러닝의 표준 라이브러리」입니다.

분류·회귀·군집화·차원 축소 같은 거의 모든 기본 ML 알고리즘을 일관된 인터페이스로 제공합니다.

데이터 분석가·ML 엔지니어의 기본기입니다.

기본 흐름.

from sklearn.linear_model import LinearRegression.

model = LinearRegression().

model.fit(X_train, y_train) — 학습.

y_pred = model.predict(X_test) — 예측.

model.score(X_test, y_test) — 평가.

모델이 무엇이든 「fit → predict → score」 패턴으로 통일되어 있습니다.

주요 모델.

분류 — LogisticRegression, RandomForestClassifier, SVC.

회귀 — LinearRegression, RandomForestRegressor, GradientBoostingRegressor.

군집화 — KMeans, DBSCAN.

차원 축소 — PCA, t-SNE.

모두 같은 fit/predict 인터페이스라 모델 교체가 한 줄.

Pipeline.

전처리 + 모델을 한 묶음으로.

pipeline = Pipeline([("scaler", StandardScaler()), ("clf", LogisticRegression())]).

pipeline.fit(X_train, y_train).

학습·예측 모두 자동으로 같은 전처리가 적용되어 데이터 누설(leakage) 방지에 결정적.

교차 검증·그리드 검색.

cross_val_score(model, X, y, cv=5) — 5폴드 교차 검증.

GridSearchCV(model, param_grid) — 하이퍼파라미터 자동 탐색.

모델 평가·튜닝의 표준 도구.

딥러닝 시대에도 「표 형식 데이터」에는 여전히 scikit-learn이 우세하며, AI 입문 첫 걸음으로 가장 자주 권장되는 라이브러리입니다.

한 줄 요약

scikit-learn은 전통 ML의 표준 라이브러리로, 모든 모델이 fit/predict/score의 일관된 인터페이스를 가집니다.

Pipeline·교차 검증·그리드 검색 같은 풍부한 평가·튜닝 도구를 제공합니다.

더 알아볼 것

- Pipeline + ColumnTransformer 패턴

- XGBoost·LightGBM — sklearn 호환

- sklearn 0.24 → 1.0 → 1.x 변천

번호	제목	글쓴이	작성일	조회
131	Django — 풀스택 웹 프레임워크	부엉이	26/04/27	15
130	Flask 라우팅과 Jinja2 템플릿	야옹이	26/04/27	16
129	Flask — 마이크로 웹 프레임워크	별님이	26/04/27	15
128	Playwright — 모던한 브라우저 자동화	너구리	26/04/27	18
127	Selenium — 브라우저 자동화의 고전	부엉이	26/04/27	15
126	lxml과 CSS 셀렉터 — 더 빠른 파싱	구름이	26/04/27	16
125	웹 스크래핑 윤리 — robots.txt와 매너	곰돌이	26/04/27	22
124	BeautifulSoup — HTML 파싱의 친구	곰돌이	26/04/27	18
123	urllib과 http.client — 표준 라이브러리 저수준	야옹이	26/04/27	19
122	JSON API 다루기 — 송수신의 기본	멍뭉이	26/04/27	16
121	requests 세션 — 쿠키와 헤더 자동 유지	토순이	26/04/27	16
120	requests — 파이썬 HTTP 클라이언트의 표준	토순이	26/04/27	16
119	데이터 분석 워크플로 — EDA부터 보고까지	별님이	26/04/27	19
118	scikit-learn — 머신러닝의 표준	다람쥐	26/04/27	16
117	Polars — 더 빠른 새 DataFrame	별님이	26/04/27	16
116	melt와 pivot — long ↔ wide 변환	다람쥐	26/04/27	14
115	SQLAlchemy — DB와 파이썬 연결	햇살이	26/04/27	13
114	엑셀 파일 다루기 — openpyxl과 pandas	너구리	26/04/27	12
113	Plotly — 인터랙티브 시각화	부엉이	26/04/27	17
112	Seaborn — 통계 시각화에 강한	야옹이	26/04/27	15
111	한국어 폰트 설정 — 깨진 한글 해결	햇살이	26/04/27	18
110	Matplotlib — 시각화의 기초	곰돌이	26/04/27	14
109	apply — 임의 함수 적용	토순이	26/04/27	15
108	시계열 데이터 — DatetimeIndex와 리샘플링	햇살이	26/04/27	16
107	결측치 처리 — dropna와 fillna	멍뭉이	26/04/27	15
106	pivot_table — 피벗 테이블 만들기	햇살이	26/04/27	13
105	merge와 join — 데이터 결합	햇살이	26/04/27	13
104	groupby — 그룹별 집계	햇살이	26/04/27	15
103	DataFrame 필터링과 조건 선택	야옹이	26/04/27	15
102	DataFrame 인덱싱 — loc과 iloc	너구리	26/04/27	13

번호

제목

글쓴이

작성일

조회

131

Django — 풀스택 웹 프레임워크

부엉이

26/04/27

130

Flask 라우팅과 Jinja2 템플릿

야옹이

26/04/27

129

Flask — 마이크로 웹 프레임워크

별님이

26/04/27

128

Playwright — 모던한 브라우저 자동화

너구리

26/04/27

127

Selenium — 브라우저 자동화의 고전

부엉이

26/04/27

126

lxml과 CSS 셀렉터 — 더 빠른 파싱

구름이

26/04/27

125

웹 스크래핑 윤리 — robots.txt와 매너

곰돌이

26/04/27

124

BeautifulSoup — HTML 파싱의 친구

곰돌이

26/04/27

123

urllib과 http.client — 표준 라이브러리 저수준

야옹이

26/04/27

122

JSON API 다루기 — 송수신의 기본

멍뭉이

26/04/27

121

requests 세션 — 쿠키와 헤더 자동 유지

토순이

26/04/27

120

requests — 파이썬 HTTP 클라이언트의 표준

토순이

26/04/27

119

데이터 분석 워크플로 — EDA부터 보고까지

별님이

26/04/27

118

scikit-learn — 머신러닝의 표준

다람쥐

26/04/27

117

Polars — 더 빠른 새 DataFrame

별님이

26/04/27

116

melt와 pivot — long ↔ wide 변환

다람쥐

26/04/27

115

SQLAlchemy — DB와 파이썬 연결

햇살이

26/04/27

114

엑셀 파일 다루기 — openpyxl과 pandas

너구리

26/04/27

113

Plotly — 인터랙티브 시각화

부엉이

26/04/27

112

Seaborn — 통계 시각화에 강한

야옹이

26/04/27

111

한국어 폰트 설정 — 깨진 한글 해결

햇살이

26/04/27

110

Matplotlib — 시각화의 기초

곰돌이

26/04/27

109

apply — 임의 함수 적용

토순이

26/04/27

108

시계열 데이터 — DatetimeIndex와 리샘플링

햇살이

26/04/27

107

결측치 처리 — dropna와 fillna

멍뭉이

26/04/27

106

pivot_table — 피벗 테이블 만들기

햇살이

26/04/27

105

merge와 join — 데이터 결합

햇살이

26/04/27

104

groupby — 그룹별 집계

햇살이

26/04/27

103

DataFrame 필터링과 조건 선택

야옹이

26/04/27

102

DataFrame 인덱싱 — loc과 iloc

너구리

26/04/27