AI 입문자가 자주 헷갈려 하는 두 단어가 「알고리즘(algorithm)」과 「모델(model)」입니다.
둘은 서로 다른 개념이지만 일상 대화에서는 자주 섞여 쓰여 혼란을 부릅니다.
알고리즘은 「문제를 푸는 방법·절차」를 가리킵니다.
요리에 비유하면 알고리즘은 「레시피」입니다.
「밀가루를 넣고, 물을 부어 반죽하고, 30분 발효시키고, 220도에서 25분 굽는다」는 단계의 묶음이 한 알고리즘입니다.
모델은 그 알고리즘을 실제 데이터에 적용해 얻은 「결과물」입니다.
같은 비유에서 모델은 「만들어진 빵 한 덩이」에 해당합니다.
같은 레시피라도 누가 어떤 밀가루를 써서 만들었느냐에 따라 빵 한 덩이는 달라집니다.
구체적으로 「선형 회귀(linear regression)」는 알고리즘이고, 「내가 우리 동네 집값 데이터를 그 알고리즘으로 학습시켜 만든 함수」는 모델입니다.
마찬가지로 「Transformer」는 알고리즘(아키텍처)이고, 「OpenAI가 그 아키텍처로 거대 데이터를 학습시켜 만든 GPT-4」는 모델입니다.
정리하자면 알고리즘은 「과정」이고 모델은 「산물」입니다.
같은 알고리즘으로도 데이터·하이퍼파라미터·학습 시간이 다르면 전혀 다른 모델이 나오며, 우리가 실제 사용하는 것은 결국 모델 쪽입니다.
한 줄 요약
알고리즘은 문제를 푸는 「방법·절차」이고 모델은 그 알고리즘으로 데이터를 학습시켜 만든 「결과물」입니다.
같은 알고리즘으로도 데이터에 따라 모델은 천차만별이 됩니다.
더 알아볼 것
- 아키텍처(architecture) — 알고리즘의 큰 설계도
- 체크포인트(checkpoint) — 학습 중간 시점의 모델 저장본
- 서로 다른 데이터로 학습된 같은 아키텍처의 모델 비교