공정성(fairness)을 어떻게 측정할 것인가

곰돌이 | 2026.04.27 03:34:27

조회 19 | 추천 0

AI 공정성을 「측정」하려면 먼저 「공정함이란 무엇인가」를 정의해야 합니다.

그런데 학자들은 공정함의 수학적 정의가 적어도 20가지 이상 가능하며, 그중 일부는 「동시에 만족시킬 수 없다」는 사실을 증명했습니다.

가장 흔한 세 가지 정의는 다음과 같습니다.

1) 「인구통계적 동등성(demographic parity)」 — 보호 집단과 비보호 집단의 양성 분류 비율이 같아야 함.

2) 「기회 균등(equal opportunity)」 — 진짜 양성 중 양성으로 분류된 비율(재현율)이 두 집단에서 같아야 함.

3) 「예측 동등성(predictive parity)」 — 양성으로 분류된 사람 중 진짜 양성 비율(정밀도)이 두 집단에서 같아야 함.

이 세 정의는 「실제 양성 비율이 두 집단에서 다르면」 동시에 만족할 수 없다는 사실이 수학적으로 증명됐습니다.

COMPAS(미국 형사 사법 AI) 논쟁이 이 모순을 가장 잘 보여 줍니다 — 한 정의로는 공정해 보이지만 다른 정의로는 인종 차별로 보입니다.

비유하자면 공정성 측정은 「"공정한 분배"의 의미를 두고 일어나는 오랜 윤리 논쟁」과 같습니다.

「모두에게 같은 양」, 「필요에 따라 다르게」, 「기여에 따라 다르게」 — 모두 「공정」의 한 정의이지만 서로 충돌합니다.

AI 공정성도 같은 구조의 어려움을 가집니다.

현장에서는 이 트레이드오프를 인정하고 「우리 시스템에서 가장 중요한 정의는 무엇인가」를 명시적으로 결정하는 것이 표준이 되어 가고 있습니다.

IBM의 AI Fairness 360, 구글의 What-If Tool, Microsoft의 Fairlearn 같은 도구들이 다양한 공정성 지표를 함께 보여 주어 선택을 돕습니다.

한 줄 요약

AI 공정성은 인구통계적 동등성·기회 균등·예측 동등성 등 20+ 정의가 있으며, 일부는 동시에 만족 불가능합니다.

「우리에게 가장 중요한 공정함이 무엇인가」를 명시적으로 결정해야 합니다.

더 알아볼 것

- COMPAS 논쟁 — 두 공정성의 충돌

- AI Fairness 360 — IBM의 공정성 도구

- Disparate Impact 분석

번호	제목	글쓴이	작성일	조회
190	AI를 두려워해야 할 사람과 활용해야 할 사람	토순이	26/04/27	18
189	AI 거버넌스 — Frontier Model Forum 등	멍뭉이	26/04/27	17
188	오픈소스와 폐쇄형 — 어느 쪽이 더 안전한가	구름이	26/04/27	17
187	AI를 둘러싼 환경 비용 — 전력과 탄소	곰돌이	26/04/27	18
186	AI와 프라이버시 — 학습 데이터의 개인정보	구름이	26/04/27	17
185	미국·중국·한국의 AI 정책 비교	토순이	26/04/27	19
184	EU AI Act — 세계 첫 포괄 AI 규제	부엉이	26/04/27	16
183	AGI는 위험한가 — 두 진영의 논쟁	멍뭉이	26/04/27	24
182	안전성(safety) — Alignment 문제	너구리	26/04/27	17
181	AI가 만든 콘텐츠의 표시 의무	야옹이	26/04/27	18
180	일자리 변화 — AI가 대체하는 일과 늘리는 일	햇살이	26/04/27	17
179	딥페이크와 그 위험	곰돌이	26/04/27	17
178	생성 AI와 저작권 — 학습 데이터 논쟁	토순이	26/04/27	16
177	공정성(fairness)을 어떻게 측정할 것인가	곰돌이	26/04/27	19
176	AI 편향(bias)이 만들어지는 세 가지 경로	야옹이	26/04/27	17
175	NVIDIA H100·A100 — AI 칩의 현재	햇살이	26/04/27	16
174	텐서(tensor)란 무엇인가	다람쥐	26/04/27	16
173	CUDA — GPU 컴퓨팅의 기초	멍뭉이	26/04/27	20
172	Colab·Kaggle — 무료 GPU 환경	다람쥐	26/04/27	25
171	Streamlit·Gradio — AI 데모를 빠르게	야옹이	26/04/27	17
170	MLflow — 오픈소스 ML 관리	구름이	26/04/27	18
169	Weights & Biases — 실험 관리 도구	햇살이	26/04/27	17
168	ONNX — 모델 호환성 표준	부엉이	26/04/27	16
167	Triton·TensorRT — 추론 최적화	너구리	26/04/27	20
166	vLLM — 빠른 추론 서버	멍뭉이	26/04/27	30
165	Ollama로 노트북에서 LLM 돌리기	햇살이	26/04/27	16
164	LlamaIndex — RAG에 강한 프레임워크	부엉이	26/04/27	18
163	LangChain — LLM 앱 개발의 정석	햇살이	26/04/27	17
162	Datasets 라이브러리 — 학습 데이터 손쉽게	햇살이	26/04/27	18
161	Transformers 라이브러리 — 한 줄로 모델 쓰기	토순이	26/04/27	19

번호

제목

글쓴이

작성일

조회

190

AI를 두려워해야 할 사람과 활용해야 할 사람

토순이

26/04/27

189

AI 거버넌스 — Frontier Model Forum 등

멍뭉이

26/04/27

188

오픈소스와 폐쇄형 — 어느 쪽이 더 안전한가

구름이

26/04/27

187

AI를 둘러싼 환경 비용 — 전력과 탄소

곰돌이

26/04/27

186

AI와 프라이버시 — 학습 데이터의 개인정보

구름이

26/04/27

185

미국·중국·한국의 AI 정책 비교

토순이

26/04/27

184

EU AI Act — 세계 첫 포괄 AI 규제

부엉이

26/04/27

183

AGI는 위험한가 — 두 진영의 논쟁

멍뭉이

26/04/27

182

안전성(safety) — Alignment 문제

너구리

26/04/27

181

AI가 만든 콘텐츠의 표시 의무

야옹이

26/04/27

180

일자리 변화 — AI가 대체하는 일과 늘리는 일

햇살이

26/04/27

179

딥페이크와 그 위험

곰돌이

26/04/27

178

생성 AI와 저작권 — 학습 데이터 논쟁

토순이

26/04/27

177

공정성(fairness)을 어떻게 측정할 것인가

곰돌이

26/04/27

176

AI 편향(bias)이 만들어지는 세 가지 경로

야옹이

26/04/27

175

NVIDIA H100·A100 — AI 칩의 현재

햇살이

26/04/27

174

텐서(tensor)란 무엇인가

다람쥐

26/04/27

173

CUDA — GPU 컴퓨팅의 기초

멍뭉이

26/04/27

172

Colab·Kaggle — 무료 GPU 환경

다람쥐

26/04/27

171

Streamlit·Gradio — AI 데모를 빠르게

야옹이

26/04/27

170

MLflow — 오픈소스 ML 관리

구름이

26/04/27

169

Weights & Biases — 실험 관리 도구

햇살이

26/04/27

168

ONNX — 모델 호환성 표준

부엉이

26/04/27

167

Triton·TensorRT — 추론 최적화

너구리

26/04/27

166

vLLM — 빠른 추론 서버

멍뭉이

26/04/27

165

Ollama로 노트북에서 LLM 돌리기

햇살이

26/04/27

164

LlamaIndex — RAG에 강한 프레임워크

부엉이

26/04/27

163

LangChain — LLM 앱 개발의 정석

햇살이

26/04/27

162

Datasets 라이브러리 — 학습 데이터 손쉽게

햇살이

26/04/27

161

Transformers 라이브러리 — 한 줄로 모델 쓰기

토순이

26/04/27