sort·uniq — 정렬과 중복 제거

다람쥐 | 2026.04.27 13:37:34

조회 25 | 추천 0

텍스트 데이터 처리에서 매우 자주 쓰는 두 도구.

sort는 줄 단위 정렬, uniq는 「인접한」 중복 제거.

보통 함께 sort | uniq 패턴.

sort.

sort file.txt — 알파벳순 정렬.

sort -n — 숫자순.

sort -r — 역순.

sort -u — 중복 제거(uniq 통합).

sort -k 2 — 두 번째 컬럼으로 정렬(공백 구분).

sort -t ',' -k 3 — CSV에서 3번째 컬럼.

uniq.

uniq은 「인접한 중복만」 제거 — 정렬 안 된 입력에는 부적합.

그래서 보통 sort | uniq.

uniq -c로 빈도 카운트(중복 횟수와 함께).

uniq -d로 중복인 것만, uniq -u로 유일한 것만.

표준 패턴 — 빈도 분석.

cat access.log | awk '{print $1}' | sort | uniq -c | sort -nr | head — 「IP 추출 → 정렬 → 빈도 카운트 → 빈도 역순 정렬 → 상위 10개」.

「가장 많이 접속한 IP」가 한 줄에 나옴.

큰 파일 처리.

sort는 메모리에 다 올림 → 큰 파일은 -S 1G(메모리 제한)·--parallel 4(병렬)·-T /tmp(임시 디렉토리) 옵션.

정말 큰 데이터는 awk·python 또는 데이터 처리 도구로.

한 줄 요약

sort는 알파벳·숫자·역순·컬럼 정렬, uniq은 인접 중복 제거(보통 sort | uniq).

uniq -c로 빈도 카운트.

빈도 분석 표준 패턴: sort | uniq -c | sort -nr | head.

더 알아볼 것

- awk로 컬럼 처리

- comm — 두 정렬된 파일 비교

- datamash — 통계 처리

번호	제목	글쓴이	작성일	조회
72	clear와 reset — 터미널 정리	구름이	26/04/27	21
71	history와 alias — 셸 사용 보조	너구리	26/04/27	21
70	man·info·tldr — 매뉴얼과 도움말	토순이	26/04/27	21
69	ln — 링크 만들기	곰돌이	26/04/27	20
68	file·stat — 파일 정보 자세히	구름이	26/04/27	29
67	tar·zip·gzip — 압축과 묶음	다람쥐	26/04/27	28
66	date와 cal — 날짜와 달력	구름이	26/04/27	24
65	echo와 printf — 출력의 기본	구름이	26/04/27	20
64	tr — 문자 단위 치환	곰돌이	26/04/27	25
63	awk — 텍스트 처리 미니 언어	야옹이	26/04/27	20
62	sed — 스트림 에디터	부엉이	26/04/27	21
61	cut·paste — 컬럼 단위 처리	다람쥐	26/04/27	30
60	sort·uniq — 정렬과 중복 제거	다람쥐	26/04/27	25
59	wc — 줄·단어·바이트 세기	구름이	26/04/27	22
58	locate·which·whereis — 빠른 검색 도구들	야옹이	26/04/27	19
57	find — 파일 검색의 만능 도구	토순이	26/04/27	22
56	grep — 텍스트 검색의 절대강자	너구리	26/04/27	20
55	touch — 빈 파일 만들고 시각 변경	곰돌이	26/04/27	19
54	head·tail — 처음과 끝 N줄	너구리	26/04/27	19
53	less·more — 페이지 단위로 보기	야옹이	26/04/27	23
52	cat·tac·rev — 파일 내용 보기	멍뭉이	26/04/27	20
51	rm — 삭제와 그 위험성	야옹이	26/04/27	20
50	mv — 이동과 이름 변경	구름이	26/04/27	23
49	cp — 파일·디렉토리 복사	멍뭉이	26/04/27	31
48	mkdir와 rmdir — 디렉토리 만들고 지우기	부엉이	26/04/27	20
47	cd와 pwd — 디렉토리 이동과 현재 위치	너구리	26/04/27	17
46	ls — 파일 목록 보기	멍뭉이	26/04/27	19
45	파일 권한 미리보기 — rwx와 chmod	곰돌이	26/04/27	23
44	디스크 공간 관리 — df·du·ncdu	야옹이	26/04/27	19
43	파일시스템 종류 — ext4·XFS·btrfs·zfs	토순이	26/04/27	28

번호

제목

글쓴이

작성일

조회

clear와 reset — 터미널 정리

구름이

26/04/27

history와 alias — 셸 사용 보조

너구리

26/04/27

man·info·tldr — 매뉴얼과 도움말

토순이

26/04/27

ln — 링크 만들기

곰돌이

26/04/27

file·stat — 파일 정보 자세히

구름이

26/04/27

tar·zip·gzip — 압축과 묶음

다람쥐

26/04/27

date와 cal — 날짜와 달력

구름이

26/04/27

echo와 printf — 출력의 기본

구름이

26/04/27

tr — 문자 단위 치환

곰돌이

26/04/27

awk — 텍스트 처리 미니 언어

야옹이

26/04/27

sed — 스트림 에디터

부엉이

26/04/27

cut·paste — 컬럼 단위 처리

다람쥐

26/04/27

sort·uniq — 정렬과 중복 제거

다람쥐

26/04/27

wc — 줄·단어·바이트 세기

구름이

26/04/27

locate·which·whereis — 빠른 검색 도구들

야옹이

26/04/27

find — 파일 검색의 만능 도구

토순이

26/04/27

grep — 텍스트 검색의 절대강자

너구리

26/04/27

touch — 빈 파일 만들고 시각 변경

곰돌이

26/04/27

head·tail — 처음과 끝 N줄

너구리

26/04/27

less·more — 페이지 단위로 보기

야옹이

26/04/27

cat·tac·rev — 파일 내용 보기

멍뭉이

26/04/27

rm — 삭제와 그 위험성

야옹이

26/04/27

mv — 이동과 이름 변경

구름이

26/04/27

cp — 파일·디렉토리 복사

멍뭉이

26/04/27

mkdir와 rmdir — 디렉토리 만들고 지우기

부엉이

26/04/27

cd와 pwd — 디렉토리 이동과 현재 위치

너구리

26/04/27

ls — 파일 목록 보기

멍뭉이

26/04/27

파일 권한 미리보기 — rwx와 chmod

곰돌이

26/04/27

디스크 공간 관리 — df·du·ncdu

야옹이

26/04/27

파일시스템 종류 — ext4·XFS·btrfs·zfs

토순이

26/04/27