참고자료: 이것이 코딩테스트다
정렬 알고리즘 개요
📌정렬: 데이터를 특정한 기준에 따라서 순서대로 나열한다. 이진 탐색의 전처리 과정이기도 하다.
💡 다음 카드를 오름차순으로 정렬하자.
[7] [5] [9] [0] [3] [1] [6] [2] [4] [8]
✅선택 정렬 사용
📌선택 정렬: 가장 작은 것을 선택한다.
👉🏻가장 작은 데이터를 선택해 맨 앞에 있는 데이터와 바꾸고, 그 다음 작은 데이터를 선택해 앞에서 두 번째 데이터와 바꾸는 과정을 반복한다.
array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]
for i in range(len(array)):
min_index = i
for j in range(i + 1, len(array)):
if array[min_index] > array[j]
min_index = j
array[i], array[min_index] = array[min_index], array[i] #스와프
print(array)
👉🏻스와프를 활용해 선택 정렬을 구현했다. 스와프란 특정한 리스트가 주어졌을 때 두 변수의 위치를 변경하는 작업이다.
👉🏻시간 복잡도는 O(N제곱)이다. 이중 반복문이 사용되었기 때문이다. 때문에 다른 알고리즘에 비해 비효율적이다.
✅삽입 정렬 사용
📌삽입 정렬: 특정한 데이터를 적절한 위치에 삽입한다. 특정한 데이터가 적절한 위치에 들어가기 전에 그 앞까지의 데이터는 이미 정렬되어 있다고 가정한다.
👉🏻두 번째 데이터부터 정렬을 시작한다. 첫 번째 데이터는 그 자체로 정렬되어 있다고 판단하기 때문이다.
array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]
for i in range(1, len(array)):
for j in range(i, 0, -1):
if array[j] < array[j - 1]:
array[j], array[j - 1] = array[j - 1] < array[j]
else:
break
print(array)
👉🏻시간 복잡도는 O(N제곱)이다. 역시 2중 반복문이 있기 때문이다.
✅퀵 정렬 사용
📌퀵 정렬: 기준 데이터를 설정하고 그 기준보다 큰 데이터와 작은 데이터의 위치를 바꾼다. 기준의 역할이 되는 피벗이 사용된다.
👉🏻가장 많이 사용된다.
array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]
def quick_sort(array, start, end):
if start >= end: #원소가 1개인 경우 종료
return
pivot = start
left = start + 1
right = end
while left <= right:
#피벗보다 큰 데이터를 찾을 때까지 반복
while left <= end and array[left] <= array[pivot]
left += 1
#피벗보다 작은 데이터를 찾을 때까지 반복
while right > start and array[right] >= array[pivot]
right -= 1
if left > right: #엇갈렸다면 작은 데이터와 피벗을 교체
array[right], array[pivot] = array[pivot], array[right]
else: #엇갈리지 않았다면 작은 데이터와 큰 데이터를 교체
array[left], array[right] = array[right], array[left]
#분할 이후 왼쪽 부분과 오른쪽 부분에서 각각 정렬 수행
quick_sort(array, start, right - 1)
quick_sort(array, right + 1, end)
quick_sort(array, 0, len(array) - 1)
print(array)
👉🏻피벗을 설정하여 정렬을 수행한 이후에 피벗을 기준으로 왼쪽 리스트와 오른쪽 리스트를 각각 다시 정렬을 수행해야 한다. 아는 재귀 함수와 동작 원리가 같다.
array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]
def quick_sort(array):
#리스트가 하나 이하의 원소만을 담고 있다면 종료
if len(array) <= 1:
return array
pivot = array[0] #피벗은 첫 번째 원소
tail = array[1:] #피벗을 제외한 리스트
left_side = [x for x in tail if x <= pivot] #분할된 왼쪽 부분
right_side = [x for x in tail if x > pivot] #분할된 오른쪽 부분
#분할 이후 왼쪽 부분과 오른쪽 부분에서 각각 정렬을 수행하고 전체 리스트를 반환
return quick_sort(left_side) + [pivot] + quick_sort(right_side)
print(quick_sort(array))
👉🏻해당 코드는 전통 퀵 정렬의 분할 방식과는 조금 다르고 파이썬읠 장점을 살린 코드이다. 피벗과 데이터를 비교하는 비교 연산 횟수가 증가해 시간 면에서 조금 비효율적이지만 더 직관적이고 기억하기 쉽다.
👉🏻퀵 정렬의 시간복잡도는 O(NlogN)이다.
✅계수 정렬 사용
📌계수 정렬: 데이터의 크기 범위가 제한되어 정수 형태로 표현할 수 있을 때만 사용가능하지만 매우 빠른 정렬 알고리즘이다. 데이터의 개수가 N, 데이터 중 최댓값이 K일 때 수행 시간이 O(N + K)이다.
👉🏻일반적으로 별도의 리스트를 선언하고 그 안에 정렬에 대한 정보를 담는다.
#모든 원소의 값이 0보다 크거나 같다고 가정
array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]
#모든 범위를 포함하는 리스트 선언(모든 값은 0으로 초기화)
count = [0] * (max(array) + 1)
for i in range(len(array)):
count[array[i]] += 1 #각 데이터에 해당하는 인덱스의 값 증가
for i in range(len(count)): #리스트에 기록된 정렬 정보 확인
for j in range(count[i]):
print(i, end = ' ') #띄어쓰기를 구분으로 등장한 횟수만큼 인덱스 출력
👉🏻계수 정렬의 시간복잡도는 O(N + K)이다.
🐰이중 리스트인데 왜 얘는 시간복잡도가 낮을까
👉🏻계수 정렬의 공간복잡도는 O(N + K)이다. 때에 따라서 심각한 비효율성을 초해한다. 만약 데이터가 0과 999,999 단 2개만 존재해도 리스트의 크기가 100만개가 되도록 선언해야 하기 때문이다.
✅파이썬의 정렬 라이브러리
📌파이썬은 sorted()와 sort()라는 함수를 제공한다. 퀵정렬과 동작 방식이 비슷하다.
👉🏻두 함수 모두 key 매개변수를 입력으로 받을 수 있다.
array = [('바나나', 2), ('사과', 5), ('당근', 3)]
def setting(data):
return data[1]
result = sorted(array, key=setting)
print(result)
#[('바나나', 2), ('당근', 3), ('사과', 5)]
👉🏻key로 setting함수를 설정했다. setting 함수를 살펴보면 data(위 코드에서는 튜플이 해당됨)의 첫 번째 인덱스를 반환하기 때문에 한글이 아닌 숫자로 비교해서 정렬하는 것이다.
👉🏻정렬 라이브러리는 최악에 경우에도 시간복잡도 O(NlogN)을 보장한다.
'그 땐 Algorithm했지 > 그 땐 Python했지' 카테고리의 다른 글
[TAVE/이코테] ch07 이진 탐색 | 개념 정리 (0) | 2022.03.30 |
---|---|
[TAVE/이코테] ch06 정렬 | 실전 문제 (0) | 2022.03.28 |
[TAVE/이코테] ch05 DFS/BFS | 개념 정리 | 실전 문제 (0) | 2022.03.26 |
[TAVE/이코테] ch04 구현 | 개념 정리 | 실전 문제 (0) | 2022.03.25 |
[TAVE/이코테] ch03 그리디 | 개념 정리 | 실전 문제 (0) | 2022.03.22 |