본문 바로가기

그 땐 Algorithm했지/그 땐 Python했지

[TAVE/이코테] ch06 정렬 | 개념 정리

728x90

참고자료: 이것이 코딩테스트다

정렬 알고리즘 개요

📌정렬: 데이터를 특정한 기준에 따라서 순서대로 나열한다. 이진 탐색의 전처리 과정이기도 하다.

💡 다음 카드를 오름차순으로 정렬하자.
    [7] [5] [9] [0] [3] [1] [6] [2] [4] [8] 

✅선택 정렬 사용

📌선택 정렬: 가장 작은 것을 선택한다.

👉🏻가장 작은 데이터를 선택해 맨 앞에 있는 데이터와 바꾸고, 그 다음 작은 데이터를 선택해 앞에서 두 번째 데이터와 바꾸는 과정을 반복한다.

array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

for i in range(len(array)):
    min_index = i
    for j in range(i + 1, len(array)):
        if array[min_index] > array[j]
            min_index = j
    array[i], array[min_index] = array[min_index], array[i] #스와프
    
print(array)

👉🏻스와프를 활용해 선택 정렬을 구현했다. 스와프란 특정한 리스트가 주어졌을 때 두 변수의 위치를 변경하는 작업이다.

👉🏻시간 복잡도는 O(N제곱)이다. 이중 반복문이 사용되었기 때문이다. 때문에 다른 알고리즘에 비해 비효율적이다.

 

✅삽입 정렬 사용

📌삽입 정렬: 특정한 데이터를 적절한 위치에 삽입한다. 특정한 데이터가 적절한 위치에 들어가기 전에 그 앞까지의 데이터는 이미 정렬되어 있다고 가정한다.

👉🏻두 번째 데이터부터 정렬을 시작한다. 첫 번째 데이터는 그 자체로 정렬되어 있다고 판단하기 때문이다.

array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

for i in range(1, len(array)):
    for j in range(i, 0, -1):
        if array[j] < array[j - 1]:
            array[j], array[j - 1] = array[j - 1] < array[j]
        else:
            break
            
print(array)

👉🏻시간 복잡도는 O(N제곱)이다. 역시 2중 반복문이 있기 때문이다. 

 

✅퀵 정렬 사용

📌퀵 정렬: 기준 데이터를 설정하고 그 기준보다 큰 데이터와 작은 데이터의 위치를 바꾼다. 기준의 역할이 되는 피벗이 사용된다.

👉🏻가장 많이 사용된다. 

array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

def quick_sort(array, start, end):
    if start >= end: #원소가 1개인 경우 종료
        return
    pivot = start
    left = start + 1
    right = end
    while left <= right:
        #피벗보다 큰 데이터를 찾을 때까지 반복
        while left <= end and array[left] <= array[pivot]
            left += 1
        #피벗보다 작은 데이터를 찾을 때까지 반복
        while right > start and array[right] >= array[pivot]
            right -= 1
        if left > right: #엇갈렸다면 작은 데이터와 피벗을 교체
            array[right], array[pivot] = array[pivot], array[right]
        else: #엇갈리지 않았다면 작은 데이터와 큰 데이터를 교체
            array[left], array[right] = array[right], array[left]
    #분할 이후 왼쪽 부분과 오른쪽 부분에서 각각 정렬 수행
    quick_sort(array, start, right - 1)
    quick_sort(array, right + 1, end)
    
quick_sort(array, 0, len(array) - 1)
print(array)

👉🏻피벗을 설정하여 정렬을 수행한 이후에 피벗을 기준으로 왼쪽 리스트와 오른쪽 리스트를 각각 다시 정렬을 수행해야 한다. 아는 재귀 함수와 동작 원리가 같다.

array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

def quick_sort(array):
    #리스트가 하나 이하의 원소만을 담고 있다면 종료
    if len(array) <= 1:
        return array
        
    pivot = array[0] #피벗은 첫 번째 원소
    tail = array[1:] #피벗을 제외한 리스트
    
    left_side = [x for x in tail if x <= pivot] #분할된 왼쪽 부분
    right_side = [x for x in tail if x > pivot] #분할된 오른쪽 부분
    
    #분할 이후 왼쪽 부분과 오른쪽 부분에서 각각 정렬을 수행하고 전체 리스트를 반환
    return quick_sort(left_side) + [pivot] + quick_sort(right_side)
    
print(quick_sort(array))

👉🏻해당 코드는 전통 퀵 정렬의 분할 방식과는 조금 다르고 파이썬읠 장점을 살린 코드이다. 피벗과 데이터를 비교하는 비교 연산 횟수가 증가해 시간 면에서 조금 비효율적이지만 더 직관적이고 기억하기 쉽다.

👉🏻퀵 정렬의 시간복잡도는 O(NlogN)이다. 

 

✅계수 정렬 사용

📌계수 정렬: 데이터의 크기 범위가 제한되어 정수 형태로 표현할 수 있을 때만 사용가능하지만 매우 빠른 정렬 알고리즘이다. 데이터의 개수가 N, 데이터 중 최댓값이 K일 때 수행 시간이 O(N + K)이다.

👉🏻일반적으로 별도의 리스트를 선언하고 그 안에 정렬에 대한 정보를 담는다

#모든 원소의 값이 0보다 크거나 같다고 가정
array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]
#모든 범위를 포함하는 리스트 선언(모든 값은 0으로 초기화)
count = [0] * (max(array) + 1)

for i in range(len(array)):
    count[array[i]] += 1 #각 데이터에 해당하는 인덱스의 값 증가

for i in range(len(count)): #리스트에 기록된 정렬 정보 확인
    for j in range(count[i]):
        print(i, end = ' ') #띄어쓰기를 구분으로 등장한 횟수만큼 인덱스 출력

👉🏻계수 정렬의 시간복잡도는 O(N + K)이다. 

🐰이중 리스트인데 왜 얘는 시간복잡도가 낮을까

👉🏻계수 정렬의 공간복잡도는 O(N + K)이다. 때에 따라서 심각한 비효율성을 초해한다. 만약 데이터가 0과 999,999 단 2개만 존재해도 리스트의 크기가 100만개가 되도록 선언해야 하기 때문이다.

 

✅파이썬의 정렬 라이브러리

📌파이썬은 sorted()sort()라는 함수를 제공한다. 퀵정렬과 동작 방식이 비슷하다. 

👉🏻두 함수 모두 key 매개변수를 입력으로 받을 수 있다.

array = [('바나나', 2), ('사과', 5), ('당근', 3)]

def setting(data):
    return data[1]
    
result = sorted(array, key=setting)
print(result)
#[('바나나', 2), ('당근', 3), ('사과', 5)]

👉🏻key로 setting함수를 설정했다. setting 함수를 살펴보면 data(위 코드에서는 튜플이 해당됨)의 첫 번째 인덱스를 반환하기 때문에 한글이 아닌 숫자로 비교해서 정렬하는 것이다.

👉🏻정렬 라이브러리는 최악에 경우에도 시간복잡도 O(NlogN)을 보장한다.

728x90