💡 Algorithm

Algorithm - [ 최단 경로 (1) ]

date
Jun 30, 2023
slug
algorithm-05
author
status
Public
tags
Python
Algorithm
summary
특정 지점까지 가장 빠르게 도달하는 방법을 찾는 알고리즘
type
Post
thumbnail
category
💡 Algorithm
updatedAt
Jul 28, 2023 07:29 AM

다익스트라 최단 경로 알고리즘

특정한 노드에서 출발하여 다른 노드로 가는 각각의 최단 경로를 구해주는 알고리즘이다.
매번 ‘가장 비용이 적은 노드’를 선택해서 임의의 과정을 반복하기 때문에 그리디 알고리즘으로 분류된다.
‘음의 간선’이 없을 때 정상적으로 동작하는데, 현실 세계에선 음의 간선으로 표현되지 않으므로 GPS의 기본 알고리즘으로 채택되곤 한다.
 

알고리즘 원리

  1. 출발 노드를 설정한다.
  1. 최단 거리 테이블을 초기화한다.
  1. 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택한다.
    1. 1을 방문 처리하고 최단 거리 업데이트
      1을 방문 처리하고 최단 거리 업데이트
  1. 해당 노드를 거쳐 다른 노드로 가는 비용을 계산하여 최단 거리 테이블을 갱신한다.
    1. 최단 거리가 가장 짧은 4를 방문 처리하고 최단 거리 업데이트
      최단 거리가 가장 짧은 4를 방문 처리하고 최단 거리 업데이트
  1. 위 과정에서 3번과 4번을 반복한다.
 
다익스트라 알고리즘은 최단 경로를 구하는 과정에서 ‘각 노드에 대한 현재까지의 최단 거리’ 정보를 항상 1차원 리스트에 저장하며 리스트를 계속 갱신한다는 특징이 있다.
 

다익스트라 알고리즘 구현 방법 2가지

  1. 구현하기 쉽지만 느리게 동작하는 코드
    1. 처음에 각 노드에 대한 최단 거리를 담는 1차원 리스트를 선언한다.
      이후에 단계마다 ‘방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택’하기 위해 매 단계마다 1차원 리스트의 모든 원소를 확인(순차 탐색)한다.
      # 간단한 다익스트라 알고리즘 # import sys # input = sys.stdin.readline # 무한 설정 INF = int(1e6) # 노드, 간선 n, m = map(int, input().split()) # 시작점 start = int(input()) # 간선 초기화 graph = [[] for _ in range(n + 1)] # 방문 초기화 visited = [False] * (n + 1) # 거리 무한으로 초기화 distance = [INF] * (n + 1) # 간선 정보 입력 for _ in range(m): a, b, c = map(int, input().split()) # a 노드에서 b 노드까지 거리가 c graph[a].append((b, c)) # 방문하지 않은 노드 중에서, 가장 최단 거리가 짧은 노드의 번호를 반환 def get_shortest_node(): min_value = INF index = 0 for _ in range(1, n + 1): if not visited[_] and distance[_] < min_value: min_value = distance[_] index = _ return index # 다익스트라 알고리즘 def dijkstra(start): # 시작 노드에 대해서 초기화 distance[start] = 0 visited[start] = True for j in graph[start]: distance[j[0]] = j[1] # 시작 노드를 제외한 전체 n - 1 개의 노드에 대해 반복 for i in range(n - 1): now = get_shortest_node() visited[now] = True # 현재 노드와 연결된 다른 노드를 확인 for j in graph[now]: cost = distance[now] + j[1] # 현재 노드를 거쳐서 다른 노드로 이동하는 거리가 더 짧은 경우 if cost < distance[j[0]]: distance[j[0]] = cost # 다익스트라 수행 dijkstra(start) # 모든 노드로 가기 위한 최단 거리를 출력 for i in range(1, n + 1): if distance[i] == INF: print("INFINITY") else: print(distance[i])
      번에 걸쳐서 최단 거리가 가장 짧은 노드를 매번 선형 탐색해야 하고, 현재 노드와 연결된 노드를 매번 일일이 확인하기 때문에, 의 시간 복잡도를 갖는다.
      (여기서 V 는 노드의 개수를 의미)
       
  1. 구현하기에 조금 더 까다롭지만 빠르게 동작하는 코드
    1. 개선된 다익스트라 알고리즘에서는 현재 가장 가까운 노드를 저장하기 위한 목적으로 힙 자료 구조를 이용한다.
      ⇒ 힙 자료 구조 덕분에 get_shortest_node() 라는 함수를 작성할 필요가 없어 BFS 와 비슷한 구조가 된다.
      • 힙 자료 구조란?
        • 힙 자료 구조는 우선 순위 큐를 구현하기 위하여 사용하는 자료 구조 중 하나
        • 우선 순위 큐는 우선 순위가 가장 높은 데이터를 가장 먼저 삭제한다는 점이 특징
        • 우선 순위 큐 라이브러리에 데이터의 묶음을 넣으면, 첫 번째 원소를 기준으로 우선 순위를 설정 ⇒ 따라서 (거리, 노드)으로 구성된다면 ‘거리’ 값이 우선 순위 값
        • 최소 힙을 이용하는 경우 ‘값이 낮은 데이터가 먼저 삭제’ 최대 힙을 이용하는 경우 ‘값이 높은 데이터가 먼저 삭제’
        • 파이썬에서 표준 라이브러리로 제공하는 heapq 는 데이터의 개수가 N 개일 때, 하나의 데이터를 삽입 및 삭제할 때의 시간 복잡도는 이다.
      # 개선된 다익스트라 알고리즘 (힙 자료 구조 이용) import heapq # import sys # input = sys.stdin.readline INF = int(1e6) # 노드, 간선 n, m = map(int, input().split()) # 시작점 start = int(input()) # 간선 정보 graph = [[] for _ in range(n + 1)] # 거리 초기화 distance = [INF] * (n + 1) # 간선 정보 입력 for _ in range(m): a, b, c = map(int, input().split()) # a 노드에서 b 노드까지 거리가 c graph[a].append((b, c)) # 개선된 다익스트라 def dijkstra(start): q = [] # '거리'를 우선 순위 값으로 사용하기 위해 -> (거리, 노드) heapq.heappush(q, (0, start)) distance[start] = 0 while q: # 거리가 가장 짧은 값이 먼저 삭제 -> BFS 와 다른 부분 dist, now = heapq.heappop(q) # 이미 처리된 적이 있는 노드라면 무시 if distance[now] < dist: continue # 현재 연결된 노드와 인접한 노드 확인 for i in graph[now]: cost = dist + i[1] if cost < distance[i[0]]: distance[i[0]] = cost heapq.heappush(q, (cost, i[0])) # 개선된 다익스트라 수행 dijkstra(start) # 모든 노드로 가기 위한 최단 거리 출력 for i in range(1, n + 1): if distance[i] == INF: print('INFINITY') else: print(distance[i])
      개선된 다익스트라 최단 경로 알고리즘은 E 개의 원소를 우선 순위 큐에 넣었다가 모두 빼내는 연산과 매우 유사하다고 볼 수 있다. 위의 힙 자료 구조에서 언급한 1개의 데이터를 넣고 다시 빼는 과정을, n 개의 데이터 개수만큼 반복하면 이다. 간단하게 생각하면 다익스트라 알고리즘의 시간 복잡도는 최대 E 개의 간선 데이터를 힙에 넣었다 다시 빼는 것으로 볼 수 있으므로 임을 이해할 수 있다.
       
      이 때 중복 간선을 포함하지 않는 경우, E 는 항상 보다 작다. 왜냐하면 모든 노드끼리 서로 다 연결되어 있다고 했을 때, 각 노드는 (V - 1) 개의 간선을 가지므로 으로 볼 수 있기 때문이다. 다시 말해 보다 작다. 이때 이고, 이는 빅 오 표기법에 따라 이다.
       
      따라서 개선된 다익스트라 알고리즘의 전체 시간 복잡도를 간단히 라고 볼 수 있다.
      (여기서 V 는 노드의 개수, E 는 간선의 개수를 의미)
 
💡
‘항상 가장 작은 값이 먼저 나온다’라는 특징을 지키면서, 단일 데이터의 삽입과 삭제 연산을 에 수행하는 heapq 라이브러리를 이용한다.
 
(출처: 이것이 코딩 테스트다)