🧐 깊이 우선 탐색 ( Depth First Search )

🤔 깊이우선탐색, DFS란?

깊이 우선 탐색, 즉 DFS는 그래프의 완전탐색(Exhaustive Search)기법 중 하나
- 그래프의 시작노드에서 출발해 탐색할 한쪽 분기를 정한다.
- 최대 깊이까지 탐색을 마치면 다른 분기로 이동해 다시 탐색을 진행하는 알고리즘이다.

DFS는 다음과 같은 특징이 있다.
기능 특징 시간복잡도 G(V, E)
그래프의 완전탐색 (Exhaustive Search)  재귀함수나 스택 자료구조로 구현 O(V+E)
DFS는 재귀함수의 이용으로 stack overflow현상에 대해 주의해야 한다.

 

🤔  DFS를 응용해 풀 수 있는 문제

- 백트래킹(Backtracking) [https://www.acmicpc.net/step/34]
- 단절점(Articulation Point) 찾기  [https://www.acmicpc.net/problem/11266]
- 단절선 찾기 [https://www.acmicpc.net/problem/11400]
- 사이클 찾기
- 위상 정렬(topological sort) [https://www.acmicpc.net/step/25]

 

🤔  DFS의 핵심 이론

DFS는 한 번 방문한 노드를 다시 방문하면 안된다.
따라서 노드 방문여부를 체크할 리스트가 필요하다.

DFS 탐색방식은 LIFO특성의 스택을 사용해 설명하자면, 아래와 같다.

1. DFS를 시작할 노드를 정한 후 사용할 자료구조 초기화 
- DFS를 위해 필요한 초기 작업 아래와 같다.
  ‣ 인접리스트로 그래프를 표현
  ‣ 방문리스트를 초기화하기
  ‣ 시작 노드 스택에 삽입하기
- 스택에 시작노드를 1로 삽입할 때, 해당 위치의 방문리스트를 체크하면 T, F, F, F, F, F 이다.

 
2. 스택에서 노드를 꺼내 인접 노드를 다시 스택에 삽입 
- 이제 pop을 수행하여 노드를 꺼내고 꺼낸 노드를 탐색순서에 기록한다.
- 인접리스트의 인접노드를 스택에 삽입하며 방문리스트를 체크한다.
- 이때, 방문리스트는 T, T, T, F, F, F 이다.

 

3. 스택에 값이 없을 때까지 반복 
- 앞선 과정을 스택자료구조에 값이 없을 때까지 반복하며 이미 거친 노드는 재삽입 하지 않는 것이 핵심!

 

 

 

🤔 DFS 수도코드

DFS의 재귀 구현

DFS를 재귀로 구현하는 경우의 수도 코드는 다음과 같다.

쉽게 말하자면 정점을 방문하되 방문되었다고 표시하고 해당 정점의 인접 간선을 모두 탐색하는 것.
이때, 해당 정점이 방문되지 않았다면 해당 정점에 대해서 다시 DFS를 call하는 형태

정점의 인접 간선을 하나씩 탐색 후 탐색이 불가능하면 빠져나와 다른 인접 간선을 이와 동일한 방식으로 탐색진행

<pseudocode>

DFS(G, v)
    visit v;
    mark v as visited;
    for all directed edges from v to w that are in G.adjacentEdges(v) do
        if vertex w is not marked as visited then
            recursively call DFS(G, w)

<python code>

 

def recursive_dfs(v, visited=[]):
    visited.append(v)
    for w in graph[v]:
        if not w in visited:
            visited = recursive_dfs(w, visited)
    return visited

이때, graph는 global 변수로 작용하게 되고, visited는 함수의 인자로 계속 넣어주는 형태이다.

이로 인해 visited를 리턴해서 계속 누적해주는 방식으로 진행을 해줘야한다.

 

 

DFS의 스택 구현

스택을 이용하는 경우에는 반복문을 이용해 구현할 수 있다.
스택을 이용해 모든 인접 간선을 추출하고 다시 도착점인 정점을 스택에 삽입하는 구조로 구현이 가능하다. 

 

<pseudocode>

DFS_iterative(G,v)
    let S be a stack
    S.push(v)
    while S is not empty do
        v = S.pop()
        if v is not marked as visited then
            mark v as visited
            for all edges from v to w in G.adjacentEdges(v) do
                S.push(w)

스택에 한 번에 모든 인접 간선의 정점을 다 push하기 때문에 자칫 BFS로 오해하기 쉽다.

여기서 염두해야할 점은 stack에 push될 때가 아니라 pop이 되면서 방문을 check하는 구조이다.

따라서 정점 방문 순서로 본다면 확실히 DFS임을 알 수 있다.

 

<python code>

def iterative_dfs(start_v):
    visited = []
    stack = [start_v]
    while stack:
        v = stack.pop()
        if v not in visited:
            visited.append(v)
            for w in graph[v]:
                stack.append(w)

return visited

 

효율성

  • 시간 복잡도
인접 행렬의 경우 하나의 정점 당 n번 check를 해주어야 하기 때문에 O(n^2)이다.
인접 리스트의 경우 정점 방문 & 해당 정점의 인접 정점 방문이므로 O(n+m)이다.
시간 복잡도의 경우에는 결국엔 어떤 정점을 탐색하느냐의 문제이기 때문에 공간 복잡도와 동일하다.

 

  • 공간 복잡도
공간 복잡도의 경우, 그래프와 visited, 스택을 모두 고려해주어야 하기에 그래프의 공간복잡도는 다음과 같다.
인접 행렬의 경우에는 하나의 정점과 모든 정점 간의 연결 관계를 다 표현해주어야 하기 때문에 O(n^2)이다.
인접 리스트의 경우에는 그래프 내 정점 개수를 n, 간선 개수를 m이라고 할 때 O(n+m)이다.

결과적으로 공간복잡도는 그래프의 공간복잡도를 따라 가게 된다.

DFS의 효율성에 대해 말할 경우, 스택과 visited는 모두 O(n)의 공간복잡도를 가지고 있다 (정점 개수 n).
이는 그래프가 인접 행렬이나 인접 리스트로 구현되어 있든 두 가지 경우 모두에 해당한다.

 

 
 
 

🧐 백준 11724 (Connected Component)

- connected component 즉, 연결요소는 다음과 같은 조건에서 성립한다.

  • 연결요소에 속한 모든 정점(vertex)을 연결하는 간선(edge)가 있어야 한다.
  • 또 다른 연결요소에 속한 정점(vertex)과 연결하는 간선(edge)이 있으면 안된다.

🤔
 Algorithm 과정 

0.  노드의 최대 개수가 1000이므로 시간복잡도 n^2이하의 알고리즘을 모두 사용할 수 있다.
1. 그래프를 인접리스트로 저장한다. (무방향 그래프이기에 양쪽방향으로 간선을 모두 저장한다.)
2. 방문리스트를 모두 False로 초기화한다.
3. DFS를 수행하는데, 아래와 같이 진행한다.


🤫  solution_11724

import sys
sys.setrecursionlimit(10000)
input = sys.stdin.readline

V, E = map(int, input().split())
CC = [[] for _ in range(V+1)]  # [[], [], [], [], [], [], []]
visit_list = [False] * (V+1)

for _ in range(E):
    u, v = map(int, input().split())
    # 양방향 간선이므로 양쪽에 정점 더하기.
    CC[u].append(v)
    CC[v].append(u)
# print(CC) => [[], [2, 5], [1, 5], [4], [3, 6], [2, 1], [4]]
# 인접리스트 생성         [1]     [2]   [3]    [4]     [5]   [6]


def DFS(v):
    visit_list[v] = True
    for i in CC[v]:
        if not visit_list[i]: # 연결요소가 방문리스트에 F로 되어있으면 True로 고치기 위한 재귀
            DFS(i)

cnt = 0
for i in range(1, V+1):
    if not visit_list[i]:  # 1 2 3 4 5 6의 방문리스트에 대해 방문한적이 없다면
        cnt += 1
        DFS(i)

print(cnt)

 

 

 

🧐 완전 탐색 (Exhaustive Search)

🤫 완전 탐색이란?

이름에서도 알 수 있듯 하나부터 열까지 모든 경우를 다 탐색하는 알고리즘이다.
모든 경우를 탐색하니 당.연.히 정답을 찾을 수 있다.

장점:
 모든 경우를 고려해서 정답을 확실히 찾을 수 있으며 복잡하지 않고 빠르게 구현이 가능
단점: 당연하게도 모든 경우를 다 찾기에 효율적이지 않고 실행시간이 오래걸린다.


🤫  완전탐색의 종류 

🤔브루트포스(https://www.acmicpc.net/step/22)
- 
조건문/반복문을 이용해 모든 경우의 수를 찾는 방법
- https://chan4im.tistory.com/119

 

브루트 포스 단계

체스판을 만드는 모든 경우를 시도하여 최적의 방법을 찾는 문제

www.acmicpc.net

 

🤔백트래킹(https://www.acmicpc.net/step/34)
- 현재 상태에서 가능한 후보군으로 가지를 치며 탐색하는 방법

 

백트래킹 단계

조금 더 복잡한 백트래킹 문제 1

www.acmicpc.net

 

🤔BFS,DFS(https://www.acmicpc.net/workbook/view/1833)

- BFS(너비 우선 탐색): 정점과 같은 레벨에 있는 형제노드를 탐색

- DFS(깊이 우선 탐색): 정점의 자식노드들을 탐색

아래 문제집에서는 완전탐색의 유명한 예시인 순열도 포함되어 있다.
순열과 조합 : (https://buyandpray.tistory.com/52)

 

문제집: DFS, BFS 추천문제 (c3171700)

 

www.acmicpc.net

 

🤔비트마스크(https://www.acmicpc.net/workbook/view/804)
- 2진수인 컴퓨터의 연산을 이용하는 방법

 

문제집: 비트마스크 (cokcjswo)

 

www.acmicpc.net

 

+ Recent posts