01강의 소개와 연구자 배경
이번 주차는 항공대 장인모 교수님이 진행하는 특강으로, 주제는 군집(swarm)·멀티로봇 시스템의 미션 자율성입니다. 즉, 여러 대의 로봇이 협력해 하나의 임무를 수행할 때 이를 어떻게 자율적으로 계획·할당·실행하게 만들 것인가를 다룹니다.
교수님은 자신을 항공우주와 로보틱스를 오가는 연구자로 소개합니다. 본래 항공우주(특히 UAV, 즉 무인항공기) 배경을 가지고 있었고, 이를 점차 에어리얼 로봇과 멀티로봇 시스템으로 확장해 왔다고 설명합니다.
여기서부터 본론에 앞선 도입 파트가 시작됩니다. 교수님은 먼저 자신의 연구 여정과 배경을 소개한 뒤, 왜 멀티로봇 시스템과 미션 자율성이 중요한지로 자연스럽게 이야기를 풀어갑니다.
교수님은 자신의 이력을 항공과 로보틱스를 넘나든 여정으로 설명합니다. KAI에서 9년, 항공안전기술원에서 1년을 일한 뒤 영국으로 건너가 크랜필드에서 박사 학위를, 맨체스터에서 박사후연구원을 거쳤고, 다시 삼성전자에서 파트장을 지낸 후 한국항공대 교수로 부임해 현재 2년차라고 소개합니다.
이렇게 학계·산업계·정부 기관을 두루 경험한 덕분에, 상황에 따라 "항공하는 사람"으로도 "로봇하는 사람"으로도 자신을 포지셔닝할 수 있다고 말합니다. 연구 키워드는 멀티로봇 시스템을 위한 AI와 인간-군집 협업입니다.
교수님은 멀티로봇 연구가 궁극적으로 지향하는 모습을 이 두 사례로 직관적으로 보여줍니다. 빅 히어로 6의 마이크로봇은 수많은 작은 로봇이 모여 자유자재로 형태를 만들고, 스타크래프트의 인터셉터는 모선(캐리어)에서 발진해 군집으로 움직입니다. 이 정도 수준의 협력·제어가 가능한 시스템이 연구의 최종 목표라는 것입니다.
즉, 이런 영화·게임 속 장면을 현실의 로봇 군집에서 어떻게 구현할 수 있을지가 이 강의 전체를 관통하는 동기가 됩니다.
군집(Swarm) vs 멀티로봇(Multi-Robot): 둘 다 여러 로봇이 협력하는 시스템이지만, 군집은 보통 단순한 개체가 매우 많이 모여 집단 행동(예: 새 떼, 개미 군집)을 내는 쪽을, 멀티로봇은 상대적으로 능력 있는 소수의 로봇이 역할을 나눠 협업하는 쪽을 가리킬 때가 많습니다. 강의에서는 두 개념을 함께 다룹니다.
왜 영화·게임 사례로 시작할까: 추상적인 "자율 군집 제어"라는 목표를, 누구나 본 적 있는 시각적 이미지로 묶어 청중과 눈높이를 맞추려는 의도입니다. 이후 슬라이드들은 이 이상을 실제 알고리즘·아키텍처로 끌어내리는 과정을 설명하게 됩니다.
02멀티로봇 시스템은 왜 필요한가
교수님은 멀티로봇 시스템 연구의 궁극적 목표를 영화·게임에 빗대어 설명합니다. 빅히어로6의 마이크로봇이나 스타크래프트 캐리어가 띄우는 인터셉터처럼, 수많은 개체를 하나의 의지로 매끄럽게 제어하는 수준이 이상향이라는 것이죠.
이 슬라이드의 핵심은 그 목표가 단순한 공상이 아니라 실제 정책 로드맵에 들어 있다는 점입니다. 미 국방부는 2005년 로드맵에서 2025년까지 완전 자율 군집(Fully Autonomous Swarm)을 달성하겠다는 목표를 세웠고, 이것이 교수님 연구의 개인적 동기이자 분야 전체의 장기 비전이 됩니다. 즉 "사람이 하나하나 조종하는" 단계에서 "로봇 떼가 스스로 협력하는" 단계로 나아가는 것이 자율화 사다리의 꼭대기라는 메시지입니다.
교수님은 멀티로봇이 더 이상 연구실 안의 이야기가 아니라 이미 산업 현장에 들어와 있음을 강조합니다. 물류창고의 운반 로봇, 공항의 수하물 처리, 네이버랩스의 클라우드 기반 로봇, 그리고 만 대 규모의 드론쇼가 그 예입니다.
특히 마지막 드론쇼 사례에서 1만여 대를 단 한 대의 컴퓨터가 제어한다는 점을 짚습니다. 이는 화려해 보이지만 동시에 다음 슬라이드로 이어지는 문제 제기이기도 합니다. 즉, 오늘날 대부분의 군집 시스템은 중앙집중형(centralised)이라 중앙 컴퓨터가 멈추면 전체가 마비된다는 약점을 안고 있다는 것입니다.
여기서 교수님은 왜 자신이 분산형(decentralised) 시스템을 연구하는지 네 가지 이유로 정리합니다. 첫째 통신 제약 — 충분한 대역폭을 늘 확보하기 어렵습니다. 둘째 단일 실패 지점(Single Point of Failure) 방지 — 중앙이 망가지면 전부 멈추는 구조를 피해야 합니다. 셋째 확장성 — 로봇 수가 늘어도 자율적으로 굴러가야 합니다. 넷째 프라이버시 — 장기적으로 여러 벤더가 협업할 때 정보 공유 문제가 생깁니다.
이를 실제 경험으로 뒷받침합니다. 교수님은 원자력 시설에서 두꺼운 콘크리트 벽 때문에 통신이 끊기는 상황을 겪었고, 영국에서는 1·2차 세계대전 시기 원자력 시설을 처리하는 프로젝트에서 설계도조차 없는 미지의 공간에 로봇을 투입해야 했다고 말합니다. 이런 환경에서는 중앙에 의존할 수 없으니 각 로봇이 스스로 판단하는 분산형이 불가피하다는 것입니다.
슬라이드의 C-ITS는 Cooperative Intelligent Transport Systems(협력 지능형 교통체계)로, 차량과 도로 인프라가 통신해 협력하는 시스템입니다. 도심에서는 기지국이 촘촘하지만 시골에서는 통신망이 없을 수 있어, 차량들끼리 직접 정보를 주고받는 분산형이 필요해집니다. 오른쪽 자율주행 차량 사진이 바로 이 사례를 가리킵니다.
앞 슬라이드가 "왜 분산화가 필요한가"를 논했다면, 이 슬라이드는 "그 분산형이 어디에 쓰일 것인가"를 보여줍니다. 국방, 엔진 검사, 커넥티드 차량, 공장 휴머노이드 협업처럼 중앙 통제가 어렵거나 위험하거나 대규모인 영역들이 분산형의 무대가 됩니다.
특히 국방 분야는 통신이 교란되거나 적에게 노출되면 안 되는 환경이라 분산형의 필요성이 가장 큽니다. 이는 뒤에서 다룰 유무인 복합체계(MUM-T, Manned-Unmanned Teaming) 연구로 자연스럽게 이어지는 대목입니다. 공장 자동화 사례처럼 여러 종류의 로봇이 서로 다른 작업을 동시에 협력하는 시나리오가 미래의 핵심 응용이 될 것이라는 전망입니다.
이 슬라이드는 멀티로봇 연구가 인지 → 의사결정 → 경로계획 → 학습 → 인간 협업으로 이어지는 큰 지도를 제시합니다. 로봇이 환경을 함께 인식하고(Perception), 충돌 없이 누가 무슨 일을 할지 정하고(Decision-Making·Task Allocation), 서로 부딪히지 않게 움직이며(Path Planning), 학습으로 성능을 높이고(RL), 최종적으로 사람과 협업하는(Human Collaboration) 순서입니다.
특히 마지막 항목 MUM-T(유무인 복합체계)는 이후 강의의 중심 주제로, 사람이 고수준 미션을 주면 로봇들이 이를 세부 태스크로 나눠 자율 수행하는 구조와 직결됩니다. 교수님 본인의 박사 연구인 연합 형성(Coalition Formation)과 태스크 할당이 이 "의사결정" 가지에 위치하며, 이것이 분산형 군집 제어의 핵심 알고리즘 문제임을 시사합니다.
03분산화(Decentralization)의 중요성
여기서부터 본 강연의 핵심 주제인 미션 오토노미(mission autonomy)로 들어갑니다. 앞에서 다룬 "왜 분산형(decentralized) 멀티로봇이 필요한가" — 통신 제약, 단일 장애점(single point of failure) 방지, 확장성(scalability), 프라이버시 — 라는 문제의식의 연장선입니다. 중앙집중형 시스템은 중앙이 죽으면 전체가 마비되므로, 여러 로봇이 스스로 임무를 이해하고 분담해 수행하는 자율성이 요구된다는 흐름입니다.
특히 교수님은 원자력 시설처럼 두꺼운 콘크리트 벽 때문에 통신이 거의 불가능했던 실제 경험을 들며, 분산화가 단순한 이론이 아니라 현장의 물리적 제약에서 나오는 필연임을 강조했습니다. 이 표지 이후 슬라이드들은 그 자율성이 군사·방산 분야에서 어떻게 구체화되고 있는지를 보여줍니다.
2005년 미 국방부 로드맵은 2025년까지 완전 자율 스웜(Fully Autonomous Swarm)을 목표로 잡았지만, 2017년 업데이트에서 현실을 반영해 중간 단계로 MUM-T를 추가했습니다. 즉 "사람이 빠진 완전 자율"로 바로 가는 게 아니라, 유인 자산과 무인 자산이 팀을 이루는 단계를 먼저 거친다는 것입니다. 한국에서는 이를 '유무인 복합체계'라고 부릅니다.
교수님은 이 흐름이 학계에서도 뚜렷하다고 짚었습니다. 항공우주학회 발표 주제가 작년부터 UAM(도심항공교통)에서 MUM-T로 절반 이상 급격히 옮겨갔다는 것이죠. 그리고 MUM-T가 군사용에만 머물지 않고, BAE Systems의 설명처럼 소방·수색구조·재난 대응 같은 민간 영역으로도 확장된다는 점이 슬라이드의 인용문이 강조하는 부분입니다.
이 표가 보여주는 핵심은 '단계론'입니다. 표의 효율·효과 행을 따라가 보면, 가까운 미래엔 사람이 안전하게 효율을 높이는 정도, 중기엔 리더-팔로워(leader-follower) 방식의 MUM-T, 그리고 먼 미래에야 비로소 사람의 개입 없이 군집이 스스로 협력하는 완전 자율 스웜에 도달한다는 단계적 그림입니다. 앞서 본 2025년 목표가 왜 2042년 지평으로 미뤄졌는지를 이 표가 설명해 줍니다.
특히 무기화 행의 단서가 중요합니다 — 자율 시스템이 발전해도 실제 교전(engage) 결정은 인간이 내린다는 원칙이 명시돼 있습니다. 자율성을 높이는 것과 살상 결정을 기계에 맡기는 것은 별개라는, 신뢰·윤리 측면의 제약이 로드맵에 함께 박혀 있다는 점을 읽어야 합니다.
여기서부터 세 장에 걸쳐 "정부 로드맵이 아니라 실제 기업들이 미션 오토노미를 어떻게 상품화하고 있는가"를 보여줍니다. 첫 사례인 Collins Aerospace의 이미지는 유인 전투기와 무인기가 한 편대를 이루는 MUM-T 개념을 그대로 시각화한 것으로, 미 공군의 CCA(Collaborative Combat Aircraft, 협업 전투기) 프로그램이 그리는 그림과 같은 맥락입니다.
교수님이 이 슬라이드들을 모은 이유는, 미션 오토노미가 학술적 호기심이 아니라 Airbus·BAE·Anduril·Shield AI 같은 굵직한 방산 기업들이 실제로 투자·개발하는 현실의 기술임을 보여주기 위해서입니다.
Anduril의 메시지는 미션 오토노미의 목표를 한 문장으로 압축합니다 — "한 사람이 다수의 무인 자산을 지휘한다". 이것이 바로 미션 오토노미의 학술적 정의와 정확히 맞닿습니다. 사람은 고수준 임무(high-level mission)만 던지고, 시스템이 그것을 세부 태스크로 분해(task decomposition)하고 각 로봇에 할당(task allocation)하는 구조죠.
왼쪽의 그물망 도식도 의미심장합니다. 여러 자산이 서로 연결돼 정보를 주고받는 분산형 네트워크를 표현한 것으로, 이 단원 전체의 주제인 분산화(decentralization)와 직결됩니다. 'Lattice(격자)'라는 제품명 자체가 중앙 한 점에 의존하지 않고 노드들이 서로 엮이는 구조를 함축합니다.
Shield AI의 표는 자율성을 한 덩어리로 보지 않고 세 층위로 분해한 점이 핵심입니다. 위로는 여러 자산을 묶어 조율하는 작전 수준(Autonomy Management), 가운데는 개별 기체가 임무 목표를 태스크로 풀어 수행하는 미션 수준(Mission Autonomy), 아래는 비행 안정·충돌 회피 같은 플랫폼 수준(Platform Autonomy)입니다. 이는 교수님이 뒤에서 제안하는 Swarm Level → Task Level → Agent Level의 3계층 아키텍처와 거의 같은 발상입니다.
가장 주목할 표현은 "GNSS·통신·인간 입력 없이도 엣지에서 스스로 수행한다"는 대목입니다. 이는 정확히 이 단원이 강조한 분산화의 이유 — GPS가 안 잡히거나 통신이 끊기는 원자력 시설·전장 같은 환경에서도 작동해야 한다는 요구 — 에 대한 산업계의 답입니다. 중앙 통제가 불가능한 조건을 전제로 설계해야 진짜 쓸모 있는 시스템이 된다는 것이 세 기업 사례를 관통하는 메시지입니다.
04MUM-T와 미션 오토노미의 부상
완전 자율 군집(Fully Autonomous Swarm)으로 가기 전 단계로 떠오른 개념이 미션 오토노미(미션 자율성)입니다. 미국 국방부(DoD)의 정의를 보면, 자율 시스템이 사람의 개입 없이 스스로 행동 방안(COA)을 수립하고 실행하는 것을 말합니다. 여기서 COA란 목표 상태에 도달하기 위한 일련의 액션 시퀀스를 의미합니다.
미 육군 교리(doctrine)로 풀어 보면 이 흐름은 상황 이해(Situation Understanding) → 임무 이해(Mission Understanding) → COA 생성으로 이어집니다. 즉 지금 어떤 상황인지 파악하고, 무엇을 해야 하는 임무인지 이해한 뒤, 그것을 달성할 구체적인 행동 계획을 짠다는 것이죠. BAE Systems나 US Army 같은 방산·군 쪽에서 이 용어를 정의해 두었다는 점이 포인트입니다.
OPLAN/OPORD는 군 용어로, 작전계획서와 작전명령서를 뜻합니다. 미션 오토노미의 지향점은 "사람이 일일이 명령하지 않아도 시스템이 스스로 이 작전계획에 해당하는 것을 만들어 낸다"는 것입니다. 뒤에 나올 멀티로봇 시스템 맥락에서는 "사람이 고수준 목표만 주면, 로봇들이 알아서 COA를 짜서 수행한다"로 이해하면 자연스럽습니다.
학술적으로 미션 오토노미를 정의하면, 사람이 고수준(high-level) 미션을 주면 시스템이 이를 세부 태스크로 분해하고 할당하는 것입니다. 이 슬라이드는 그 과정을 하나의 파이프라인으로 그린 것인데, 크게 태스크 플래닝 → 태스크 할당 → 액션/모션 플래닝(제어) 세 덩어리로 보면 됩니다.
특히 위로 갈수록(스웜 레벨) 추상적인 "무엇을 할지"를, 아래로 갈수록(에이전트 레벨) 구체적인 "어떻게 움직일지"를 다룹니다. 미션 레벨에서는 복잡한 미션을 잘게 나누고(태스크 분해), 순서와 의존관계를 정한 뒤(태스크 시퀀싱), 어떤 로봇이 어느 일을 맡을지(연합 형성 + 태스크 할당)를 결정합니다. 그 아래 단계에서 각 로봇이 자기 일을 수행할 액션을 짜고, 마지막으로 실제 경로를 계산하고 모터에 명령을 내리는 저수준 제어가 붙습니다. 오늘 다룰 Research Trend는 주로 이 윗단의 태스크 플래닝·할당을 어떻게 자동화하느냐에 있습니다.
앞에서 미션 오토노미와 태스크 플래닝의 큰 그림을 잡았으니, 이제부터는 실제로 태스크 플래닝을 어떻게 푸는지 그 방법론의 트렌드를 살펴보는 파트입니다. 대본에서 정리한 세 가지 큰 흐름이 곧이어 나옵니다: (1) LLM/VLM 활용, (2) 전통적 AI Planning(HTN 등), (3) Behavior Tree. 그중 첫 번째인 LLM/VLM 기반 접근이 바로 다음 슬라이드의 주제입니다.
첫 번째 트렌드는 LLM/VLM(비전-언어모델)을 태스크 플래닝에 끌어다 쓰는 것입니다. 핵심 아이디어는, 사람이 자연어로 "노트북을 닫고, 불을 끄고, TV를 켜라" 같은 복잡한 미션을 주면, LLM이 이것을 태스크 분해(Task Decomposition), 연합 형성(Coalition Formation), 태스크 할당(Task Allocation)으로 나눠 처리해 준다는 것입니다.
여기서 인상적인 점은, 잘 설계된 프롬프트 템플릿을 주면 LLM이 각 로봇이 실행할 코드를 거의 자동으로 생성해 준다는 것입니다. 즉 예전에는 사람이 손으로 짜야 했던 분해·할당 로직을 언어모델이 대신 만들어 주는 셈이죠. SMART-LLM(ICRA 2024)이 그 대표 사례이고, 이런 접근이 최근 급격히 늘고 있다는 게 이 슬라이드의 메시지입니다.
VLM(Vision-Language Model)은 이미지와 언어를 함께 이해하는 모델로, 로봇이 카메라로 본 장면("책상 위에 노트북이 열려 있다")을 언어 명령과 연결해 추론할 수 있게 합니다. LLM이 태스크 플래닝에 매력적인 이유는, 사람이 쓰는 자유로운 자연어 미션을 별도의 형식 변환 없이 바로 입력으로 받고, 상식적 추론(예: "TV를 켜려면 먼저 TV 앞으로 가야 한다")을 어느 정도 내장하고 있기 때문입니다. 다만 LLM 단독으로는 정확성·검증이 약해, 뒤에서 다룰 전통적 AI Planning이나 Behavior Tree와 결합하는 추세로 이어집니다.
앞 슬라이드의 개념을 실제 구현 흐름으로 보여주는 그림입니다. 보다시피 태스크 분해 → 연합 형성 → 태스크 할당 → 태스크 실행의 각 단계마다 프롬프트 템플릿을 LLM에 넣어 코드를 자동 생성하고, 그 결과를 다음 단계로 넘기는 구조입니다. 사람이 알고리즘을 직접 설계하지 않아도, 잘 짜인 프롬프트만 있으면 분해·팀 구성·할당·실행 코드가 차례로 만들어진다는 게 핵심입니다.
이것이 LLM 기반 미션 오토노미의 매력이자 한계를 동시에 보여줍니다. 매력은 "유연하고 자동화하기 쉽다"는 것이고, 한계는 "생성된 결과가 항상 옳다는 보장이 없다"는 것이죠. 그래서 대본에서도 강조했듯, 최근에는 이 LLM 방식을 전통적 AI Planning(HTN Planner 등)이나 Behavior Tree와 묶어 쓰는 통합 접근이 등장하기 시작했고(2024년 ICRA 무렵부터), 그것이 이 분야의 다음 연구 방향으로 이어집니다.
05미션 오토노미의 정의
이 슬라이드부터는 휴먼이 고수준 미션만 주면 로봇이 알아서 COA(Course of Action)를 만들어 실행하는, 즉 미션 오토노미를 실제로 구현하는 태스크 플래닝 방법론을 다룹니다. 최근 트렌드를 세 갈래로 정리하는데, 이 슬라이드는 그중 두 번째인 전통적 AI 플래닝입니다.
AI 플래닝은 갑자기 등장한 분야가 아니라 ICAPS라는 학회를 중심으로 30년 넘게 축적된 영역이라는 점을 강조하셨습니다. 핵심 도구가 HTN(Hierarchical Task Network) 플래너인데, 복잡한 작업을 상위 태스크와 하위 태스크로 계층적으로 쪼개서 푸는 방식입니다. 장점은 개발자가 모든 상황을 if-else로 일일이 코딩하지 않아도, 계층 구조와 플래닝 엔진만 정의해 두면 사실상 완전한 규칙 시스템을 갖추게 된다는 점입니다.
"플래닝(planning)"은 AI에서 현재 상태(state)에서 목표 상태(goal)까지 도달하는 행동의 순서를 자동으로 찾아내는 문제를 말합니다. HTN은 이를 위에서 아래로 분해(decomposition)합니다. 예를 들어 "가구를 조립한다"는 큰 태스크를 "다리를 붙인다 → 상판을 올린다 → 나사를 조인다"처럼 계층적으로 쪼개고, 각 하위 태스크를 더 이상 쪼갤 수 없는 원시 행동(primitive action)까지 내려가며 전개합니다. 트리의 잎(leaf)이 곧 로봇이 실제로 수행하는 동작이 됩니다.
앞서 설명한 HTN이 실제 로봇에서 어떻게 쓰이는지 보여주는 사례입니다. 휴먼과 로봇이 함께 IKEA 가구를 조립하는 상황을 가정합니다. 여기서 로봇이 할 수 있는 모든 동작을 Grasp, Move, Wait 같은 몇 개의 원시 행동으로 먼저 정의해 두고, HTN 플래너(GTPyhop)가 "조립한다"는 추상적 목표를 이 원시 행동들의 시퀀스로 자동 분해합니다.
특히 휴먼이 끼어들거나(개입), 방해하거나, 도움을 줄 때 로봇이 그 상황을 인식하고 계획을 다시 짜야 한다는 점이 핵심입니다. 그래서 촉각 센서, 휴먼 행동 인식, 비전 모듈을 ROS로 묶어 "인지 → 플래닝 → 행동"이 끊김 없이 도는 파이프라인을 만든 것입니다. 전통적 플래닝이 협업 로봇처럼 동적인 환경에서도 작동할 수 있음을 보여주는 예입니다.
세 번째 트렌드는 행동 트리(Behavior Tree)입니다. BT는 루트에서 tick이라는 신호가 주기적으로 내려가면서 트리를 훑고, 잎 노드에 닿으면 실제 행동을 실행하는 구조입니다. 전통적으로 로봇 제어에 쓰이던 유한상태기계(Finite State Machine)와 비교했을 때의 장점을 세 가지로 강조하셨습니다.
첫째 모듈성 — 만들어 둔 행동 블록을 재사용하기 쉽고, 둘째 가시성/가독성 — 복잡한 로직도 트리로 시각화되어 디버깅이 직관적이며, 셋째 반응성 — 예상치 못한 상황(실패)에 즉각 대응해 복구할 수 있다는 점입니다. 최근 2~3년 사이 BT가 FSM보다 우수하다는 연구가 늘고 있고, ROS의 NAV2 같은 실제 내비게이션 스택에도 표준처럼 들어가 있다고 설명하셨습니다.
FSM은 상태(state)와 상태 간 전이(transition)를 일일이 정의하는 방식이라, 상태가 늘어날수록 전이가 폭발적으로 많아지고 한 곳을 고치면 다른 전이가 줄줄이 깨지기 쉽습니다. 반면 BT는 "이 행동이 실패하면 자동으로 다음 대안을 시도"하는 식의 반응적 복구가 트리 구조 자체에 내장되어 있어, 새 행동을 끼워 넣어도 다른 부분에 영향이 적습니다. 이 모듈성·반응성 때문에 게임 AI에서 출발한 BT가 최근 로보틱스로 빠르게 넘어온 것입니다.
마지막은 앞의 세 가지 방법론을 결합하는 흐름입니다. 예전에는 LLM, AI 플래닝, 행동 트리가 각각 별개의 접근으로 다뤄졌는데, 최근에는 이 셋을 하나로 묶는 연구가 나오기 시작했습니다. 교수님은 2024년 ICRA 등에서 이런 통합 연구가 등장하기 시작했다고 짚으셨습니다.
이 슬라이드의 예시는 휴먼이 자연어로 지시하면 LLM이 이를 형식화하고, AI 플래닝으로 행동 순서를 짜서, 결과물을 행동 트리(BT) 형태의 로봇 프로그램으로 자동 생성·확장하는 시스템입니다. 핵심은 실행 도중 실패가 발생하면 그냥 멈추는 게 아니라, 다시 추론(reasoning)해서 부족했던 전제조건을 보충하고 트리를 스스로 확장하는 실패 해소 루프가 돈다는 점입니다. 결국 세 트렌드를 합치면 "사람이 고수준 미션만 던지면 로봇이 알아서 계획·실행·복구한다"는 미션 오토노미의 이상에 한 걸음 더 다가가게 됩니다.
06태스크 플래닝 방법론 (1)
고수준 미션을 받아 세부 태스크로 분해(Task Decomposition)했다면, 그 다음으로 풀어야 할 핵심 문제가 바로 태스크 할당입니다. 교수님 연구실의 주된 연구 주제 중 하나이고, 박사 연구도 이 영역(특히 연합 형성)에 걸쳐 있습니다.
이 부분은 단순한 강의용 설명이 아니라 교수님이 직접 리뷰 논문을 제출 직전까지 준비한 분야로, 이론적 깊이가 있는 주제임을 염두에 두고 들으면 좋습니다.
MRTA 문제는 본질적으로 두 질문으로 쪼갤 수 있습니다. 첫째, 한 로봇이 "어떤 태스크를 맡을 것인가"가 태스크 할당이고, 둘째, 하나의 태스크에 "어떤 로봇들을 한 팀으로 묶을 것인가"가 연합 형성입니다.
경로 최적화 관점에서 보면 이는 Traveling Salesman Problem(TSP)이나 Vehicle Routing Problem(VRP)과도 맞닿아 있습니다. 여러 로봇이 흩어진 여러 목표 지점을 효율적으로 나눠 맡는 문제이기 때문입니다.
태스크 할당과 연합 형성은 동전의 양면입니다. "로봇 입장에서 어떤 일을 맡을까(robot→task)"로 보면 할당이고, "일 입장에서 어떤 로봇 팀을 모을까(task→robots)"로 보면 연합 형성입니다. 한 태스크에 로봇 한 대로 충분하면 단순 할당이지만, 한 대로 못 하는 무거운 작업(예: 큰 물체 함께 들기, 넓은 구역 동시 정찰)은 여러 대를 묶는 연합 형성이 필요합니다.
이 분류 체계는 2004년 Gerkey와 Matarić가 제안한 것으로, MRTA 분야에서 거의 표준처럼 쓰입니다. 로봇·태스크·할당이라는 세 축의 조합(ST/MT × SR/MR × IA/TA)으로 문제의 난이도와 성격이 결정됩니다.
특히 주목할 두 케이스가 ST-SR-TA와 ST-MR-IA입니다. 전자는 로봇 한 대에 태스크 여러 개를 순서대로 배정하는 전형적 태스크 할당 문제이고, 후자는 한 태스크에 여러 로봇을 묶는 연합 형성 문제입니다. 두 문제는 수학적으로 서로 다른 구조를 가지므로 접근법도 달라집니다.
약어를 직관적으로 풀면 — ST/MT는 "로봇이 멀티태스킹이 되는가", SR/MR은 "일에 사람(로봇)이 몇 명 필요한가", IA/TA는 "지금 한 번만 배분하고 끝(IA)인가, 앞으로 할 일 순서까지 짜는가(TA)"입니다. 조합이 복잡해질수록(예: MT-MR-TA) 문제는 NP-hard가 되어 정확히 푸는 것이 사실상 불가능해지고, 근사·휴리스틱·게임이론적 접근이 필요해집니다.
분류 체계를 실제로 풀려면 수학적 최적화 문제로 옮겨야 합니다. 핵심 변수는 x_ij로, "로봇 i가 태스크 j를 맡으면 1, 아니면 0"인 이진 변수입니다. 목적함수는 효용 u_ij의 합을 최대화하는 것이고, 제약식이 어떤 유형(IA/TA, SR/MR)인지를 결정합니다.
출처로 인용된 Choi et al.의 Consensus-Based Decentralized Auctions(경매 기반 분산 할당)와 Jang et al.의 Anonymous Hedonic Game(익명 헤도닉 게임)은 이 분야의 대표 분산형 알고리즘입니다. 특히 후자는 게임이론으로 대규모 시스템의 할당을 다루는데, 교수님 박사 연구의 연합 형성 작업과도 직접 연결됩니다.
제약식의 의미를 한 줄로 — Σ_{j} x_ij ≤ 1은 "로봇 하나는 동시에 한 태스크만"(ST 조건), Σ_{i} x_ij ≤ 1은 "태스크 하나에 로봇 한 대만"(SR 조건)입니다. SR 제약을 풀면(여러 로봇 허용) 곧바로 MR, 즉 연합 형성 문제가 됩니다. 슬라이드가 굳이 n_a와 n_t의 대소관계로 케이스를 나눈 이유는, 에이전트보다 태스크가 많으면(n_a < n_t) 한 로봇이 여러 태스크를 순서대로 처리해야 하므로 시간 확장(TA) 정식화가 자연스럽게 등장하기 때문입니다.
현재 상용 시스템(웨어하우스, 공항 수하물, 드론쇼 등)은 대부분 중앙집중형입니다. 하지만 중앙집중형은 Single Point of Failure 문제가 있어 중앙이 죽으면 전체가 마비됩니다. 그래서 분산화가 필요한데, 그 이유는 단지 안정성만이 아닙니다.
교수님이 강조한 실제 경험이 인상적입니다 — 원자력 시설처럼 두꺼운 콘크리트 벽이 있는 환경에서는 충분한 통신 대역폭을 확보하기 어렵습니다. 게다가 로봇 수가 늘어날수록(확장성), 여러 벤더가 협업할수록(프라이버시) 모든 정보를 한곳에 모으는 중앙집중 방식은 비현실적입니다. 핵심 통찰은 "로컬 정보 + 통신 = 글로벌 정보"로, 각 로봇이 자기 주변만 알고 이웃과 소통해도 전체를 푸는 것을 목표로 합니다.
슬라이드 좌우 대비가 핵심입니다. OR(운용과학)식 중앙집중 접근은 모든 정보를 모아 전역 최적해를 한 방에 계산합니다 — 깔끔하지만 단일 장애점에 취약하고 통신이 막히면 무너집니다. 로보틱스식 분산 접근은 각 로봇이 부분 정보만으로 스스로 결정하므로 강건하지만, 서로 다른 로봇이 같은 태스크를 동시에 집으려 하는 등 충돌(conflict)이 생깁니다. 그래서 분산형의 진짜 난제는 "어떻게 충돌을 해소하고 합의에 도달하느냐"가 됩니다.
분산형 태스크 할당 알고리즘의 기본 패턴이 이 슬라이드에 압축돼 있습니다. 로컬 의사결정 → 충돌 해소 → 반복이라는 루프입니다. 각 로봇이 로컬 정보로 일단 결정을 내리고, 이웃과 정보를 주고받아 충돌(같은 태스크를 두 로봇이 맡으려는 등)을 해소한 뒤, 전체가 합의에 수렴할 때까지 이 과정을 되풀이합니다.
여기서 교수님이 강조하는 것은 이론적 수렴 증명의 중요성입니다. 단지 "동작하더라"가 아니라, 반드시 수렴하는지·얼마나 빨리 수렴하는지·중앙집중 최적해와 얼마나 가까운지를 수학적으로 보장해야 합니다. 박사 연구에서는 게임이론(Nash Equilibrium)과 Star-shaped 볼록 함수로 만든 유틸리티 함수를 써서 이 수렴성을 증명했고, 에이전트나 태스크가 추가·제거될 때의 재수렴 시간까지 분석했습니다.
통신 가정의 의미가 중요합니다. 비동기(Asynchronous)는 로봇들이 동시에 같은 박자로 통신하지 않아도 된다는 뜻이고, 시간 평균 강연결(Strongly-connected over time)은 "어느 한 순간엔 끊겨 있어도, 충분한 시간 동안 보면 모든 로봇이 결국 서로 정보를 전달할 수 있다"는 완화된 조건입니다. 현실에서는 통신이 끊겼다 이어졌다 하므로 이 가정이 합리적이지만, 수렴 증명이 어려워집니다. 그래서 많은 논문이 분석을 쉽게 하려고 "모두가 매 라운드 동시에 통신한다"는 동기 설정으로 단순화한다 — 는 것이 이 슬라이드의 솔직한 단서입니다.
07태스크 플래닝 방법론 (2)
이 슬라이드는 교수님의 박사 연구(Coalition Formation, 연합 형성) 결과물입니다. 대본에서 설명한 분산형 태스크 할당 알고리즘의 기본 패턴 — 로컬 의사결정(Local Decision Making) → 충돌 해결(Conflict Resolution) → 반복 — 이 바로 이 GRAPE에 구현되어 있습니다. 각 로봇이 자기 로컬 정보만으로 "어느 팀에 들어가는 게 내게 이득인가"를 판단하고, 이웃과 정보를 공유해 충돌을 해소하며, 더 이상 옮길 이유가 없는 안정 상태로 수렴하게 만드는 구조입니다.
교수님이 강조하신 핵심은 이론적 수렴 증명입니다. 로봇을 이기적 플레이어로 두면 게임 이론을 끌어올 수 있고, 이를 통해 알고리즘이 반드시 멈춘다는 것(다항시간 수렴)과 최적해 대비 성능이 얼마나 보장되는지(차선해 하한)를 수학적으로 증명할 수 있습니다. 대본에서 언급한 유틸리티 함수 설계(Star-shaped 볼록 함수)와 내시 균형(Nash Equilibrium) 활용이 바로 이 증명의 도구입니다.
또 하나의 강조점은 분산성입니다. 앞 섹션에서 다룬 분산화의 필요성(통신 제약, Single Point of Failure 방지, 확장성)과 직결되는데, GRAPE는 중앙 관제 없이 비동기로, 연결만 되어 있으면 어떤 통신망에서도 동작하므로 로봇 수가 늘어도 견딜 수 있습니다. 교수님은 에이전트나 태스크가 도중에 추가·제거될 때 얼마나 빨리 다시 수렴하는지(재수렴 시간)까지 분석했다고 하셨습니다.
헤도닉 게임은 "연합 형성 게임"의 한 종류로, 각 플레이어가 어떤 결과물이 아니라 자기가 속한 그룹(연합) 자체에 대한 선호를 갖는 모델입니다. 사람들이 동아리를 고를 때 "누구와 함께하느냐"로 만족도가 결정되는 것과 같습니다. 로봇 각자가 "이 팀에 있으면 내 효용이 가장 크다"를 따라 움직이다 보면, 아무도 더 옮기고 싶지 않은 내시 안정 분할(Nash-stable partition)에 도달합니다 — 이것이 슬라이드 하단 그림에서 군집이 두 태스크로 깔끔히 갈라지며 수렴하는 과정입니다.
O(#robots²)는 로봇 수가 두 배가 되면 계산량은 약 네 배로 늘어난다는 뜻으로, 수천~수만 대 규모(대본의 드론쇼·스웜)에서도 현실적으로 돌릴 수 있을 만큼 효율적이라는 것을 보장합니다. "50% 하한"은 최악의 경우에도 최적해 가치의 절반은 보장한다는 의미로, 분산 알고리즘이 빠른 대신 품질이 무너지지 않는다는 안전판 역할을 합니다.
08구현 프레임워크와 시뮬레이션 검증 (1)
분산형 알고리즘의 기본 패턴은 지역 결정 → 충돌 해결 → 반복입니다. 각 로봇이 자기가 가진 로컬 정보만으로 어느 작업에 갈지 결정하고, 이웃과 정보를 주고받아 충돌을 풀고, 수렴할 때까지 이 과정을 되풀이합니다. 중앙이 없어도 돌아가야 하므로 통신 제약·확장성·Single Point of Failure 문제를 모두 피할 수 있습니다.
여기서 가장 중요한 것은 이론적 수렴 증명입니다. 단순히 "잘 되더라"가 아니라, 게임 이론의 내쉬 균형(Nash Equilibrium)·내쉬 안정 분할(Nash-stable partition) 개념으로 반드시 수렴함을 증명해야 신뢰할 수 있는 시스템이 됩니다. GRAPE는 효용 함수를 Star-shaped 볼록 함수 형태로 설계해, 각자 이기적으로 행동해도 전체가 안정 상태로 수렴하도록 만든 것이 핵심 기여입니다.
Hedonic Game은 "각 플레이어가 자신이 속한 그룹(연합) 자체에서 만족도를 얻는" 협력 게임 모형입니다. 로봇 입장에선 "어느 팀에 들어가야 내가 제일 이득인가"를 따지는 것이고, 모두가 더 이상 팀을 바꿀 이유가 없는 상태가 곧 안정 분할입니다. 효용 식의 (1/|S_j|)·V_j는 작업 가치 V_j를 그 작업에 모인 로봇 수 |S_j|로 나눈 몫(혼잡할수록 1인당 보상 감소), c_i(t_j)는 그 작업까지 가는 비용을 뜻합니다. 즉 "너무 많이 몰리면 보상이 줄어 자연스럽게 분산된다"는 직관이 식에 담겨 있습니다.
박사 연구에서 중요하게 본 지표 중 하나가 재수렴 시간입니다. 멀티로봇은 운용 중에 로봇이 고장 나 빠지거나, 새 임무가 추가되는 일이 늘 일어납니다. 그럴 때마다 처음부터 다시 계산하면 비효율적이죠. GRAPE는 변화가 생긴 부분 위주로 빠르게 다시 안정 상태에 도달하기 때문에 현장에서 쓸 만합니다.
그래프가 보여주듯 반복 횟수가 에이전트 수에 대략 선형(4~5배)으로 증가한다는 것은 확장성(Scalability)이 좋다는 뜻입니다. 수백 대 규모에서도 폭발적으로 느려지지 않으니 대규모 군집에 적용할 수 있습니다.
이 실험은 맨체스터 대학 박사후연구원 시절의 작업으로, 알고리즘이 시뮬레이션을 넘어 실제 로봇에서도 동작함을 보인 사례입니다. GRAPE로 "어느 로봇들이 한 팀을 이룰지"를 정하고, 그 팀이 대형을 유지하며 목표 대상을 둘러싸 호위하도록 했습니다.
MONA는 저가·소형 교육/연구용 플랫폼으로, 여러 대를 동시에 굴리며 분산 알고리즘을 검증하기에 적합합니다. 이런 저비용 다수 로봇 테스트베드 경험이 이후 Crazyflie·Mona 기반 멀티로봇 테스트베드 구축으로 이어집니다.
멀티로봇 태스크 할당과 전기차 충전소 배치는 겉보기엔 전혀 다른 문제 같지만, 수학적 구조는 같습니다. "여러 수요(사용자/로봇)를 한정된 자원(충전소/작업)에 어떻게 배분할 것인가"라는 점에서 동일한 할당·군집 문제이기 때문이죠.
기존 K-means나 보로노이 방식은 단순히 가까운 곳으로 묶기 때문에 한쪽에 수요가 몰리는 불균형이 생깁니다. GRAPE는 효용 함수에 혼잡도와 개인 선호를 반영하므로, 사용자가 균형 있게 분산되도록 충전소를 배치할 수 있습니다.
핵심 성과는 "평균"이 아니라 "분포의 균형"입니다. 박스플롯에서 보듯, 제안 기법은 충전소마다 몰리는 사용자 수의 편차와 사용자별 만족도 편차를 모두 줄였습니다. 일부 충전소만 붐비고 일부는 텅 비는 현상을 완화한 것이죠.
Volvo·Chalmers 같은 산업·학계 파트너와 실제 도시 데이터로 검증했다는 점에서, 군집·할당 알고리즘이 로봇을 넘어 도시 인프라 설계에도 실용적으로 쓰일 수 있음을 보여주는 사례입니다.
현재 진행 중인 연구 중 하나로, KAIST(오현우 교수님 연구실과 공동)와 작성 중인 논문입니다. 기존 GRAPE 효용 함수는 모든 로봇을 똑같이 취급했지만, 실제로는 배터리가 거의 없는 로봇과 가득 찬 로봇을 동일하게 배치하면 안 됩니다. 장기간 운용하려면 자원(배터리) 잔량을 효용에 반영해야 합니다.
그래서 효용 식의 분자에 로봇의 자원 e_i를, 분모에 연합 전체 자원의 정규화 항을 넣어, 자원이 많은 로봇이 더 부담을 지고 자원이 부족한 로봇은 보존되도록 설계했습니다. 이렇게 하면 특정 로봇만 빨리 방전되는 일을 막고 전체 군집의 가동 시간을 늘릴 수 있어, 화재 진압처럼 오래 지속되는 임무에 적합합니다.
09구현 프레임워크와 시뮬레이션 검증 (2)
이 슬라이드는 교수님 연구실에서 제출 직전인 멀티로봇 태스크 할당 리뷰 논문의 결과물입니다. 분산형(Decentralized) 태스크 할당 분야에서 지난 20년간의 논문을 체계적으로 수집·분류한 것으로, 단순히 나열하는 서베이가 아니라 어떤 알고리즘이 어떤 구조적 특성을 갖는지를 좌표 위에 정리했다는 점이 핵심입니다.
교수님이 강조한 분산형 알고리즘의 기본 패턴이 이 그림에 그대로 반영되어 있습니다. 즉 각 로봇이 로컬 정보만으로 결정을 내리고(Local Decision Making), 이웃과 정보를 공유해 충돌을 해소하며(Conflict Resolution), 수렴할 때까지 이 과정을 반복하는 구조입니다. 가로축의 Conflict Resolution 열과 세로축의 Local ↔ Global 구분이 바로 이 패턴을 분류 기준으로 삼은 것입니다.
방법론군을 보면, 교수님의 박사 연구 주제였던 게임 이론(Game Theory) 기반 연합 형성(Coalition Formation)이 한 축을 차지합니다. 분산형에서는 이론적 수렴 증명이 매우 중요하기 때문에, Nash 균형(Nash Equilibrium) 같은 게임 이론 도구나 분산 최적화의 수렴성 보장 여부가 분류의 핵심 잣대가 됩니다. 최근 부상한 강화학습(RL)과 전통적인 경매(Auction) 방식까지 한 그림에 모아, 각 접근의 장단점과 적용 맥락을 대비시킨 것입니다.
PRISMA는 원래 의학 분야에서 체계적 문헌고찰(Systematic Review)의 투명성을 위해 만든 표준 절차로, "몇 편을 찾아 몇 편을 어떤 이유로 제외하고 최종 몇 편을 분석했는가"를 깔때기 다이어그램으로 명시합니다. 공학 리뷰 논문에서도 신뢰도를 높이기 위해 이 형식을 차용하는 경우가 늘고 있습니다.
가로축의 Pre-Decoupled vs Pre-Coupled는 태스크 할당에서 "로봇 간 의존성을 언제 끊느냐"를 뜻합니다. Decoupled는 각 로봇 문제를 미리 분리해 따로 푸는 방식(빠르지만 최적성 손해), Coupled는 로봇들의 상호작용을 함께 고려해 푸는 방식(품질 높지만 통신·연산 부담 큼)입니다. 분산 시스템에서는 이 둘 사이의 트레이드오프를 어떻게 다루느냐가 알고리즘 설계의 핵심이며, 이 좌표지도는 그 선택지를 한눈에 보여주는 셈입니다.
10태스크 할당과 연합 형성
분산형 태스크 할당 알고리즘은 거의 예외 없이 같은 골격을 따릅니다. 각 로봇이 자기가 가진 로컬 정보만으로 일단 결정을 내리고(Local Decision Making), 이웃과 정보를 주고받아 서로 어긋난 부분을 맞추고(Conflict Resolution), 이 과정을 합의에 도달할 때까지 반복하는 구조입니다. 교수님은 이 반복이 "언제 멈추는가", 즉 수렴(convergence)이 보장되는지가 분산 알고리즘 설계의 핵심이라고 강조하셨습니다. 그래서 단순히 잘 도는 것처럼 보이는 게 아니라, 내쉬 균형(Nash Equilibrium) 같은 게임 이론 도구로 수렴성을 수학적으로 증명하는 것이 중요하다고 하셨습니다.
이 슬라이드가 전하는 메시지는, 분산 MRTA 연구 전체를 한 장에 펼쳐 놓고 보면 결국 연산-통신 트레이드오프라는 하나의 지형 위에 모든 알고리즘이 놓인다는 점입니다. 통신 라운드를 줄이려면 각 라운드에서 더 무거운 계산을 해야 하고, 계산을 가볍게 하면 합의까지 더 많은 라운드가 필요합니다. 교수님의 박사 연구였던 연합 형성(Coalition Formation)은 별 모양 볼록 함수(Star-shaped convex function)로 유틸리티 함수를 설계하고 게임 이론으로 수렴을 증명한 사례이며, 에이전트나 태스크가 추가·제거될 때 다시 합의에 도달하는 재수렴 시간까지 분석했다고 소개하셨습니다.
응용 쪽으로는 두 가지를 언급하셨습니다. 하나는 전기차 충전소 배치 최적화로, 단순 K-Means보다 더 균형 잡힌 배치를 얻었다는 것이고, 다른 하나는 KAIST 오현우 교수님 연구실과 진행 중인 배터리 잔량을 고려한 태스크 할당으로, 장기간 운영에 적합한 할당을 목표로 한다고 하셨습니다.
표기를 직관적으로 풀면, ST-SR / ST-MR / SR-MR은 태스크·로봇의 다중성을 나타내는 분류입니다. ST=Single-Task(로봇 한 대가 한 번에 태스크 하나), MR=Multi-Robot(태스크 하나에 여러 로봇 필요), IA/TA는 즉시(Instantaneous) 할당이냐 시간 확장(Time-extended) 할당이냐를 구분합니다. 그래프 지름 d_G가 반복 복잡도에 들어가는 이유는, 분산 시스템에서 정보가 가장 먼 두 로봇 사이를 전달되려면 최소한 그 거리만큼의 통신 라운드가 필요하기 때문입니다 — 즉 네트워크가 넓고 듬성듬성할수록 합의가 느려집니다. 파레토 경계(Front Line)는 "더 이상 한쪽을 공짜로 개선할 수 없는 한계선"으로, 그 너머의 빈 공간이 곧 앞으로 연구가 파고들 여지(Future Work)입니다.
여기서부터 교수님은 연구실에서 직접 개발한 연구 도구들을 소개하는 흐름으로 넘어갑니다. 대본에 따르면 크게 세 가지인데, PyGame 기반 벤치마크 툴(멀티로봇 태스크 할당 시나리오 테스트용), PyBT-ROS(Python 기반 Behavior Tree ROS 패키지), 그리고 Crazyflie 기반 멀티로봇 테스트베드입니다.
이 도구들의 공통된 동기는 "이론과 실험 사이의 간극을 줄이는 것"입니다. 분산 알고리즘은 수식으로 수렴을 증명해도, 실제로 여러 로봇에서 돌려보지 않으면 통신 지연·충돌 같은 현실 문제를 알 수 없습니다. 그래서 교수님은 진입 장벽이 낮고 빠르게 실험을 반복할 수 있는 자체 도구를 만들어 연구와 교육 양쪽에 활용한다고 하셨습니다.
SPACE는 멀티로봇 태스크 할당 시나리오를 손쉽게 시험하기 위한 PyGame 기반 벤치마크 도구입니다. 두 시연 화면이 보여주듯, 같은 플랫폼 위에서 CBBA(소수 에이전트·다수 태스크)와 GRAPE(대규모 에이전트·소수 태스크)처럼 성격이 전혀 다른 알고리즘을 동일 조건에서 비교할 수 있다는 점이 핵심입니다. 즉, 서로 다른 연구가 제각각의 환경에서 낸 결과를 한 무대 위로 끌어와 공정하게 견줄 수 있게 한 것입니다.
교수님은 이 도구를 오픈소스로 공개해 다른 연구자도 자기 알고리즘을 끼워 넣어 검증할 수 있게 했다고 하셨습니다. 다음 슬라이드에서 이어지듯, SPACE의 강점은 "고충실도 시뮬레이터로 넘어가기 전에 빠르게 이론 모델을 찍어볼 수 있는 가벼운 실험대"라는 위치 설정에 있습니다.
이 슬라이드의 메시지는 시뮬레이터에는 "사용 편의성 ↔ 충실도"라는 또 하나의 트레이드오프가 있다는 것입니다. Gazebo·Webots처럼 물리를 정교하게 모사하는 도구는 결과가 현실에 가깝지만 셋업과 실험이 무겁고, Stage 같은 가벼운 도구는 다루기 쉽지만 단순합니다. SPACE는 의도적으로 편의성 쪽에 무게를 둔 설계(Design Focus)를 택해, 연구 극초기에 아이디어를 빠르게 검증하는 데 특화했습니다.
특히 교수님이 강조한 부분은 "의사코드만 구현하면 바로 돌려볼 수 있다"는 점입니다. 분산 알고리즘에서 가장 손이 많이 가는 에이전트 간 통신 처리를 SPACE가 내부에서 대신 처리해 주므로, 연구자는 알고리즘의 핵심 로직에만 집중할 수 있습니다. 그래서 SPACE는 그 자체가 최종 검증 도구라기보다, 이론에서 고충실도 실험으로 건너가는 길목의 '필수 중간 다리'로 자리매김합니다.
이 슬라이드는 SPACE의 모듈성을 강조합니다. 의사결정 알고리즘을 DM Plug-in이라는 교체 가능한 부품으로 분리해 두었기 때문에, 연구자는 시뮬레이터 전체를 건드리지 않고 자기 알고리즘만 Python 플러그인으로 갈아 끼워 다양한 시나리오에 적용할 수 있습니다. 시나리오 생성·시각화·평가가 모두 갖춰져 있어, .yaml/.xml로 설정을 주면 .csv·.gif 같은 결과물이 자동으로 나옵니다.
아래쪽에서 교수님은 Behavior Tree(BT)를 짚으십니다. BT는 로봇이 어떻게 행동할지를 정의하는 형식 모델인데, 전통적으로 쓰던 유한 상태 기계(Finite State Machine)보다 여러 면에서 낫다고 알려져 있습니다. 대본에서 정리한 BT의 장점은 세 가지였습니다 — 모듈을 재사용하기 쉬운 모듈성(Modularity), 복잡한 로직도 시각적으로 디버깅할 수 있는 가시성(Visibility), 예상치 못한 상황에 즉각 반응하는 반응성(Reactivity). 그래서 최근 2~3년 사이 "BT가 FSM보다 우수하다"는 연구가 늘고 있고, ROS2의 내비게이션 스택인 NAV2도 BT를 채택하고 있다고 소개하셨습니다.
이 BT 흐름은 교수님 연구실의 다른 도구 PyBT-ROS로 이어집니다. 기존 BehaviorTree.CPP가 C++ 기반이라 진입 장벽이 높았던 데 비해, Python 기반인 PyBT-ROS는 디버깅이 쉽고 학부 2학년 수업에서도 학생들이 화재 감지 로봇·기상 알람 로봇 같은 자유 주제를 직접 구현할 수 있을 만큼 접근성이 좋다고 하셨습니다.
FSM vs BT를 직관적으로 비교하면, 유한 상태 기계는 "상태 A에서 조건이 맞으면 상태 B로 간다"는 화살표(전이)를 일일이 그려야 합니다. 상태가 늘어나면 전이 화살표가 폭발적으로 늘어 거미줄처럼 엉키죠. BT는 대신 "탐색해라 → 실패하면 복귀해라"처럼 행동을 트리(나무) 구조로 쌓아, 매 순간 루트에서부터 트리를 훑어 내려가며 지금 할 일을 고릅니다. 덕분에 새 행동을 가지 하나로 붙이기만 하면 되고(모듈성), 어디서 막혔는지 트리를 보면 바로 보이며(가시성), 매 틱마다 트리를 다시 평가하므로 갑자기 적기가 나타나는 상황에도 즉시 분기를 바꿔 대응할 수 있습니다(반응성). 이 점이 미션 수준 자율성(Mission Autonomy)에서 BT가 각광받는 이유입니다.
11연구 도구 개발과 진행 중인 연구
멀티로봇 태스크 할당(Task Allocation) 알고리즘을 빠르게 검증하려면, 시나리오를 바꿔가며 반복 실험할 수 있는 자체 벤치마크 도구가 필요합니다. 그래서 PyGame 기반의 가벼운 시뮬레이터를 직접 만들었고, 여기에 앞서 설명한 행동 트리를 결합했습니다.
BT의 진가는 바로 이 지점에서 드러납니다. 외판원 문제처럼 "모든 지점을 방문"하는 시나리오와 픽업-배송처럼 "집어서 옮기는" 시나리오는 미션 논리가 다르지만, BT 노드 몇 개만 갈아 끼우면 같은 골격으로 두 시나리오를 모두 표현할 수 있습니다. 즉 코드를 통째로 다시 짜지 않고도 새로운 미션에 적응(adapt)시킬 수 있다는 것이 핵심입니다.
도구를 한번 잘 만들어 두면 다양한 응용 시나리오로 확장하기 쉽습니다. 창고 물류, 군집 비행, 화재 진압처럼 성격이 다른 미션들도 같은 프레임워크 위에서 구현해 알고리즘의 일반성을 검증할 수 있습니다.
특히 화재 진압 장면은 앞서 시뮬레이션 검증에서 언급한 시나리오와 연결됩니다. UAV가 정찰하고, 구조 UGV가 인명을 구하며, 소방 UGV가 불을 끄는 일련의 시퀀스를 이 도구 안에서 재현하면서 분산형 태스크 할당이 실제로 잘 수렴하는지 눈으로 확인하는 것입니다.
행동 트리의 대표적 라이브러리인 BehaviorTree.CPP는 C++ 기반이라 디버깅이 까다롭고 진입장벽이 높습니다. 그래서 Python으로 BT를 작성하고 ROS와 연동할 수 있는 py_bt_ros를 직접 개발했습니다. 디버깅이 쉽고 배우기 부담이 적어 교육용으로도 적합합니다.
실제로 학부 2학년 로봇 프로그래밍 수업에 이 도구를 활용하고 있습니다. 학생들이 자유 주제로 화재 감지 로봇, 기상 알람 로봇 같은 프로젝트를 BT로 직접 구현하는데, 진입장벽이 낮은 도구 덕분에 초심자도 복잡한 로봇 로직을 시각적으로 다룰 수 있게 됩니다.
분산형 코디네이션을 실제 하드웨어로 검증하려면, 로봇들이 중앙을 거치지 않고 서로 직접 통신할 수 있어야 합니다. MONA-SPACE는 P2P(Peer-to-Peer) 통신과 온보드 처리(on-board)를 지원한다는 점에서 기존 Crazyflie 기반 테스트베드와 차별화됩니다. 즉 의사결정·통신·이동을 로봇 안에서 자체적으로 수행하며 진짜 분산형 실험을 할 수 있습니다.
모드 표가 중요한 이유는, 연구 단계에 맞춰 점진적으로 현실에 가까워질 수 있기 때문입니다. 처음에는 모든 것을 시뮬레이션(Full Sim)이나 외부 컴퓨터(Off-board)에서 돌려 검증하고, 알고리즘이 안정되면 통신과 의사결정을 점차 로봇 온보드와 P2P로 옮겨 실제 분산 환경에서의 강건성을 단계적으로 확인하는 것입니다.
강연을 마치며, 현재 진행 중인 연구들을 정리하면 다음과 같습니다. ① 리더 제거 시 분산형 재구성 실험(이번 주 예정) — 군집을 이끌던 리더가 사라졌을 때 시스템이 스스로 재조직되는지를 검증합니다. ② 멀티로봇 태스크 할당에 대한 리뷰 논문 제출 직전 단계입니다.
③ LLM을 활용한 미션 오토노미 프레임워크의 적응성 개선 — 앞서 소개한 LLM·AI Planning·BT 통합 접근을 더 유연하게 만드는 작업입니다. ④ KAI(한국항공우주산업)와는 유무인 복합 전투기(MUM-T) 시나리오 연구를, ⑤ KAIST(오현우 교수 연구실)와는 배터리 레벨을 고려한 태스크 할당 공동 연구 논문을 작성 중입니다.
이번 섹션 전체를 관통하는 메시지는 "좋은 연구 도구가 곧 연구 경쟁력"이라는 점입니다. 알고리즘(태스크 할당·연합 형성)을 검증하려면 빠르게 시나리오를 바꿔가며 실험할 수 있는 소프트웨어(PyGame, py_bt_ros)와, 분산 통신을 실제로 시험할 수 있는 하드웨어(MONA-SPACE)가 모두 필요합니다.
세 도구는 시뮬레이션 → 부분 현실 → 완전 분산으로 이어지는 검증 사다리를 이룹니다. PyGame으로 알고리즘 아이디어를 빠르게 거르고, py_bt_ros·Webots로 ROS 환경에서의 동작과 교육을 챙기며, MONA-SPACE에서 P2P·온보드로 실제 분산 환경을 재현하는 흐름입니다. 또한 이 모든 연구가 KAI·KAIST 같은 산업체·타 대학과의 협업으로 이어진다는 점은, 멀티로봇 분야가 학계 안에만 머물지 않고 국방·물류 등 실제 응용으로 확장되고 있음을 보여줍니다.
용어표 · English ↔ 한글
스스로 점검
- 중앙집중형 멀티로봇 시스템이 가진 네 가지 한계를 설명하고, 각각이 왜 분산화를 요구하는지 말할 수 있는가?
- MUM-T가 '완전 자율 군집'으로 가는 로드맵에서 어떤 위치를 차지하며 왜 중간 단계로 추가되었는가?
- 미션 오토노미에서 사람의 역할과 시스템의 역할은 어떻게 나뉘며, COA는 어떻게 만들어지는가?
- LLM, AI Planning(HTN), Behavior Tree 세 방법론의 강점과 한계를 비교하고, 왜 결합하려 하는지 설명할 수 있는가?
- Behavior Tree가 Finite State Machine보다 우수하다고 평가받는 세 가지 속성(Modularity·Visibility·Reactivity)을 예로 설명할 수 있는가?
- 분산형 태스크 할당의 'Local Decision → Conflict Resolution → 반복' 패턴이 어떻게 수렴하며, 게임 이론이 왜 필요한가?
- Mission BT를 모든 로봇이 실행하고 중앙-분산 하이브리드로 설계하는 것이 장애 대응과 확장성 측면에서 어떤 이점을 주는가?