멀티로봇 시스템과 미션 오토노미: 분산형 협업의 설계

Part 1슬라이드 1~4

01강의 소개와 연구자 배경

슬라이드 내용 정리

강의 제목은 "Mission Autonomy for Swarm/Multi-Robot Systems"(군집·멀티로봇 시스템을 위한 미션 자율성)입니다. 발표자는 장인모(Dr Inmo Jang) 교수로, 한국항공대학교(Korea Aerospace University) 자율비행체공학과(Department of Autonomous Vehicle Engineering)의 조교수(Assistant Professor)입니다.

교수님 설명

이번 주차는 항공대 장인모 교수님이 진행하는 특강으로, 주제는 군집(swarm)·멀티로봇 시스템의 미션 자율성입니다. 즉, 여러 대의 로봇이 협력해 하나의 임무를 수행할 때 이를 어떻게 자율적으로 계획·할당·실행하게 만들 것인가를 다룹니다.

교수님은 자신을 항공우주와 로보틱스를 오가는 연구자로 소개합니다. 본래 항공우주(특히 UAV, 즉 무인항공기) 배경을 가지고 있었고, 이를 점차 에어리얼 로봇과 멀티로봇 시스템으로 확장해 왔다고 설명합니다.

슬라이드 내용 정리

도입부(Introduction)를 알리는 간지(섹션 표지) 슬라이드입니다. 본격적인 연구 배경 소개로 넘어가는 전환점입니다.

교수님 설명

여기서부터 본론에 앞선 도입 파트가 시작됩니다. 교수님은 먼저 자신의 연구 여정과 배경을 소개한 뒤, 왜 멀티로봇 시스템과 미션 자율성이 중요한지로 자연스럽게 이야기를 풀어갑니다.

슬라이드 내용 정리

장인모 교수의 경력을 연도별 타임라인으로 보여줍니다(아래에서 위로 시간 진행).

· 2004~ 서울대학교(Seoul National University): 항공우주공학 학부/석사, GNSS Lab
· ~2010 KAI(한국항공우주산업, Korea Aerospace Industries): 안정성·제어 전문가(KF-X, FA-50)
· ~2014 KIAST(항공안전기술원): 항공안전 인증 전문가
· ~2018 크랜필드 대학(Cranfield University, UK): 박사(멀티로봇 AI)
· 맨체스터 대학(University of Manchester, UK): 박사후연구원, 극한환경 로봇 그룹
· ~2020 삼성전자(Samsung Electronics): 책임연구원, EHS 자동화 파트장
· 2024~ 한국항공대 조교수 / Shield AI 기술자문

좌측에는 "Highlight: 로보틱스·항공우주 전문가, 8년 산업 경력", "Research Topics: 멀티로봇 시스템용 AI, 인간-군집 협업(Human-Swarm Collaboration)"이 적혀 있고, 우측 하단엔 학계(Academia)·산업(Industry)·정부(Government)를 두루 거쳤음을 강조합니다.

교수님 설명

교수님은 자신의 이력을 항공과 로보틱스를 넘나든 여정으로 설명합니다. KAI에서 9년, 항공안전기술원에서 1년을 일한 뒤 영국으로 건너가 크랜필드에서 박사 학위를, 맨체스터에서 박사후연구원을 거쳤고, 다시 삼성전자에서 파트장을 지낸 후 한국항공대 교수로 부임해 현재 2년차라고 소개합니다.

이렇게 학계·산업계·정부 기관을 두루 경험한 덕분에, 상황에 따라 "항공하는 사람"으로도 "로봇하는 사람"으로도 자신을 포지셔닝할 수 있다고 말합니다. 연구 키워드는 멀티로봇 시스템을 위한 AI와 인간-군집 협업입니다.

슬라이드 내용 정리

제목은 "From Animation & Game"(애니메이션과 게임에서)으로, 군집 로봇의 이상적 모습을 대중문화 속 사례로 보여줍니다. 디즈니 애니메이션 빅 히어로 6(Big Hero 6)의 마이크로봇(microbots)과, 게임 스타크래프트(StarCraft) 캐리어의 인터셉터(interceptor) 영상이 함께 제시됩니다.

교수님 설명

교수님은 멀티로봇 연구가 궁극적으로 지향하는 모습을 이 두 사례로 직관적으로 보여줍니다. 빅 히어로 6의 마이크로봇은 수많은 작은 로봇이 모여 자유자재로 형태를 만들고, 스타크래프트의 인터셉터는 모선(캐리어)에서 발진해 군집으로 움직입니다. 이 정도 수준의 협력·제어가 가능한 시스템이 연구의 최종 목표라는 것입니다.

즉, 이런 영화·게임 속 장면을 현실의 로봇 군집에서 어떻게 구현할 수 있을지가 이 강의 전체를 관통하는 동기가 됩니다.

보충 설명

군집(Swarm) vs 멀티로봇(Multi-Robot): 둘 다 여러 로봇이 협력하는 시스템이지만, 군집은 보통 단순한 개체가 매우 많이 모여 집단 행동(예: 새 떼, 개미 군집)을 내는 쪽을, 멀티로봇은 상대적으로 능력 있는 소수의 로봇이 역할을 나눠 협업하는 쪽을 가리킬 때가 많습니다. 강의에서는 두 개념을 함께 다룹니다.

왜 영화·게임 사례로 시작할까: 추상적인 "자율 군집 제어"라는 목표를, 누구나 본 적 있는 시각적 이미지로 묶어 청중과 눈높이를 맞추려는 의도입니다. 이후 슬라이드들은 이 이상을 실제 알고리즘·아키텍처로 끌어내리는 과정을 설명하게 됩니다.

Part 2슬라이드 5~9

02멀티로봇 시스템은 왜 필요한가

슬라이드 내용 정리

제목은 US DoD Roadmap: Personal Motivation(미 국방부 로드맵: 개인적 동기). 미국 국방부의 무인 항공 시스템 로드맵 2005–2030(US DoD Unmanned Aircraft Systems Roadmap)을 보여줍니다.

오른쪽 그래프는 자율 제어 수준(Autonomous Control Levels)을 1단계 Remotely Guided(원격 조종)부터 10단계 Fully Autonomous Swarms(완전 자율 군집)까지 나타냅니다. 가로축은 연도(1955~2025), 세로축은 자율화 정도이며, 빨간 원으로 강조된 최상위 목표가 바로 완전 자율 군집(레벨 10)입니다. 글로벌 호크·J-UCAS 같은 무인기들이 시간이 지나며 점점 더 높은 자율 수준으로 발전하는 추세선이 그려져 있습니다.

교수님 설명

교수님은 멀티로봇 시스템 연구의 궁극적 목표를 영화·게임에 빗대어 설명합니다. 빅히어로6의 마이크로봇이나 스타크래프트 캐리어가 띄우는 인터셉터처럼, 수많은 개체를 하나의 의지로 매끄럽게 제어하는 수준이 이상향이라는 것이죠.

이 슬라이드의 핵심은 그 목표가 단순한 공상이 아니라 실제 정책 로드맵에 들어 있다는 점입니다. 미 국방부는 2005년 로드맵에서 2025년까지 완전 자율 군집(Fully Autonomous Swarm)을 달성하겠다는 목표를 세웠고, 이것이 교수님 연구의 개인적 동기이자 분야 전체의 장기 비전이 됩니다. 즉 "사람이 하나하나 조종하는" 단계에서 "로봇 떼가 스스로 협력하는" 단계로 나아가는 것이 자율화 사다리의 꼭대기라는 메시지입니다.

슬라이드 내용 정리

제목은 Real-world Applications(실제 응용 사례). 멀티로봇 군집이 이미 현실에서 쓰이는 네 가지 예시를 사진으로 보여줍니다.

물류창고(Warehouse) — Ocado, 영국, 2018.10
검사·모니터링(Inspection & Monitoring) — Vanderlande(공항 수하물 처리), 네덜란드, 2019.02
클라우드 기반 서비스 로봇 — Naver(네이버랩스), 한국, 2020.01
엔터테인먼트(Entertainment) — Damoda, 중국, 2024.10. 10,197대의 드론을 한 대의 컴퓨터로 제어한 드론쇼

교수님 설명

교수님은 멀티로봇이 더 이상 연구실 안의 이야기가 아니라 이미 산업 현장에 들어와 있음을 강조합니다. 물류창고의 운반 로봇, 공항의 수하물 처리, 네이버랩스의 클라우드 기반 로봇, 그리고 만 대 규모의 드론쇼가 그 예입니다.

특히 마지막 드론쇼 사례에서 1만여 대를 단 한 대의 컴퓨터가 제어한다는 점을 짚습니다. 이는 화려해 보이지만 동시에 다음 슬라이드로 이어지는 문제 제기이기도 합니다. 즉, 오늘날 대부분의 군집 시스템은 중앙집중형(centralised)이라 중앙 컴퓨터가 멈추면 전체가 마비된다는 약점을 안고 있다는 것입니다.

슬라이드 내용 정리

제목은 Why "Decentralisation" Matters?(왜 "분산화"가 중요한가?).

사실 중앙집중화(centralisation)는 많은 실용적 응용에서 잘 작동한다.
그러나 다음과 같은 경우 분산화(decentralisation)가 점점 더 필수로 인식되고 있다:
- 통신(Communication)이 충분히 확보되지 않을 때 — 극한 환경, 심지어 실내 건물에서도
- 중앙 제어 장치가 고장(failed)나거나 애초에 쓸 수 없을 때 — 국방 응용, 또는 시골 지역의 C-ITS
- 확장성(Scalability)이 중요할 때 — 로봇 수가 많을 때
- 프라이버시(Privacy)가 중요할 때

왼쪽 그림은 중앙의 Mission Planning Station(미션 계획국)과 리더가 빨간 X로 표시되어 있어, 중앙이 죽으면 전체 군집이 무력화됨을 시각화합니다.

교수님 설명

여기서 교수님은 왜 자신이 분산형(decentralised) 시스템을 연구하는지 네 가지 이유로 정리합니다. 첫째 통신 제약 — 충분한 대역폭을 늘 확보하기 어렵습니다. 둘째 단일 실패 지점(Single Point of Failure) 방지 — 중앙이 망가지면 전부 멈추는 구조를 피해야 합니다. 셋째 확장성 — 로봇 수가 늘어도 자율적으로 굴러가야 합니다. 넷째 프라이버시 — 장기적으로 여러 벤더가 협업할 때 정보 공유 문제가 생깁니다.

이를 실제 경험으로 뒷받침합니다. 교수님은 원자력 시설에서 두꺼운 콘크리트 벽 때문에 통신이 끊기는 상황을 겪었고, 영국에서는 1·2차 세계대전 시기 원자력 시설을 처리하는 프로젝트에서 설계도조차 없는 미지의 공간에 로봇을 투입해야 했다고 말합니다. 이런 환경에서는 중앙에 의존할 수 없으니 각 로봇이 스스로 판단하는 분산형이 불가피하다는 것입니다.

보충 설명

슬라이드의 C-ITS는 Cooperative Intelligent Transport Systems(협력 지능형 교통체계)로, 차량과 도로 인프라가 통신해 협력하는 시스템입니다. 도심에서는 기지국이 촘촘하지만 시골에서는 통신망이 없을 수 있어, 차량들끼리 직접 정보를 주고받는 분산형이 필요해집니다. 오른쪽 자율주행 차량 사진이 바로 이 사례를 가리킵니다.

슬라이드 내용 정리

제목은 Potential "Decentralised" Applications(잠재적 "분산형" 응용). 분산형 군집이 앞으로 활약할 분야 네 가지를 보여줍니다.

국방 산업(Defense Industry) — Palantir, 미국, 2024.12
검사·모니터링(Inspection & Monitoring) — Rolls-Royce, 영국, 2018.08 (제트 엔진 점검)
커넥티드 차량(Connected Vehicles) — Nokia, 핀란드, 2020.01
공장 자동화(Factory Automation) — Ubitech, 중국, 2025.03. "세계 최초로 여러 시나리오와 작업에 걸친 다중 휴머노이드 로봇 협업"

교수님 설명

앞 슬라이드가 "왜 분산화가 필요한가"를 논했다면, 이 슬라이드는 "그 분산형이 어디에 쓰일 것인가"를 보여줍니다. 국방, 엔진 검사, 커넥티드 차량, 공장 휴머노이드 협업처럼 중앙 통제가 어렵거나 위험하거나 대규모인 영역들이 분산형의 무대가 됩니다.

특히 국방 분야는 통신이 교란되거나 적에게 노출되면 안 되는 환경이라 분산형의 필요성이 가장 큽니다. 이는 뒤에서 다룰 유무인 복합체계(MUM-T, Manned-Unmanned Teaming) 연구로 자연스럽게 이어지는 대목입니다. 공장 자동화 사례처럼 여러 종류의 로봇이 서로 다른 작업을 동시에 협력하는 시나리오가 미래의 핵심 응용이 될 것이라는 전망입니다.

슬라이드 내용 정리

제목은 Some Research Areas(주요 연구 분야). 멀티로봇 연구의 다섯 갈래를 정리합니다.

멀티로봇 인지(Perception) — 더 나은 상황 인식을 위해 환경을 어떻게 협력적으로 인지할까(정보 융합과 유사). 예: Multi-Robot SLAM, Source Term Estimation(오염원 추정)
의사결정(Decision-Making) — 로봇 간 충돌 없이 집단적 효용을 위해 무엇을 할지 결정. 예: Multi-Robot Task Allocation(태스크 할당)
경로 계획/탐색(Path Planning/Finding) — 로봇 간 충돌 없이 각자의 목적지에 도달
강화학습(Reinforcement Learning) — 학습 과정 가속(연합학습, federated learning), 다중 상호작용 에이전트 적응(MARL)
인간-멀티로봇 협업(Human–Multi-Robot Collaboration) — 한 사람이 여러 로봇과 효과적으로 일하는 법. 예: MUM-T(Manned Unmanned Teaming)

교수님 설명

이 슬라이드는 멀티로봇 연구가 인지 → 의사결정 → 경로계획 → 학습 → 인간 협업으로 이어지는 큰 지도를 제시합니다. 로봇이 환경을 함께 인식하고(Perception), 충돌 없이 누가 무슨 일을 할지 정하고(Decision-Making·Task Allocation), 서로 부딪히지 않게 움직이며(Path Planning), 학습으로 성능을 높이고(RL), 최종적으로 사람과 협업하는(Human Collaboration) 순서입니다.

특히 마지막 항목 MUM-T(유무인 복합체계)는 이후 강의의 중심 주제로, 사람이 고수준 미션을 주면 로봇들이 이를 세부 태스크로 나눠 자율 수행하는 구조와 직결됩니다. 교수님 본인의 박사 연구인 연합 형성(Coalition Formation)과 태스크 할당이 이 "의사결정" 가지에 위치하며, 이것이 분산형 군집 제어의 핵심 알고리즘 문제임을 시사합니다.

Part 3슬라이드 10~15

03분산화(Decentralization)의 중요성

슬라이드 10 · 챕터 표지: Multi-Robot Mission Autonomy

슬라이드 15 · 방산업계의 시각 ③ Shield AI (3계층 자율성)

슬라이드 내용 정리

이 단원의 표지 슬라이드입니다. 제목은 Multi-Robot Mission Autonomy(멀티로봇 미션 오토노미) 하나뿐입니다.

교수님 설명

여기서부터 본 강연의 핵심 주제인 미션 오토노미(mission autonomy)로 들어갑니다. 앞에서 다룬 "왜 분산형(decentralized) 멀티로봇이 필요한가" — 통신 제약, 단일 장애점(single point of failure) 방지, 확장성(scalability), 프라이버시 — 라는 문제의식의 연장선입니다. 중앙집중형 시스템은 중앙이 죽으면 전체가 마비되므로, 여러 로봇이 스스로 임무를 이해하고 분담해 수행하는 자율성이 요구된다는 흐름입니다.

특히 교수님은 원자력 시설처럼 두꺼운 콘크리트 벽 때문에 통신이 거의 불가능했던 실제 경험을 들며, 분산화가 단순한 이론이 아니라 현장의 물리적 제약에서 나오는 필연임을 강조했습니다. 이 표지 이후 슬라이드들은 그 자율성이 군사·방산 분야에서 어떻게 구체화되고 있는지를 보여줍니다.

슬라이드 내용 정리

제목: "New" US DoD Roadmap: MUM-T to Swarms (새 미 국방부 로드맵 — 유무인 협업에서 스웜으로). 부제: "인간의 적응성과 멀티로봇 확장성을 결합하면 임무 효과가 높아진다."

왼쪽엔 미 국방부의 Unmanned Systems Integrated Roadmap 2017–2042 표지와 Airbus·BAE Systems의 유무인 협업 항공기 이미지가 있습니다. 인용문 두 개가 핵심입니다: ① "국방부는 무인 시스템이 유인 시스템과 매끄럽게 협업하여 전투원의 의사결정 과정을 압축하고 인명 위험을 줄이는 것을 구상한다." ② "MUM-T는 소방, 수색·구조, 위험물(hazmat) 사고, 법 집행 등 민간 영역에서도 중요한 응용을 갖는다." (※ MUM-T: Manned-Unmanned Teaming, 유무인 복합체계)

교수님 설명

2005년 미 국방부 로드맵은 2025년까지 완전 자율 스웜(Fully Autonomous Swarm)을 목표로 잡았지만, 2017년 업데이트에서 현실을 반영해 중간 단계로 MUM-T를 추가했습니다. 즉 "사람이 빠진 완전 자율"로 바로 가는 게 아니라, 유인 자산과 무인 자산이 팀을 이루는 단계를 먼저 거친다는 것입니다. 한국에서는 이를 '유무인 복합체계'라고 부릅니다.

교수님은 이 흐름이 학계에서도 뚜렷하다고 짚었습니다. 항공우주학회 발표 주제가 작년부터 UAM(도심항공교통)에서 MUM-T로 절반 이상 급격히 옮겨갔다는 것이죠. 그리고 MUM-T가 군사용에만 머물지 않고, BAE Systems의 설명처럼 소방·수색구조·재난 대응 같은 민간 영역으로도 확장된다는 점이 슬라이드의 인용문이 강조하는 부분입니다.

슬라이드 내용 정리

같은 로드맵을 표로 풀어낸 슬라이드입니다 (Table 3: Comprehensive Roadmap for Autonomy). 가로축은 시간(NEAR-TERM → MID-TERM → FAR-TERM, 2017→2042), 세로축은 자율성(AUTONOMY)의 네 측면입니다.

· AI/머신러닝: 민간 협업·클라우드 → 증강/가상현실 → 지속 감시·고도 자율
· 효율·효과 향상: 안전·효율 증대 → MUM-T(무인 임무·리더-팔로워) → Fully Autonomous Swarm(스워밍)
· 신뢰(Trust): 임무 지시·검증, 인간 결정에 대한 윤리 요건
· 무기화: 전략 합의·LAWS 평가 → 무장 윙맨/팀메이트(교전은 인간이 결정)

하단 인용: "중기에는 인간-기계 협업이 개선되어, 자율 '로봇 윙맨(robotic wingmen)'이 유인 항공기·지상 전투차량·수상/수중함과 동행할 수 있다."

교수님 설명

이 표가 보여주는 핵심은 '단계론'입니다. 표의 효율·효과 행을 따라가 보면, 가까운 미래엔 사람이 안전하게 효율을 높이는 정도, 중기엔 리더-팔로워(leader-follower) 방식의 MUM-T, 그리고 먼 미래에야 비로소 사람의 개입 없이 군집이 스스로 협력하는 완전 자율 스웜에 도달한다는 단계적 그림입니다. 앞서 본 2025년 목표가 왜 2042년 지평으로 미뤄졌는지를 이 표가 설명해 줍니다.

특히 무기화 행의 단서가 중요합니다 — 자율 시스템이 발전해도 실제 교전(engage) 결정은 인간이 내린다는 원칙이 명시돼 있습니다. 자율성을 높이는 것과 살상 결정을 기계에 맡기는 것은 별개라는, 신뢰·윤리 측면의 제약이 로드맵에 함께 박혀 있다는 점을 읽어야 합니다.

슬라이드 내용 정리

제목: What Defence Industry Says (방산업계는 무엇을 말하는가). 텍스트는 거의 없고, 편대 비행 중인 전투기 렌더링 이미지와 Collins Aerospace 로고, "Collins Aerospace, US – 2025.2" 출처 표기만 있습니다.

교수님 설명

여기서부터 세 장에 걸쳐 "정부 로드맵이 아니라 실제 기업들이 미션 오토노미를 어떻게 상품화하고 있는가"를 보여줍니다. 첫 사례인 Collins Aerospace의 이미지는 유인 전투기와 무인기가 한 편대를 이루는 MUM-T 개념을 그대로 시각화한 것으로, 미 공군의 CCA(Collaborative Combat Aircraft, 협업 전투기) 프로그램이 그리는 그림과 같은 맥락입니다.

교수님이 이 슬라이드들을 모은 이유는, 미션 오토노미가 학술적 호기심이 아니라 Airbus·BAE·Anduril·Shield AI 같은 굵직한 방산 기업들이 실제로 투자·개발하는 현실의 기술임을 보여주기 위해서입니다.

슬라이드 내용 정리

두 번째 방산 사례, Anduril. 제품명 Lattice for Mission Autonomy를 소개하며 슬로건은 "An unfair advantage for unrivaled deterrence"(타의 추종을 불허하는 억지력을 위한 불공정한 우위). 설명: "한 명의 인간이 바다·땅·하늘에 걸친 다양한 자율 자산(autonomous assets)을 제어·조율하여 임무를 성공시키도록 하는 고도화된 소프트웨어 플랫폼." 왼쪽 배경엔 노드들이 그물처럼 연결된 분산 네트워크 도식이 그려져 있습니다.

교수님 설명

Anduril의 메시지는 미션 오토노미의 목표를 한 문장으로 압축합니다 — "한 사람이 다수의 무인 자산을 지휘한다". 이것이 바로 미션 오토노미의 학술적 정의와 정확히 맞닿습니다. 사람은 고수준 임무(high-level mission)만 던지고, 시스템이 그것을 세부 태스크로 분해(task decomposition)하고 각 로봇에 할당(task allocation)하는 구조죠.

왼쪽의 그물망 도식도 의미심장합니다. 여러 자산이 서로 연결돼 정보를 주고받는 분산형 네트워크를 표현한 것으로, 이 단원 전체의 주제인 분산화(decentralization)와 직결됩니다. 'Lattice(격자)'라는 제품명 자체가 중앙 한 점에 의존하지 않고 노드들이 서로 엮이는 구조를 함축합니다.

슬라이드 내용 정리

세 번째 사례, Shield AI. 슬로건 "Precisely Execute Every Mission". 왼쪽 설명: "Mission Autonomy는 무인 시스템이 GNSS·통신·인간 입력 없이도, 단독으로든 팀으로든, 엣지(edge)에서 스스로 인지·결정·행동해 복잡한 임무를 독립적으로 완수하게 하는 핵심 계층이다." 오른쪽은 자율성을 3계층으로 나눈 표입니다:

· Autonomy Management — 작전 수준에서 다수 자산을 조율해 자원 배분·임무 결과 최적화 / 위치: 지휘소·전투관리시스템 노드
· Mission Autonomy — 개별 플랫폼·페이로드가 할당된 목표에 따라 태스크를 수행하도록 지시 / 위치: 온보드(엣지)
· Platform Autonomy — 안전 핵심 플랫폼 제어, 기체 상태 관리, 지형·장애물 회피 / 위치: 온보드

교스님 설명

Shield AI의 표는 자율성을 한 덩어리로 보지 않고 세 층위로 분해한 점이 핵심입니다. 위로는 여러 자산을 묶어 조율하는 작전 수준(Autonomy Management), 가운데는 개별 기체가 임무 목표를 태스크로 풀어 수행하는 미션 수준(Mission Autonomy), 아래는 비행 안정·충돌 회피 같은 플랫폼 수준(Platform Autonomy)입니다. 이는 교수님이 뒤에서 제안하는 Swarm Level → Task Level → Agent Level의 3계층 아키텍처와 거의 같은 발상입니다.

가장 주목할 표현은 "GNSS·통신·인간 입력 없이도 엣지에서 스스로 수행한다"는 대목입니다. 이는 정확히 이 단원이 강조한 분산화의 이유 — GPS가 안 잡히거나 통신이 끊기는 원자력 시설·전장 같은 환경에서도 작동해야 한다는 요구 — 에 대한 산업계의 답입니다. 중앙 통제가 불가능한 조건을 전제로 설계해야 진짜 쓸모 있는 시스템이 된다는 것이 세 기업 사례를 관통하는 메시지입니다.

Part 4슬라이드 16~20

04MUM-T와 미션 오토노미의 부상

슬라이드 내용 정리

방산업계가 보는 미션 오토노미(Mission Autonomy, MA)를 정리한 슬라이드입니다. 왼쪽(BAE Systems)의 정의: "미션 오토노미는 주로 국방·항공우주 기술 분야에서 쓰이는 용어로, 자율 시스템이 자신의 세계 지식과 이해, 자신의 능력·한계, 주어진 상황을 바탕으로 명시된 목표를 달성하기 위해 다양한 행동 방안(courses of action)을 스스로 수립하고 그중에서 선택해 실행하는 능력"을 가리킵니다.

오른쪽(US Army)은 군의 의사결정 과정을 보여줍니다 — "군의 의사결정 과정은 상황과 임무를 이해하고, 행동 방안(course of action)을 도출하여, OPLAN(작전계획)이나 OPORD(작전명령)를 산출하는 반복적(iterative) 계획 방법론"이라고 인용되어 있습니다.

아래쪽은 "2.1 COA란 무엇인가?" — Course of Action(COA)의 공식 정의입니다. 핵심은 "1. 개인이나 부대가 따를 수 있는 일련의 활동 시퀀스(sequence of activities)", "3. 임무를 완수하기 위해 채택한 방식", "4. 교전에서의 행동 노선" 등으로, 전략 수준부터 개별 부대까지 다양한 단계의 행동을 묘사할 때 쓰입니다.

교수님 설명

완전 자율 군집(Fully Autonomous Swarm)으로 가기 전 단계로 떠오른 개념이 미션 오토노미(미션 자율성)입니다. 미국 국방부(DoD)의 정의를 보면, 자율 시스템이 사람의 개입 없이 스스로 행동 방안(COA)을 수립하고 실행하는 것을 말합니다. 여기서 COA란 목표 상태에 도달하기 위한 일련의 액션 시퀀스를 의미합니다.

미 육군 교리(doctrine)로 풀어 보면 이 흐름은 상황 이해(Situation Understanding) → 임무 이해(Mission Understanding) → COA 생성으로 이어집니다. 즉 지금 어떤 상황인지 파악하고, 무엇을 해야 하는 임무인지 이해한 뒤, 그것을 달성할 구체적인 행동 계획을 짠다는 것이죠. BAE Systems나 US Army 같은 방산·군 쪽에서 이 용어를 정의해 두었다는 점이 포인트입니다.

보충 설명

OPLAN/OPORD는 군 용어로, 작전계획서와 작전명령서를 뜻합니다. 미션 오토노미의 지향점은 "사람이 일일이 명령하지 않아도 시스템이 스스로 이 작전계획에 해당하는 것을 만들어 낸다"는 것입니다. 뒤에 나올 멀티로봇 시스템 맥락에서는 "사람이 고수준 목표만 주면, 로봇들이 알아서 COA를 짜서 수행한다"로 이해하면 자연스럽습니다.

슬라이드 내용 정리

학술적 관점(+교수님 개인 견해)에서 본 멀티로봇 미션 오토노미 워크플로입니다. 위쪽 그림(Rizk et al., ACM Computing Surveys 2019의 Fig. 2)은 좌→우 흐름을 보여줍니다: 휴먼 전문가(Human Expert) + MAS → 복잡한 미션(Complex mission) → 태스크 분해(Task Decomposition) → 태스크 집합 → 연합 형성(Coalition Formation) → 태스크 (재)할당(Task (Re-)Allocation) → 계획 및 제어(Planning and Control). 사람과 시스템 사이 인터페이스는 HMI로 표시됩니다.

아래는 자율성을 계층(level)별로 정리한 것입니다. (1) 미션 레벨 자율성(스웜 레벨, "무엇을/어떻게"): 멀티로봇 태스크 플래닝 = 태스크 분해(복잡한 미션을 작은 태스크로 쪼갬) + 태스크 시퀀싱(의존성을 고려해 순서를 정함), 멀티로봇 태스크 할당("누가") = 연합 형성(로봇 팀 구성) + 태스크 할당(어떤 로봇이 어떤 태스크를 맡을지). (2) 태스크 레벨 자율성(에이전트 레벨): 액션 플래닝 — 할당받은 태스크를 위한 액션 시퀀스 결정. (3) 액션 레벨 자율성(저수준 계획): 경로/모션 플래닝과 저수준 제어(하드웨어 명령 생성).

교수님 설명

학술적으로 미션 오토노미를 정의하면, 사람이 고수준(high-level) 미션을 주면 시스템이 이를 세부 태스크로 분해하고 할당하는 것입니다. 이 슬라이드는 그 과정을 하나의 파이프라인으로 그린 것인데, 크게 태스크 플래닝 → 태스크 할당 → 액션/모션 플래닝(제어) 세 덩어리로 보면 됩니다.

특히 위로 갈수록(스웜 레벨) 추상적인 "무엇을 할지"를, 아래로 갈수록(에이전트 레벨) 구체적인 "어떻게 움직일지"를 다룹니다. 미션 레벨에서는 복잡한 미션을 잘게 나누고(태스크 분해), 순서와 의존관계를 정한 뒤(태스크 시퀀싱), 어떤 로봇이 어느 일을 맡을지(연합 형성 + 태스크 할당)를 결정합니다. 그 아래 단계에서 각 로봇이 자기 일을 수행할 액션을 짜고, 마지막으로 실제 경로를 계산하고 모터에 명령을 내리는 저수준 제어가 붙습니다. 오늘 다룰 Research Trend는 주로 이 윗단의 태스크 플래닝·할당을 어떻게 자동화하느냐에 있습니다.

슬라이드 내용 정리

챕터 표지 슬라이드입니다. 제목만 큼직하게: "Trends in Task Planning (Partially for Multi Robots)" — 즉 (부분적으로는 멀티로봇을 위한) 태스크 플래닝의 최신 동향으로 넘어간다는 전환 슬라이드입니다.

교수님 설명

앞에서 미션 오토노미와 태스크 플래닝의 큰 그림을 잡았으니, 이제부터는 실제로 태스크 플래닝을 어떻게 푸는지 그 방법론의 트렌드를 살펴보는 파트입니다. 대본에서 정리한 세 가지 큰 흐름이 곧이어 나옵니다: (1) LLM/VLM 활용, (2) 전통적 AI Planning(HTN 등), (3) Behavior Tree. 그중 첫 번째인 LLM/VLM 기반 접근이 바로 다음 슬라이드의 주제입니다.

슬라이드 내용 정리

멀티로봇 태스크 플래닝 — 동향 #1: LLM/VLM 활용 슬라이드입니다. 최근 트렌드는 "LLM(대규모 언어모델)을 활용해 태스크 플래닝 문제를 푸는 시도가 늘고 있다"는 것입니다. 왼쪽 도식은 자연어 명령(예: Close the Laptop, Turn off the light switch, Turn on the TV 등)을 태스크 분해 → 연합 형성 → 태스크 할당 단계로 처리하는 모습을 보여줍니다.

오른쪽 사진들은 시뮬레이션에서 로봇이 실제로 수행한 예시입니다 — "데스크 램프로 가서 끄기", "플로어 램프로 가서 끄기", "TV로 가서 켜기" 등으로, 여러 로봇이 각자 태스크를 나눠 빠르게 처리합니다. 출처는 SMART-LLM(Kannan et al., ICRA 2024), GitHub: SMART-lab-Purdue/SMART-LLM. 우측 하단에는 ※(Remind) 멀티로봇 태스크 플래닝 = 태스크 분해 + 태스크 시퀀싱이라는 복습 박스와 앞서 본 워크플로 도식이 다시 표시됩니다.

교수님 설명

첫 번째 트렌드는 LLM/VLM(비전-언어모델)을 태스크 플래닝에 끌어다 쓰는 것입니다. 핵심 아이디어는, 사람이 자연어로 "노트북을 닫고, 불을 끄고, TV를 켜라" 같은 복잡한 미션을 주면, LLM이 이것을 태스크 분해(Task Decomposition), 연합 형성(Coalition Formation), 태스크 할당(Task Allocation)으로 나눠 처리해 준다는 것입니다.

여기서 인상적인 점은, 잘 설계된 프롬프트 템플릿을 주면 LLM이 각 로봇이 실행할 코드를 거의 자동으로 생성해 준다는 것입니다. 즉 예전에는 사람이 손으로 짜야 했던 분해·할당 로직을 언어모델이 대신 만들어 주는 셈이죠. SMART-LLM(ICRA 2024)이 그 대표 사례이고, 이런 접근이 최근 급격히 늘고 있다는 게 이 슬라이드의 메시지입니다.

보충 설명

VLM(Vision-Language Model)은 이미지와 언어를 함께 이해하는 모델로, 로봇이 카메라로 본 장면("책상 위에 노트북이 열려 있다")을 언어 명령과 연결해 추론할 수 있게 합니다. LLM이 태스크 플래닝에 매력적인 이유는, 사람이 쓰는 자유로운 자연어 미션을 별도의 형식 변환 없이 바로 입력으로 받고, 상식적 추론(예: "TV를 켜려면 먼저 TV 앞으로 가야 한다")을 어느 정도 내장하고 있기 때문입니다. 다만 LLM 단독으로는 정확성·검증이 약해, 뒤에서 다룰 전통적 AI Planning이나 Behavior Tree와 결합하는 추세로 이어집니다.

슬라이드 내용 정리

SMART-LLM의 전체 파이프라인을 4단계로 펼친 슬라이드입니다. 각 단계는 코드(프롬프트로 생성된)와 함께 LLM 블록으로 연결됩니다: Stage 1 — 태스크 분해(Task Decomposition), Stage 2 — 연합 형성(Coalition Formation), Stage 3 — 태스크 할당(Task Allocation). 세 단계의 출력이 각각 LLM을 거쳐 마지막 Stage 4 — 태스크 실행(Task Execution)으로 모이고, 하단에는 로봇들이 실제로 작업을 수행하는 시뮬레이션 장면이 이어집니다.

교수님 설명

앞 슬라이드의 개념을 실제 구현 흐름으로 보여주는 그림입니다. 보다시피 태스크 분해 → 연합 형성 → 태스크 할당 → 태스크 실행의 각 단계마다 프롬프트 템플릿을 LLM에 넣어 코드를 자동 생성하고, 그 결과를 다음 단계로 넘기는 구조입니다. 사람이 알고리즘을 직접 설계하지 않아도, 잘 짜인 프롬프트만 있으면 분해·팀 구성·할당·실행 코드가 차례로 만들어진다는 게 핵심입니다.

이것이 LLM 기반 미션 오토노미의 매력이자 한계를 동시에 보여줍니다. 매력은 "유연하고 자동화하기 쉽다"는 것이고, 한계는 "생성된 결과가 항상 옳다는 보장이 없다"는 것이죠. 그래서 대본에서도 강조했듯, 최근에는 이 LLM 방식을 전통적 AI Planning(HTN Planner 등)이나 Behavior Tree와 묶어 쓰는 통합 접근이 등장하기 시작했고(2024년 ICRA 무렵부터), 그것이 이 분야의 다음 연구 방향으로 이어집니다.

Part 5슬라이드 21~24

05미션 오토노미의 정의

슬라이드 내용 정리

Multi-Robot Task Planning – Trend #2: 전통적 접근법 (Traditional Approach)

AI 플래닝 (AI Planning, "Automated Planning and Scheduling")

위키 정의: "지능형 에이전트·자율로봇·무인 차량이 실행할 전략(strategies) 또는 행동 시퀀스(action sequences)의 구현을 다루는 인공지능의 한 분야"
관련 학회: ICAPS(International Conference on Automated Planning and Scheduling), 1990년부터 이어짐

계층적 태스크 네트워크 (Hierarchical Task Network, HTN)

규칙 기반 로직(예: 방대한 if-else 조건)을 수작업으로 구현할 필요가 없음
HTN = 태스크 간 계층 관계 (상위 태스크 ↔ 하위 태스크)
계층적 플래닝 엔진 + 태스크 네트워크 ⇒ 완전한 규칙 기반 로직 시스템을 구현한 것과 동등 (예: GTPyhop)

아래에는 태스크 네트워크의 트리 구조 예시가 도식으로 제시됨 (출처: Kabir et al., Autonomous Robots, 2019).

교수님 설명

이 슬라이드부터는 휴먼이 고수준 미션만 주면 로봇이 알아서 COA(Course of Action)를 만들어 실행하는, 즉 미션 오토노미를 실제로 구현하는 태스크 플래닝 방법론을 다룹니다. 최근 트렌드를 세 갈래로 정리하는데, 이 슬라이드는 그중 두 번째인 전통적 AI 플래닝입니다.

AI 플래닝은 갑자기 등장한 분야가 아니라 ICAPS라는 학회를 중심으로 30년 넘게 축적된 영역이라는 점을 강조하셨습니다. 핵심 도구가 HTN(Hierarchical Task Network) 플래너인데, 복잡한 작업을 상위 태스크와 하위 태스크로 계층적으로 쪼개서 푸는 방식입니다. 장점은 개발자가 모든 상황을 if-else로 일일이 코딩하지 않아도, 계층 구조와 플래닝 엔진만 정의해 두면 사실상 완전한 규칙 시스템을 갖추게 된다는 점입니다.

보충 설명

"플래닝(planning)"은 AI에서 현재 상태(state)에서 목표 상태(goal)까지 도달하는 행동의 순서를 자동으로 찾아내는 문제를 말합니다. HTN은 이를 위에서 아래로 분해(decomposition)합니다. 예를 들어 "가구를 조립한다"는 큰 태스크를 "다리를 붙인다 → 상판을 올린다 → 나사를 조인다"처럼 계층적으로 쪼개고, 각 하위 태스크를 더 이상 쪼갤 수 없는 원시 행동(primitive action)까지 내려가며 전개합니다. 트리의 잎(leaf)이 곧 로봇이 실제로 수행하는 동작이 됩니다.

슬라이드 내용 정리

전통적 접근법 — 로보틱스 적용 예시

IKEA 가구 조립을 휴먼과 협업으로 수행하는 시나리오
정의된 원시 행동(Primitive actions): Grasp(잡기), Release(놓기), Move(이동), Manipulate(조작), Wait(대기), Perceive(인지)
HTN 플래너(GTPyhop)로 복잡한 작업을 이들 원시 행동의 조합으로 분해
GTPyhop을 ROS와 통합하여 인지–플래닝–행동(Perception-Planning-Action) 파이프라인 구축

우측 도식: HTN State / HTN Planner / Joint Trajectory Client, 그리고 Tactile Sensing(촉각 센싱), Human Activity·Idle Recognition(휴먼 행동·유휴 인식), Vision(마커 인식·핸드오버) 모듈이 연결된 구조 (출처: Belcamino et al., RO-MAN 2024).

교수님 설명

앞서 설명한 HTN이 실제 로봇에서 어떻게 쓰이는지 보여주는 사례입니다. 휴먼과 로봇이 함께 IKEA 가구를 조립하는 상황을 가정합니다. 여기서 로봇이 할 수 있는 모든 동작을 Grasp, Move, Wait 같은 몇 개의 원시 행동으로 먼저 정의해 두고, HTN 플래너(GTPyhop)가 "조립한다"는 추상적 목표를 이 원시 행동들의 시퀀스로 자동 분해합니다.

특히 휴먼이 끼어들거나(개입), 방해하거나, 도움을 줄 때 로봇이 그 상황을 인식하고 계획을 다시 짜야 한다는 점이 핵심입니다. 그래서 촉각 센서, 휴먼 행동 인식, 비전 모듈을 ROS로 묶어 "인지 → 플래닝 → 행동"이 끊김 없이 도는 파이프라인을 만든 것입니다. 전통적 플래닝이 협업 로봇처럼 동적인 환경에서도 작동할 수 있음을 보여주는 예입니다.

슬라이드 내용 정리

Trend #3 — 실전 로보틱스: 행동 트리 (Behaviour Tree, BT)

BT는 방향성 트리(directed tree)로 구성:
- 3종류의 노드: Root(루트), Control(제어), Leaf(잎) 노드
- tick이라는 신호가 트리를 타고 내려가 잎 노드에 도달할 때까지 전파됨
로보틱스에서 인기를 얻는 이유:
- Modularity(모듈성): 서비스 지향 / 확장 가능한 아키텍처
- Readability(가독성): 시각적·직관적 디버깅
- Reactivity(반응성): 실패 복구(failure recovery)

도식 예: Sequence → OpenDoor → Walk → CloseDoor. 우측에는 BT vs. 유한상태기계(FSM) 비교, NAV2(ROS) 기반 모바일 로봇 내비게이션과 드론 픽앤플레이스 활용 사례.

교수님 설명

세 번째 트렌드는 행동 트리(Behavior Tree)입니다. BT는 루트에서 tick이라는 신호가 주기적으로 내려가면서 트리를 훑고, 잎 노드에 닿으면 실제 행동을 실행하는 구조입니다. 전통적으로 로봇 제어에 쓰이던 유한상태기계(Finite State Machine)와 비교했을 때의 장점을 세 가지로 강조하셨습니다.

첫째 모듈성 — 만들어 둔 행동 블록을 재사용하기 쉽고, 둘째 가시성/가독성 — 복잡한 로직도 트리로 시각화되어 디버깅이 직관적이며, 셋째 반응성 — 예상치 못한 상황(실패)에 즉각 대응해 복구할 수 있다는 점입니다. 최근 2~3년 사이 BT가 FSM보다 우수하다는 연구가 늘고 있고, ROS의 NAV2 같은 실제 내비게이션 스택에도 표준처럼 들어가 있다고 설명하셨습니다.

보충 설명

FSM은 상태(state)와 상태 간 전이(transition)를 일일이 정의하는 방식이라, 상태가 늘어날수록 전이가 폭발적으로 많아지고 한 곳을 고치면 다른 전이가 줄줄이 깨지기 쉽습니다. 반면 BT는 "이 행동이 실패하면 자동으로 다음 대안을 시도"하는 식의 반응적 복구가 트리 구조 자체에 내장되어 있어, 새 행동을 끼워 넣어도 다른 부분에 영향이 적습니다. 이 모듈성·반응성 때문에 게임 AI에서 출발한 BT가 최근 로보틱스로 빠르게 넘어온 것입니다.

슬라이드 내용 정리

세 트렌드의 융합: Trend #1(LLM) + Trend #2(AI Planning) + Trend #3(BT)

제목: AI 플래닝과 LLM을 이용한 BT 합성 (BT Synthesis using AI Planning & LLM) — "아주 최근의 연구(A very recent work)"

도식의 흐름(프로그램 생성 루프): 자연어 → LLM → 태스크 형식화(Formalize) → 반응적 태스크 플래닝(Reactive task planning) → 행동 플래닝(Behavior planning) → 형식 검증(Formal verification) → 로봇 플래닝 → 로봇 프로그램(Robot program) 실행. 실행 중 실패(Failure)가 나면 Reasoning을 거쳐 새 전제조건(New preconditions)을 만들어 다시 계획에 반영하는 실패 해소(Failure resolution) 루프가 돈다. (출처: Styrud et al., ABB Robotics·KTH, ArXiv 2024)

교수님 설명

마지막은 앞의 세 가지 방법론을 결합하는 흐름입니다. 예전에는 LLM, AI 플래닝, 행동 트리가 각각 별개의 접근으로 다뤄졌는데, 최근에는 이 셋을 하나로 묶는 연구가 나오기 시작했습니다. 교수님은 2024년 ICRA 등에서 이런 통합 연구가 등장하기 시작했다고 짚으셨습니다.

이 슬라이드의 예시는 휴먼이 자연어로 지시하면 LLM이 이를 형식화하고, AI 플래닝으로 행동 순서를 짜서, 결과물을 행동 트리(BT) 형태의 로봇 프로그램으로 자동 생성·확장하는 시스템입니다. 핵심은 실행 도중 실패가 발생하면 그냥 멈추는 게 아니라, 다시 추론(reasoning)해서 부족했던 전제조건을 보충하고 트리를 스스로 확장하는 실패 해소 루프가 돈다는 점입니다. 결국 세 트렌드를 합치면 "사람이 고수준 미션만 던지면 로봇이 알아서 계획·실행·복구한다"는 미션 오토노미의 이상에 한 걸음 더 다가가게 됩니다.

Part 6슬라이드 25~30

06태스크 플래닝 방법론 (1)

슬라이드 내용 정리

멀티로봇 태스크 할당(Multi-Robot Task Allocation, MRTA) 장의 표지 슬라이드. 앞 섹션의 태스크 플래닝(미션을 세부 태스크로 분해)에 이어, 분해된 태스크를 "누가 맡을지" 정하는 단계로 넘어갑니다.

교수님 설명

고수준 미션을 받아 세부 태스크로 분해(Task Decomposition)했다면, 그 다음으로 풀어야 할 핵심 문제가 바로 태스크 할당입니다. 교수님 연구실의 주된 연구 주제 중 하나이고, 박사 연구도 이 영역(특히 연합 형성)에 걸쳐 있습니다.

이 부분은 단순한 강의용 설명이 아니라 교수님이 직접 리뷰 논문을 제출 직전까지 준비한 분야로, 이론적 깊이가 있는 주제임을 염두에 두고 들으면 좋습니다.

슬라이드 내용 정리

다수의 드론과 지도 위 목표 지점(태스크)을 그린 그림. 말풍선이 두 가지 질문을 던집니다.

어떤 태스크(들)에 ⇒ 태스크 할당(Task Allocation)
누구와 함께 ⇒ 연합 형성(Coalition Formation)

우상단 워크플로 다이어그램은 전체 흐름이 Task Planning → Task Allocation → Motion Planning 순으로 이어지고, 이 장이 가운데 Task Allocation / Coalition Formation 단계에 해당함을 보여줍니다.

교수님 설명

MRTA 문제는 본질적으로 두 질문으로 쪼갤 수 있습니다. 첫째, 한 로봇이 "어떤 태스크를 맡을 것인가"가 태스크 할당이고, 둘째, 하나의 태스크에 "어떤 로봇들을 한 팀으로 묶을 것인가"가 연합 형성입니다.

경로 최적화 관점에서 보면 이는 Traveling Salesman Problem(TSP)이나 Vehicle Routing Problem(VRP)과도 맞닿아 있습니다. 여러 로봇이 흩어진 여러 목표 지점을 효율적으로 나눠 맡는 문제이기 때문입니다.

보충 설명

태스크 할당과 연합 형성은 동전의 양면입니다. "로봇 입장에서 어떤 일을 맡을까(robot→task)"로 보면 할당이고, "일 입장에서 어떤 로봇 팀을 모을까(task→robots)"로 보면 연합 형성입니다. 한 태스크에 로봇 한 대로 충분하면 단순 할당이지만, 한 대로 못 하는 무거운 작업(예: 큰 물체 함께 들기, 넓은 구역 동시 정찰)은 여러 대를 묶는 연합 형성이 필요합니다.

슬라이드 내용 정리

MRTA의 형식적 분류 체계(Formal Taxonomy). 세 축으로 문제를 분류합니다.

로봇 유형 — ST: Single-Task(한 번에 한 태스크만) / MT: Multi-Task(동시에 여러 태스크)
태스크 유형 — SR: Single-Robot required(로봇 1대로 충분) / MR: Multi-Robot required(여러 대 필요)
할당 유형 — IA: Instantaneous Assignment(미래 할당 고려 안 함) / TA: Time-extended Assignment(순서까지 계획)

아래 두 그림은 ST-SR-TA(로봇마다 태스크 묶음을 어떻게 배정할까 ⇒ 태스크 할당)와 ST-MR-IA(태스크마다 로봇 팀을 어떻게 꾸릴까 ⇒ 연합 형성)를 대비합니다. 오른쪽 막대그래프는 유형별·연도별 논문 수를 보여줍니다. 출처: Gerkey & Matarić(IJRR 2004), Chakraa et al.(2023).

교수님 설명

이 분류 체계는 2004년 Gerkey와 Matarić가 제안한 것으로, MRTA 분야에서 거의 표준처럼 쓰입니다. 로봇·태스크·할당이라는 세 축의 조합(ST/MT × SR/MR × IA/TA)으로 문제의 난이도와 성격이 결정됩니다.

특히 주목할 두 케이스가 ST-SR-TA와 ST-MR-IA입니다. 전자는 로봇 한 대에 태스크 여러 개를 순서대로 배정하는 전형적 태스크 할당 문제이고, 후자는 한 태스크에 여러 로봇을 묶는 연합 형성 문제입니다. 두 문제는 수학적으로 서로 다른 구조를 가지므로 접근법도 달라집니다.

보충 설명

약어를 직관적으로 풀면 — ST/MT는 "로봇이 멀티태스킹이 되는가", SR/MR은 "일에 사람(로봇)이 몇 명 필요한가", IA/TA는 "지금 한 번만 배분하고 끝(IA)인가, 앞으로 할 일 순서까지 짜는가(TA)"입니다. 조합이 복잡해질수록(예: MT-MR-TA) 문제는 NP-hard가 되어 정확히 푸는 것이 사실상 불가능해지고, 근사·휴리스틱·게임이론적 접근이 필요해집니다.

슬라이드 내용 정리

MRTA의 문제 정식화(Problem Formulations). 기본 표기: 에이전트 집합 A = {1,…,n_a}, 태스크 집합 T = {1,…,n_t}.

세 가지 대표 정식화를 에이전트 수와 태스크 수의 관계로 구분합니다.

ST-SR-IA (n_a = n_t): maximize Σ_{i∈A} Σ_{j∈T} u_ij x_ij, 제약 Σ_{j∈T} x_ij ≤ 1(로봇당 태스크 1개), Σ_{i∈A} x_ij ≤ 1(태스크당 로봇 1대), x_ij ∈ {0,1}
ST-SR-TA (n_a < n_t): 위 제약에 더해 Σ x_ij ≤ min(n_a, n_t) 형태로 순서·개수 제약 추가
ST-MR-IA (n_a > n_t): 로봇당 태스크 1개 제약은 두되, 한 태스크에 여러 로봇 허용

출처: Choi et al.(IEEE T-RO 2009, Consensus-Based Decentralized Auctions), Jang et al.(IEEE T-RO 2018, Anonymous Hedonic Game).

교수님 설명

분류 체계를 실제로 풀려면 수학적 최적화 문제로 옮겨야 합니다. 핵심 변수는 x_ij로, "로봇 i가 태스크 j를 맡으면 1, 아니면 0"인 이진 변수입니다. 목적함수는 효용 u_ij의 합을 최대화하는 것이고, 제약식이 어떤 유형(IA/TA, SR/MR)인지를 결정합니다.

출처로 인용된 Choi et al.의 Consensus-Based Decentralized Auctions(경매 기반 분산 할당)와 Jang et al.의 Anonymous Hedonic Game(익명 헤도닉 게임)은 이 분야의 대표 분산형 알고리즘입니다. 특히 후자는 게임이론으로 대규모 시스템의 할당을 다루는데, 교수님 박사 연구의 연합 형성 작업과도 직접 연결됩니다.

보충 설명

제약식의 의미를 한 줄로 — Σ_{j} x_ij ≤ 1은 "로봇 하나는 동시에 한 태스크만"(ST 조건), Σ_{i} x_ij ≤ 1은 "태스크 하나에 로봇 한 대만"(SR 조건)입니다. SR 제약을 풀면(여러 로봇 허용) 곧바로 MR, 즉 연합 형성 문제가 됩니다. 슬라이드가 굳이 n_a와 n_t의 대소관계로 케이스를 나눈 이유는, 에이전트보다 태스크가 많으면(n_a < n_t) 한 로봇이 여러 태스크를 순서대로 처리해야 하므로 시간 확장(TA) 정식화가 자연스럽게 등장하기 때문입니다.

슬라이드 내용 정리

중앙집중에서 분산화로(From Centralisation to Decentralisation). 분산화가 필요한 두 가지 핵심 이유를 제시합니다.

정보(Information)가 분산되어야 함 ⇒ 로봇 간 통신(Inter-robot communication)이 중요해짐. (∵ 로컬 정보 + 통신 = 글로벌 정보) — 질문: 어떤 로컬 정보를 공유해야 하나? (낮은 대역폭, 프라이버시 등 고려)
의사결정(Decision-making)이 분산되어야 함 ⇒ 결정 불일치로 인해 로봇 간 충돌(Inter-robot conflicts)이 발생할 수 있음 — 질문: 각 로봇이 무엇을 로컬로 결정하고, 충돌은 어떻게 해소하나?

왼쪽은 중앙집중형 ⇒ "Operations Research(OR)", 오른쪽은 분산형 ⇒ "Robotics"로 대비됩니다.

교수님 설명

현재 상용 시스템(웨어하우스, 공항 수하물, 드론쇼 등)은 대부분 중앙집중형입니다. 하지만 중앙집중형은 Single Point of Failure 문제가 있어 중앙이 죽으면 전체가 마비됩니다. 그래서 분산화가 필요한데, 그 이유는 단지 안정성만이 아닙니다.

교수님이 강조한 실제 경험이 인상적입니다 — 원자력 시설처럼 두꺼운 콘크리트 벽이 있는 환경에서는 충분한 통신 대역폭을 확보하기 어렵습니다. 게다가 로봇 수가 늘어날수록(확장성), 여러 벤더가 협업할수록(프라이버시) 모든 정보를 한곳에 모으는 중앙집중 방식은 비현실적입니다. 핵심 통찰은 "로컬 정보 + 통신 = 글로벌 정보"로, 각 로봇이 자기 주변만 알고 이웃과 소통해도 전체를 푸는 것을 목표로 합니다.

보충 설명

슬라이드 좌우 대비가 핵심입니다. OR(운용과학)식 중앙집중 접근은 모든 정보를 모아 전역 최적해를 한 방에 계산합니다 — 깔끔하지만 단일 장애점에 취약하고 통신이 막히면 무너집니다. 로보틱스식 분산 접근은 각 로봇이 부분 정보만으로 스스로 결정하므로 강건하지만, 서로 다른 로봇이 같은 태스크를 동시에 집으려 하는 등 충돌(conflict)이 생깁니다. 그래서 분산형의 진짜 난제는 "어떻게 충돌을 해소하고 합의에 도달하느냐"가 됩니다.

슬라이드 내용 정리

분산형 MRTA 아키텍처 개요. 핵심은 2단계 파이프라인(2-Layer Pipeline)입니다.

Phase 1 — 로컬 의사결정(Local decision-making): 각 로봇이 자기 정보로 결정
Phase 2 — 충돌 해소(Conflict resolution) 또는 정보 공유: 이웃과 결과를 비교·조정

두 단계를 수렴할 때까지 반복(iterative)합니다. 핵심 질문: 수렴하는가? 얼마나 빨리? (중앙집중 알고리즘 대비) 최적인가?

통신 가정: 비동기(Asynchronous)이지만 시간이 지나면 강연결(Strongly-connected over time). 다만 많은 문헌은 분석 편의상 동기화된 설정을 가정합니다.

교수님 설명

분산형 태스크 할당 알고리즘의 기본 패턴이 이 슬라이드에 압축돼 있습니다. 로컬 의사결정 → 충돌 해소 → 반복이라는 루프입니다. 각 로봇이 로컬 정보로 일단 결정을 내리고, 이웃과 정보를 주고받아 충돌(같은 태스크를 두 로봇이 맡으려는 등)을 해소한 뒤, 전체가 합의에 수렴할 때까지 이 과정을 되풀이합니다.

여기서 교수님이 강조하는 것은 이론적 수렴 증명의 중요성입니다. 단지 "동작하더라"가 아니라, 반드시 수렴하는지·얼마나 빨리 수렴하는지·중앙집중 최적해와 얼마나 가까운지를 수학적으로 보장해야 합니다. 박사 연구에서는 게임이론(Nash Equilibrium)과 Star-shaped 볼록 함수로 만든 유틸리티 함수를 써서 이 수렴성을 증명했고, 에이전트나 태스크가 추가·제거될 때의 재수렴 시간까지 분석했습니다.

보충 설명

통신 가정의 의미가 중요합니다. 비동기(Asynchronous)는 로봇들이 동시에 같은 박자로 통신하지 않아도 된다는 뜻이고, 시간 평균 강연결(Strongly-connected over time)은 "어느 한 순간엔 끊겨 있어도, 충분한 시간 동안 보면 모든 로봇이 결국 서로 정보를 전달할 수 있다"는 완화된 조건입니다. 현실에서는 통신이 끊겼다 이어졌다 하므로 이 가정이 합리적이지만, 수렴 증명이 어려워집니다. 그래서 많은 논문이 분석을 쉽게 하려고 "모두가 매 라운드 동시에 통신한다"는 동기 설정으로 단순화한다 — 는 것이 이 슬라이드의 솔직한 단서입니다.

Part 7슬라이드 31~31

07태스크 플래닝 방법론 (2)

슬라이드 내용 정리

제목은 멀티로봇 태스크 할당(Multi-Robot Task Allocation) — 특히 ST-MR-IA 유형을 위해 제안한 헤도닉 게임(Hedonic Game) 기반 알고리즘 GRAPE입니다. ST-MR-IA는 MRTA 분류 체계의 한 부류로, 로봇 하나가 한 번에 한 태스크만 맡고(Single-Task), 하나의 태스크는 여러 로봇을 필요로 하며(Multi-Robot), 할당이 즉각적으로 이뤄지는(Instantaneous Assignment) 상황을 뜻합니다.

다루는 문제(Problem)는 멀티로봇 팀 클러스터링 — 어떤 로봇을 어떤 팀(연합)에 묶을지 결정하는 것입니다. 핵심 아이디어(Key Idea)는 각 로봇을 헤도닉 게임 속 이기적인 플레이어(selfish player)로 모델링하는 것입니다.

주요 결과(Main Results): ① 다항시간 수렴 증명 ⇒ O(#robots²), ② 차선해 하한(suboptimality lower bound) 증명 ⇒ 특수한 경우 50% 보장, ③ 분산·비동기(decentralised and asynchronous) 다수 에이전트가 임의의 연결망(any connected networks)에서 실행 가능. 하단의 세 그림은 반복(iteration)이 진행되며 로봇 군집이 두 태스크로 수렴해 가는 모습을 보여줍니다. 출처는 Jang et al., IEEE T-RO 2018.

교수님 설명

이 슬라이드는 교수님의 박사 연구(Coalition Formation, 연합 형성) 결과물입니다. 대본에서 설명한 분산형 태스크 할당 알고리즘의 기본 패턴 — 로컬 의사결정(Local Decision Making) → 충돌 해결(Conflict Resolution) → 반복 — 이 바로 이 GRAPE에 구현되어 있습니다. 각 로봇이 자기 로컬 정보만으로 "어느 팀에 들어가는 게 내게 이득인가"를 판단하고, 이웃과 정보를 공유해 충돌을 해소하며, 더 이상 옮길 이유가 없는 안정 상태로 수렴하게 만드는 구조입니다.

교수님이 강조하신 핵심은 이론적 수렴 증명입니다. 로봇을 이기적 플레이어로 두면 게임 이론을 끌어올 수 있고, 이를 통해 알고리즘이 반드시 멈춘다는 것(다항시간 수렴)과 최적해 대비 성능이 얼마나 보장되는지(차선해 하한)를 수학적으로 증명할 수 있습니다. 대본에서 언급한 유틸리티 함수 설계(Star-shaped 볼록 함수)와 내시 균형(Nash Equilibrium) 활용이 바로 이 증명의 도구입니다.

또 하나의 강조점은 분산성입니다. 앞 섹션에서 다룬 분산화의 필요성(통신 제약, Single Point of Failure 방지, 확장성)과 직결되는데, GRAPE는 중앙 관제 없이 비동기로, 연결만 되어 있으면 어떤 통신망에서도 동작하므로 로봇 수가 늘어도 견딜 수 있습니다. 교수님은 에이전트나 태스크가 도중에 추가·제거될 때 얼마나 빨리 다시 수렴하는지(재수렴 시간)까지 분석했다고 하셨습니다.

보충 설명

헤도닉 게임은 "연합 형성 게임"의 한 종류로, 각 플레이어가 어떤 결과물이 아니라 자기가 속한 그룹(연합) 자체에 대한 선호를 갖는 모델입니다. 사람들이 동아리를 고를 때 "누구와 함께하느냐"로 만족도가 결정되는 것과 같습니다. 로봇 각자가 "이 팀에 있으면 내 효용이 가장 크다"를 따라 움직이다 보면, 아무도 더 옮기고 싶지 않은 내시 안정 분할(Nash-stable partition)에 도달합니다 — 이것이 슬라이드 하단 그림에서 군집이 두 태스크로 깔끔히 갈라지며 수렴하는 과정입니다.

O(#robots²)는 로봇 수가 두 배가 되면 계산량은 약 네 배로 늘어난다는 뜻으로, 수천~수만 대 규모(대본의 드론쇼·스웜)에서도 현실적으로 돌릴 수 있을 만큼 효율적이라는 것을 보장합니다. "50% 하한"은 최악의 경우에도 최적해 가치의 절반은 보장한다는 의미로, 분산 알고리즘이 빠른 대신 품질이 무너지지 않는다는 안전판 역할을 합니다.

Part 8슬라이드 32~37

08구현 프레임워크와 시뮬레이션 검증 (1)

슬라이드 내용 정리

교수님 박사 연구의 핵심인 GRAPE(Hedonic Game 기반 알고리즘)를 소개합니다. 대상 문제는 ST-MR-IA(Single-Task robot, Multi-Robot task, Instantaneous Assignment), 즉 한 로봇이 한 작업만 맡되 한 작업에는 여러 로봇이 모일 수 있는 연합 형성(Coalition Formation) 상황입니다.

왼쪽 중앙형(Centralised) 방식은 라운드를 돌며 할당을 하나씩 갱신합니다. 예: (A,-,-) → (A,B,-) → (A,B,B) → (A,A,B). 이 과정은 SPAO(Selfish but Public-good Aware Objective) 조건으로 수렴이 보장되며, 효용 함수는 u_i,equal = (1/|S_j|)·V_j − c_i(t_j) 입니다. 다만 공유 메모리에 대한 Mutex(상호 배제)가 필요합니다.

오른쪽 분산형(Decentralised) 방식은 두 단계로 동작합니다. Phase 1: 지역적 의사결정(Local decision-making)에서 각 에이전트가 ① 자기 효용이 가장 높은 연합을 단독으로 고르고(Unilateral decision-making), Phase 2: 충돌 해결(Conflict resolution)에서 분산 Mutex 서브루틴으로 ② 가장 최신으로 갱신된 할당을 채택해 이웃과 동기화합니다. 출처는 Jang et al., IEEE T-RO 2018.

교수님 설명

분산형 알고리즘의 기본 패턴은 지역 결정 → 충돌 해결 → 반복입니다. 각 로봇이 자기가 가진 로컬 정보만으로 어느 작업에 갈지 결정하고, 이웃과 정보를 주고받아 충돌을 풀고, 수렴할 때까지 이 과정을 되풀이합니다. 중앙이 없어도 돌아가야 하므로 통신 제약·확장성·Single Point of Failure 문제를 모두 피할 수 있습니다.

여기서 가장 중요한 것은 이론적 수렴 증명입니다. 단순히 "잘 되더라"가 아니라, 게임 이론의 내쉬 균형(Nash Equilibrium)·내쉬 안정 분할(Nash-stable partition) 개념으로 반드시 수렴함을 증명해야 신뢰할 수 있는 시스템이 됩니다. GRAPE는 효용 함수를 Star-shaped 볼록 함수 형태로 설계해, 각자 이기적으로 행동해도 전체가 안정 상태로 수렴하도록 만든 것이 핵심 기여입니다.

보충 설명

Hedonic Game은 "각 플레이어가 자신이 속한 그룹(연합) 자체에서 만족도를 얻는" 협력 게임 모형입니다. 로봇 입장에선 "어느 팀에 들어가야 내가 제일 이득인가"를 따지는 것이고, 모두가 더 이상 팀을 바꿀 이유가 없는 상태가 곧 안정 분할입니다. 효용 식의 (1/|S_j|)·V_j는 작업 가치 V_j를 그 작업에 모인 로봇 수 |S_j|로 나눈 몫(혼잡할수록 1인당 보상 감소), c_i(t_j)는 그 작업까지 가는 비용을 뜻합니다. 즉 "너무 많이 몰리면 보상이 줄어 자연스럽게 분산된다"는 직관이 식에 담겨 있습니다.

슬라이드 내용 정리

GRAPE의 성능 검증 결과입니다. 기본 설정은 에이전트 160대·작업 20개, 대규모 실험은 에이전트 400대 규모(# Agents = 400, # tasks = 10×2×2)입니다.

가운데 수렴 속도(Convergence Speed) 그래프: 필요 반복 횟수(time steps)를 에이전트 수·작업 수에 따라 측정했고, post-test reward와 submodular reward 두 보상 설정을 비교합니다. 오른쪽 적응성 테스트(Adaptiveness Test): 에이전트나 작업이 새로 들어오거나(New agents/tasks) 빠졌을 때(Lost agents/tasks) 재수렴에 필요한 추가 반복 횟수를 분석합니다.

결론: 반복 횟수는 대략 에이전트 수의 4~5배 수준이며, 특히 로봇이 빠지거나 새 작업이 추가되는 상황에 빠르게 적응(Agile)합니다 — 실제 운용 환경에 적합하다는 의미입니다.

교수님 설명

박사 연구에서 중요하게 본 지표 중 하나가 재수렴 시간입니다. 멀티로봇은 운용 중에 로봇이 고장 나 빠지거나, 새 임무가 추가되는 일이 늘 일어납니다. 그럴 때마다 처음부터 다시 계산하면 비효율적이죠. GRAPE는 변화가 생긴 부분 위주로 빠르게 다시 안정 상태에 도달하기 때문에 현장에서 쓸 만합니다.

그래프가 보여주듯 반복 횟수가 에이전트 수에 대략 선형(4~5배)으로 증가한다는 것은 확장성(Scalability)이 좋다는 뜻입니다. 수백 대 규모에서도 폭발적으로 느려지지 않으니 대규모 군집에 적용할 수 있습니다.

슬라이드 내용 정리

실제 로봇 응용(Real-Robot Application) 사례입니다. GRAPE로 로봇 팀을 군집화(Clustering)한 뒤 대형 제어(Formation control)로 호위(Escort) 임무를 수행합니다.

오른쪽은 사용한 로봇 플랫폼 MONA의 구조도(모듈 프로세서, Wi-Fi, IR 수신부, 모바일 플랫폼, 모터 드라이버, 급속충전 커넥터 등)입니다. 아래는 야외 필드 호위 시뮬레이션과 실험실에서 다수의 MONA 로봇으로 진행한 실제 실험 사진입니다. 출처: J.Hu et al., IEEE T-RO 2021.

교수님 설명

이 실험은 맨체스터 대학 박사후연구원 시절의 작업으로, 알고리즘이 시뮬레이션을 넘어 실제 로봇에서도 동작함을 보인 사례입니다. GRAPE로 "어느 로봇들이 한 팀을 이룰지"를 정하고, 그 팀이 대형을 유지하며 목표 대상을 둘러싸 호위하도록 했습니다.

MONA는 저가·소형 교육/연구용 플랫폼으로, 여러 대를 동시에 굴리며 분산 알고리즘을 검증하기에 적합합니다. 이런 저비용 다수 로봇 테스트베드 경험이 이후 Crazyflie·Mona 기반 멀티로봇 테스트베드 구축으로 이어집니다.

슬라이드 내용 정리

GRAPE를 전혀 다른 도메인으로 확장한 사례 — 전기차 충전소(EV Charging Station) 배치 문제입니다.

문제(Problem): 충전소를 어디에 둘 것인가? 단순 거리만이 아니라 개인 선호(individual preference)를 고려해야 합니다(명소와 가까운가? 혼잡한가? 얼마나 멀리 가야 하나?). 핵심 아이디어(Key Idea): 군집화 과정에서 기존의 보로노이(Voronoi) 분할 대신 GRAPE를 사용합니다. 아래 두 그림은 K-means 군집화와 제안 기법의 클러스터(r1, r2, r3) 결과를 비교합니다. 출처: S.Bae et al., IEEE T-ITS, 2022.

교수님 설명

멀티로봇 태스크 할당과 전기차 충전소 배치는 겉보기엔 전혀 다른 문제 같지만, 수학적 구조는 같습니다. "여러 수요(사용자/로봇)를 한정된 자원(충전소/작업)에 어떻게 배분할 것인가"라는 점에서 동일한 할당·군집 문제이기 때문이죠.

기존 K-means나 보로노이 방식은 단순히 가까운 곳으로 묶기 때문에 한쪽에 수요가 몰리는 불균형이 생깁니다. GRAPE는 효용 함수에 혼잡도와 개인 선호를 반영하므로, 사용자가 균형 있게 분산되도록 충전소를 배치할 수 있습니다.

슬라이드 내용 정리

앞 충전소 배치 기법의 실제 검증입니다. 스웨덴의 한 도시에 충전소 위치를 결정하는 실험으로, K-means + 보로노이 방식과 제안 기법(Proposed)의 산점도를 비교합니다. 스웨덴 Chalmers 공대 및 Volvo와의 공동 연구입니다.

주요 결과(Main Result): 제안 기법이 더 균형 잡힌(balanced) 결과를 냅니다 — (1) 충전소별 사용자 수가 고르게(표준화된 EVCS 용량), (2) 사용자 만족도가 고르게(표준화된 서비스). 아래 박스플롯이 충전소당 EV 수와 사용자별 효용의 분산이 줄어듦을 보여줍니다.

교수님 설명

핵심 성과는 "평균"이 아니라 "분포의 균형"입니다. 박스플롯에서 보듯, 제안 기법은 충전소마다 몰리는 사용자 수의 편차와 사용자별 만족도 편차를 모두 줄였습니다. 일부 충전소만 붐비고 일부는 텅 비는 현상을 완화한 것이죠.

Volvo·Chalmers 같은 산업·학계 파트너와 실제 도시 데이터로 검증했다는 점에서, 군집·할당 알고리즘이 로봇을 넘어 도시 인프라 설계에도 실용적으로 쓰일 수 있음을 보여주는 사례입니다.

슬라이드 내용 정리

GRAPE를 자원 균형(Resource Balancing) MRTA로 확장한 최신 연구입니다(KAIST FAIR 연구실과 공동).

동기(Motivation): 장기 자율운용(Long-term autonomy). 그림 (a)/(b)처럼 작업마다 수요(high/low demand)가 다르고 로봇의 배터리 잔량도 제각각인 상황을 다룹니다. 핵심 아이디어: 자원 인식 효용(Resource-aware utility). 세 가지 식을 비교합니다 — 기존(Existing): u_i,equal = (1/|S_j|)·V_j − c_i(t_j), 초기 안(Initial Idea): u_i,P-RA = (e_i / Σ_{i'∈S_j} e_{i'})·V_j − c_i(t_j), 제안(Proposed): u_i,S-RA = (e_i / (ê²_{S∪i}·|S_j|))·V_j − c_i(t_j). 여기서 e_i는 로봇 i의 자원(배터리) 수준입니다. 주요 결과: 더 균형 잡힌 할당.

교수님 설명

현재 진행 중인 연구 중 하나로, KAIST(오현우 교수님 연구실과 공동)와 작성 중인 논문입니다. 기존 GRAPE 효용 함수는 모든 로봇을 똑같이 취급했지만, 실제로는 배터리가 거의 없는 로봇과 가득 찬 로봇을 동일하게 배치하면 안 됩니다. 장기간 운용하려면 자원(배터리) 잔량을 효용에 반영해야 합니다.

그래서 효용 식의 분자에 로봇의 자원 e_i를, 분모에 연합 전체 자원의 정규화 항을 넣어, 자원이 많은 로봇이 더 부담을 지고 자원이 부족한 로봇은 보존되도록 설계했습니다. 이렇게 하면 특정 로봇만 빨리 방전되는 일을 막고 전체 군집의 가동 시간을 늘릴 수 있어, 화재 진압처럼 오래 지속되는 임무에 적합합니다.

Part 9슬라이드 38~38

09구현 프레임워크와 시뮬레이션 검증 (2)

슬라이드 38 · 분산형 MRTA 서베이 — PRISMA 문헌 선별과 방법론 분류

슬라이드 내용 정리

제목은 Survey on Decentralised MRTA(분산형 멀티로봇 태스크 할당, Decentralised Multi-Robot Task Allocation)로, 교수님이 제출 직전인 리뷰 논문의 핵심 그림 두 장을 보여줍니다.

왼쪽 (Fig. 2): PRISMA 기반 문헌 선별 과정입니다. 검색 기준은 2005~2025년, 영어, 저널 논문이고, 검색식은 "decentralis*" AND ("multi-agent" OR "multi-robot" OR "swarm" …) AND ("task allocation" OR "coalition formation" OR "coverage" …) 형태입니다. Records identified(초기 검색 결과)에서 제목·초록 스크리닝 → 적격성 평가 → 다른 출처(인용 추적) 보강을 거쳐 최종 Total studies included로 좁혀가는 깔때기형 흐름을 보여줍니다.

오른쪽: 수집한 논문들을 2차원으로 분류한 지도입니다. 가로축은 결합 시점 — Pre-Decoupled(사전 분리), Pre-Coupled(사전 결합), Conflict Resolution(충돌 해결) — 이고, 세로축은 Agent-level Decision으로 Local Problem Solving(로컬 문제 해결) ↔ Global Problem Solving(전역 문제 해결)을 구분합니다. 그 안에 핵심 방법론군인 Auction(경매), Game Theory(게임 이론), Reinforcement Learning(강화학습), Distributed Optimisation / Message Passing(분산 최적화·메시지 전달)가 배치되어, 각 알고리즘이 어떤 성격인지(수렴 보장 여부, 동적 과정 포함 여부 등) 한눈에 비교됩니다.

교수님 설명

이 슬라이드는 교수님 연구실에서 제출 직전인 멀티로봇 태스크 할당 리뷰 논문의 결과물입니다. 분산형(Decentralized) 태스크 할당 분야에서 지난 20년간의 논문을 체계적으로 수집·분류한 것으로, 단순히 나열하는 서베이가 아니라 어떤 알고리즘이 어떤 구조적 특성을 갖는지를 좌표 위에 정리했다는 점이 핵심입니다.

교수님이 강조한 분산형 알고리즘의 기본 패턴이 이 그림에 그대로 반영되어 있습니다. 즉 각 로봇이 로컬 정보만으로 결정을 내리고(Local Decision Making), 이웃과 정보를 공유해 충돌을 해소하며(Conflict Resolution), 수렴할 때까지 이 과정을 반복하는 구조입니다. 가로축의 Conflict Resolution 열과 세로축의 Local ↔ Global 구분이 바로 이 패턴을 분류 기준으로 삼은 것입니다.

방법론군을 보면, 교수님의 박사 연구 주제였던 게임 이론(Game Theory) 기반 연합 형성(Coalition Formation)이 한 축을 차지합니다. 분산형에서는 이론적 수렴 증명이 매우 중요하기 때문에, Nash 균형(Nash Equilibrium) 같은 게임 이론 도구나 분산 최적화의 수렴성 보장 여부가 분류의 핵심 잣대가 됩니다. 최근 부상한 강화학습(RL)과 전통적인 경매(Auction) 방식까지 한 그림에 모아, 각 접근의 장단점과 적용 맥락을 대비시킨 것입니다.

보충 설명

PRISMA는 원래 의학 분야에서 체계적 문헌고찰(Systematic Review)의 투명성을 위해 만든 표준 절차로, "몇 편을 찾아 몇 편을 어떤 이유로 제외하고 최종 몇 편을 분석했는가"를 깔때기 다이어그램으로 명시합니다. 공학 리뷰 논문에서도 신뢰도를 높이기 위해 이 형식을 차용하는 경우가 늘고 있습니다.

가로축의 Pre-Decoupled vs Pre-Coupled는 태스크 할당에서 "로봇 간 의존성을 언제 끊느냐"를 뜻합니다. Decoupled는 각 로봇 문제를 미리 분리해 따로 푸는 방식(빠르지만 최적성 손해), Coupled는 로봇들의 상호작용을 함께 고려해 푸는 방식(품질 높지만 통신·연산 부담 큼)입니다. 분산 시스템에서는 이 둘 사이의 트레이드오프를 어떻게 다루느냐가 알고리즘 설계의 핵심이며, 이 좌표지도는 그 선택지를 한눈에 보여주는 셈입니다.

Part 10슬라이드 39~43

10태스크 할당과 연합 형성

슬라이드 내용 정리

제목: "알고리즘 복잡도의 트레이드오프(A trade-off in algorithmic complexity)" — 분산 MRTA(Decentralized Multi-Robot Task Allocation) 서베이에서 얻은 통찰 중 하나입니다.

핵심 축은 로컬 연산량(Local computation) 대 통신 라운드 수(Communication rounds)입니다. 표 V(Table V)는 여러 선행 연구를 문제 유형(ST-SR-TA, ST-MR-IA 등)별로 정리하고, 각 알고리즘의 로컬 연산 복잡도와 반복(Iteration) 복잡도를 빅오 표기로 나열합니다. 예를 들어 로컬 연산은 O(n_t · L_t²), O(n_t² ) 같은 항으로, 반복 횟수는 O(min{n_a, L_t, n_t}·d_G) 처럼 에이전트 수 n_a·태스크 수 n_t·그래프 지름 d_G의 함수로 표현됩니다.

그림 8(Fig. 8)은 가로축을 라운드 수, 세로축을 라운드당 로컬 연산량으로 둔 산점도로, 여러 알고리즘(CBBA, GRAPE 등)을 배치하고 점선 Front Line(파레토 경계)과 Future Work 영역을 표시해 "어느 한쪽을 줄이면 다른 쪽이 늘어난다"는 본질적 상충을 시각화합니다.

교수님 설명

분산형 태스크 할당 알고리즘은 거의 예외 없이 같은 골격을 따릅니다. 각 로봇이 자기가 가진 로컬 정보만으로 일단 결정을 내리고(Local Decision Making), 이웃과 정보를 주고받아 서로 어긋난 부분을 맞추고(Conflict Resolution), 이 과정을 합의에 도달할 때까지 반복하는 구조입니다. 교수님은 이 반복이 "언제 멈추는가", 즉 수렴(convergence)이 보장되는지가 분산 알고리즘 설계의 핵심이라고 강조하셨습니다. 그래서 단순히 잘 도는 것처럼 보이는 게 아니라, 내쉬 균형(Nash Equilibrium) 같은 게임 이론 도구로 수렴성을 수학적으로 증명하는 것이 중요하다고 하셨습니다.

이 슬라이드가 전하는 메시지는, 분산 MRTA 연구 전체를 한 장에 펼쳐 놓고 보면 결국 연산-통신 트레이드오프라는 하나의 지형 위에 모든 알고리즘이 놓인다는 점입니다. 통신 라운드를 줄이려면 각 라운드에서 더 무거운 계산을 해야 하고, 계산을 가볍게 하면 합의까지 더 많은 라운드가 필요합니다. 교수님의 박사 연구였던 연합 형성(Coalition Formation)은 별 모양 볼록 함수(Star-shaped convex function)로 유틸리티 함수를 설계하고 게임 이론으로 수렴을 증명한 사례이며, 에이전트나 태스크가 추가·제거될 때 다시 합의에 도달하는 재수렴 시간까지 분석했다고 소개하셨습니다.

응용 쪽으로는 두 가지를 언급하셨습니다. 하나는 전기차 충전소 배치 최적화로, 단순 K-Means보다 더 균형 잡힌 배치를 얻었다는 것이고, 다른 하나는 KAIST 오현우 교수님 연구실과 진행 중인 배터리 잔량을 고려한 태스크 할당으로, 장기간 운영에 적합한 할당을 목표로 한다고 하셨습니다.

보충 설명

표기를 직관적으로 풀면, ST-SR / ST-MR / SR-MR은 태스크·로봇의 다중성을 나타내는 분류입니다. ST=Single-Task(로봇 한 대가 한 번에 태스크 하나), MR=Multi-Robot(태스크 하나에 여러 로봇 필요), IA/TA는 즉시(Instantaneous) 할당이냐 시간 확장(Time-extended) 할당이냐를 구분합니다. 그래프 지름 d_G가 반복 복잡도에 들어가는 이유는, 분산 시스템에서 정보가 가장 먼 두 로봇 사이를 전달되려면 최소한 그 거리만큼의 통신 라운드가 필요하기 때문입니다 — 즉 네트워크가 넓고 듬성듬성할수록 합의가 느려집니다. 파레토 경계(Front Line)는 "더 이상 한쪽을 공짜로 개선할 수 없는 한계선"으로, 그 너머의 빈 공간이 곧 앞으로 연구가 파고들 여지(Future Work)입니다.

슬라이드 내용 정리

섹션 표지 슬라이드로, "Research Tools(연구 도구)"라는 제목만 적혀 있습니다. 앞선 이론·알고리즘 논의에서 실제 연구실에서 만든 도구 소개로 넘어가는 전환점입니다.

교수님 설명

여기서부터 교수님은 연구실에서 직접 개발한 연구 도구들을 소개하는 흐름으로 넘어갑니다. 대본에 따르면 크게 세 가지인데, PyGame 기반 벤치마크 툴(멀티로봇 태스크 할당 시나리오 테스트용), PyBT-ROS(Python 기반 Behavior Tree ROS 패키지), 그리고 Crazyflie 기반 멀티로봇 테스트베드입니다.

이 도구들의 공통된 동기는 "이론과 실험 사이의 간극을 줄이는 것"입니다. 분산 알고리즘은 수식으로 수렴을 증명해도, 실제로 여러 로봇에서 돌려보지 않으면 통신 지연·충돌 같은 현실 문제를 알 수 없습니다. 그래서 교수님은 진입 장벽이 낮고 빠르게 실험을 반복할 수 있는 자체 도구를 만들어 연구와 교육 양쪽에 활용한다고 하셨습니다.

슬라이드 내용 정리

제목: Research Tool #1 — SPACE (Swarm Planning-And-Control Evaluation), PyGame 기반 시뮬레이터입니다.

특징: 군집 로보틱스(swarm robotics)의 분산 의사결정 연구를 돕기 위해 설계되었고, 오픈소스로 공개되어 있습니다. 문서는 space-simulator.rtfd.io, 코드는 github.com/inmo-jang/space-simulator에서 받을 수 있습니다.

화면 예시 두 개가 나란히 제시됩니다. 왼쪽은 CBBA 알고리즘으로 1 RG(빨강·초록) 환경에서 에이전트 30대·태스크 200개를 다룬 장면, 오른쪽은 GRAPE 알고리즘으로 에이전트 500대·태스크 10개를 다룬 대규모 장면입니다. 하단 출처: Jang, "SPACE: A Python-based Simulator for Evaluating Decentralized Multi-Robot Task Allocation Algorithms", arXiv, 2024.

교수님 설명

SPACE는 멀티로봇 태스크 할당 시나리오를 손쉽게 시험하기 위한 PyGame 기반 벤치마크 도구입니다. 두 시연 화면이 보여주듯, 같은 플랫폼 위에서 CBBA(소수 에이전트·다수 태스크)와 GRAPE(대규모 에이전트·소수 태스크)처럼 성격이 전혀 다른 알고리즘을 동일 조건에서 비교할 수 있다는 점이 핵심입니다. 즉, 서로 다른 연구가 제각각의 환경에서 낸 결과를 한 무대 위로 끌어와 공정하게 견줄 수 있게 한 것입니다.

교수님은 이 도구를 오픈소스로 공개해 다른 연구자도 자기 알고리즘을 끼워 넣어 검증할 수 있게 했다고 하셨습니다. 다음 슬라이드에서 이어지듯, SPACE의 강점은 "고충실도 시뮬레이터로 넘어가기 전에 빠르게 이론 모델을 찍어볼 수 있는 가벼운 실험대"라는 위치 설정에 있습니다.

슬라이드 내용 정리

같은 SPACE 도구의 설계 철학을 정리한 슬라이드입니다. 두 가지 가치를 내세웁니다. (1) 사용 편의성(Ease of Use)과 빠른 반복(Fast Iteration) — 초기 단계 연구에 적합하며, Python만으로 구동되고 에이전트 간 통신을 내부적으로 알아서 처리합니다(⇒ 의사코드만 구현해서 바로 테스트). (2) 이론과 실제의 가교(Bridging Theory and Practice) — 고충실도 시뮬레이터로 넘어가기 전, 이론 모델을 시험할 "필수 중간 공간"을 제공합니다.

가로축 충실도(Fidelity), 세로축 사용 편의성(Ease of Use)으로 도구들을 배치한 그래프가 있습니다. 좌상단(쉽지만 단순)에는 SwarmLab·Stage, 우하단(어렵지만 사실적)에는 Webots·Gazebo·CoppeliaSim, 그 사이 중간에 ARGoS가 있고, SPACE는 좌상단의 "Design Focus" 영역에 위치합니다.

교수님 설명

이 슬라이드의 메시지는 시뮬레이터에는 "사용 편의성 ↔ 충실도"라는 또 하나의 트레이드오프가 있다는 것입니다. Gazebo·Webots처럼 물리를 정교하게 모사하는 도구는 결과가 현실에 가깝지만 셋업과 실험이 무겁고, Stage 같은 가벼운 도구는 다루기 쉽지만 단순합니다. SPACE는 의도적으로 편의성 쪽에 무게를 둔 설계(Design Focus)를 택해, 연구 극초기에 아이디어를 빠르게 검증하는 데 특화했습니다.

특히 교수님이 강조한 부분은 "의사코드만 구현하면 바로 돌려볼 수 있다"는 점입니다. 분산 알고리즘에서 가장 손이 많이 가는 에이전트 간 통신 처리를 SPACE가 내부에서 대신 처리해 주므로, 연구자는 알고리즘의 핵심 로직에만 집중할 수 있습니다. 그래서 SPACE는 그 자체가 최종 검증 도구라기보다, 이론에서 고충실도 실험으로 건너가는 길목의 '필수 중간 다리'로 자리매김합니다.

슬라이드 내용 정리

제목: "모듈성(Modularity)과 BT를 통한 시나리오 적응성". 사용자 정의 분산 의사결정 알고리즘을 Python 플러그인 형태로 끼워 넣을 수 있다는 점이 핵심입니다.

아키텍처 다이어그램은 크게 세 블록입니다. ① Agent — 내부에 BT(Behavior Tree)와 교체 가능한 DM Plug-in(의사결정 모듈), Agent Dynamics가 있고, 하단에 여러 AgentN과 TaskN이 로컬 통신(Local Communication)·로컬 상황 인지(Local Situation Awareness)·전역 통신(Global Communication)으로 연결됩니다. ② Simulation Tools — Configuration Loader, Visualization(pygame), Evaluation, Scenario Generator. ③ User Config(.yaml/.xml)와 Results(.csv/.png/.gif).

하단 박스 "Behavior Tree(BT)란?": 로봇의 행동 방식을 정의하는 수학적 모델이며, Finite State Machine보다 유리하다고 알려져 있고, 로보틱스에서 점점 인기를 얻고 있음(예: ROS2의 navigation 2 스택). 우하단에 NAV2 로고.

교수님 설명

이 슬라이드는 SPACE의 모듈성을 강조합니다. 의사결정 알고리즘을 DM Plug-in이라는 교체 가능한 부품으로 분리해 두었기 때문에, 연구자는 시뮬레이터 전체를 건드리지 않고 자기 알고리즘만 Python 플러그인으로 갈아 끼워 다양한 시나리오에 적용할 수 있습니다. 시나리오 생성·시각화·평가가 모두 갖춰져 있어, .yaml/.xml로 설정을 주면 .csv·.gif 같은 결과물이 자동으로 나옵니다.

아래쪽에서 교수님은 Behavior Tree(BT)를 짚으십니다. BT는 로봇이 어떻게 행동할지를 정의하는 형식 모델인데, 전통적으로 쓰던 유한 상태 기계(Finite State Machine)보다 여러 면에서 낫다고 알려져 있습니다. 대본에서 정리한 BT의 장점은 세 가지였습니다 — 모듈을 재사용하기 쉬운 모듈성(Modularity), 복잡한 로직도 시각적으로 디버깅할 수 있는 가시성(Visibility), 예상치 못한 상황에 즉각 반응하는 반응성(Reactivity). 그래서 최근 2~3년 사이 "BT가 FSM보다 우수하다"는 연구가 늘고 있고, ROS2의 내비게이션 스택인 NAV2도 BT를 채택하고 있다고 소개하셨습니다.

이 BT 흐름은 교수님 연구실의 다른 도구 PyBT-ROS로 이어집니다. 기존 BehaviorTree.CPP가 C++ 기반이라 진입 장벽이 높았던 데 비해, Python 기반인 PyBT-ROS는 디버깅이 쉽고 학부 2학년 수업에서도 학생들이 화재 감지 로봇·기상 알람 로봇 같은 자유 주제를 직접 구현할 수 있을 만큼 접근성이 좋다고 하셨습니다.

보충 설명

FSM vs BT를 직관적으로 비교하면, 유한 상태 기계는 "상태 A에서 조건이 맞으면 상태 B로 간다"는 화살표(전이)를 일일이 그려야 합니다. 상태가 늘어나면 전이 화살표가 폭발적으로 늘어 거미줄처럼 엉키죠. BT는 대신 "탐색해라 → 실패하면 복귀해라"처럼 행동을 트리(나무) 구조로 쌓아, 매 순간 루트에서부터 트리를 훑어 내려가며 지금 할 일을 고릅니다. 덕분에 새 행동을 가지 하나로 붙이기만 하면 되고(모듈성), 어디서 막혔는지 트리를 보면 바로 보이며(가시성), 매 틱마다 트리를 다시 평가하므로 갑자기 적기가 나타나는 상황에도 즉시 분기를 바꿔 대응할 수 있습니다(반응성). 이 점이 미션 수준 자율성(Mission Autonomy)에서 BT가 각광받는 이유입니다.

Part 11슬라이드 44~48

11연구 도구 개발과 진행 중인 연구

슬라이드 44 · 연구 도구 #1: PyGame 시뮬레이터와 BT 적응성

슬라이드 46 · 연구 도구 #2: py_bt_ros (ROS·Webots 기반 BT)

슬라이드 47 · 연구 도구 #3: P2P 멀티로봇 테스트베드 MONA-SPACE

슬라이드 내용 정리

연구 도구 #1: PyGame 기반 시뮬레이터 — 핵심 메시지는 모듈성(Modularity)과 "시나리오 적응성(Scenario Adaptability)"입니다. 행동 트리(Behavior Tree, BT)로 에이전트의 행동을 정의하면 다양한 미션 시나리오를 손쉽게 수용할 수 있습니다.

위쪽 두 개의 BT 다이어그램은 "BT 노드 몇 개만 간단히 추가(Added some BT nodes simply)"해서 시나리오를 바꾸는 모습을 보여줍니다. 아래 두 시뮬레이션은 동일한 First-Claimed Greedy 알고리즘(에이전트 a=10, 태스크 t=100)을 각각 외판원 문제(Traveling Salesman Scenario)와 픽업-배송(Pickup-Delivery Scenario)에 적용한 결과로, depot(거점)와 tasks(방문할 장소)가 표시되어 있습니다.

교수님 설명

멀티로봇 태스크 할당(Task Allocation) 알고리즘을 빠르게 검증하려면, 시나리오를 바꿔가며 반복 실험할 수 있는 자체 벤치마크 도구가 필요합니다. 그래서 PyGame 기반의 가벼운 시뮬레이터를 직접 만들었고, 여기에 앞서 설명한 행동 트리를 결합했습니다.

BT의 진가는 바로 이 지점에서 드러납니다. 외판원 문제처럼 "모든 지점을 방문"하는 시나리오와 픽업-배송처럼 "집어서 옮기는" 시나리오는 미션 논리가 다르지만, BT 노드 몇 개만 갈아 끼우면 같은 골격으로 두 시나리오를 모두 표현할 수 있습니다. 즉 코드를 통째로 다시 짜지 않고도 새로운 미션에 적응(adapt)시킬 수 있다는 것이 핵심입니다.

슬라이드 내용 정리

같은 PyGame 시뮬레이터로 더 많은 시나리오를 개발하는 사례 모음입니다. 도시·물류창고를 내려다본 격자 맵, 자원/태스크 분배를 나타내는 색상 막대 그래프, 3D 창고 환경, 드론 군집(swarm), 그리고 로봇이 화재를 진압하는 탐색·구조 + 화재 진압(Search and Rescue + Fire Suppression) 장면 등이 보입니다.

교수님 설명

도구를 한번 잘 만들어 두면 다양한 응용 시나리오로 확장하기 쉽습니다. 창고 물류, 군집 비행, 화재 진압처럼 성격이 다른 미션들도 같은 프레임워크 위에서 구현해 알고리즘의 일반성을 검증할 수 있습니다.

특히 화재 진압 장면은 앞서 시뮬레이션 검증에서 언급한 시나리오와 연결됩니다. UAV가 정찰하고, 구조 UGV가 인명을 구하며, 소방 UGV가 불을 끄는 일련의 시퀀스를 이 도구 안에서 재현하면서 분산형 태스크 할당이 실제로 잘 수렴하는지 눈으로 확인하는 것입니다.

슬라이드 내용 정리

연구 도구 #2: py_bt_ros — ROS를 지원하는 Python 기반 행동 트리이자 Webots 기반 시뮬레이터입니다. 화면에는 BT 시각화 도구 Groot, ROS2, 노드로 구성된 BT 편집 화면, 그리고 Webots 안에서 로봇이 동작하는 3D 시뮬레이션이 보입니다.

오른쪽은 2025 Autumn — Y2 Robot Programming 수업 사진으로, 학생들이 이 도구로 프로젝트를 진행하는 모습입니다(예: 화재감지로봇, 기상알람로봇).

교수님 설명

행동 트리의 대표적 라이브러리인 BehaviorTree.CPP는 C++ 기반이라 디버깅이 까다롭고 진입장벽이 높습니다. 그래서 Python으로 BT를 작성하고 ROS와 연동할 수 있는 py_bt_ros를 직접 개발했습니다. 디버깅이 쉽고 배우기 부담이 적어 교육용으로도 적합합니다.

실제로 학부 2학년 로봇 프로그래밍 수업에 이 도구를 활용하고 있습니다. 학생들이 자유 주제로 화재 감지 로봇, 기상 알람 로봇 같은 프로젝트를 BT로 직접 구현하는데, 진입장벽이 낮은 도구 덕분에 초심자도 복잡한 로봇 로직을 시각적으로 다룰 수 있게 됩니다.

슬라이드 내용 정리

연구 도구 #3: P2P 통신을 지원하는 멀티로봇 테스트베드 — MONA-SPACE. 영국 맨체스터에서 개발된 MONA 로봇 플랫폼을 활용합니다. 가운데 영상은 여러 대의 로봇이 동시에 태스크를 수행하는 실제 테스트베드(Tasks left: 33, ×3 배속)입니다.

아래 표는 동작 모드(Modes)를 정리한 것으로, Full Sim / Puppet / P2P / Off-board / On-board 열과 Decision(의사결정)·Comm.(통신)·Move(이동) 행으로 구성됩니다. 모드에 따라 각 기능을 시뮬레이션에서 처리할지, 외부(off-board)에서 처리할지, 로봇 자체(on-board)에서 처리할지가 달라집니다.

교수님 설명

분산형 코디네이션을 실제 하드웨어로 검증하려면, 로봇들이 중앙을 거치지 않고 서로 직접 통신할 수 있어야 합니다. MONA-SPACE는 P2P(Peer-to-Peer) 통신과 온보드 처리(on-board)를 지원한다는 점에서 기존 Crazyflie 기반 테스트베드와 차별화됩니다. 즉 의사결정·통신·이동을 로봇 안에서 자체적으로 수행하며 진짜 분산형 실험을 할 수 있습니다.

모드 표가 중요한 이유는, 연구 단계에 맞춰 점진적으로 현실에 가까워질 수 있기 때문입니다. 처음에는 모든 것을 시뮬레이션(Full Sim)이나 외부 컴퓨터(Off-board)에서 돌려 검증하고, 알고리즘이 안정되면 통신과 의사결정을 점차 로봇 온보드와 P2P로 옮겨 실제 분산 환경에서의 강건성을 단계적으로 확인하는 것입니다.

슬라이드 내용 정리

마무리 슬라이드입니다. "Thank you! Any questions?"와 연락처 inmo.jang@kau.ac.kr, 그리고 연구실 InMOLab(Intelligent Multi-Robot Orchestration Lab)과 한국항공대(Korea Aerospace University) 로고가 표시되어 있습니다.

교수님 설명

강연을 마치며, 현재 진행 중인 연구들을 정리하면 다음과 같습니다. ① 리더 제거 시 분산형 재구성 실험(이번 주 예정) — 군집을 이끌던 리더가 사라졌을 때 시스템이 스스로 재조직되는지를 검증합니다. ② 멀티로봇 태스크 할당에 대한 리뷰 논문 제출 직전 단계입니다.

③ LLM을 활용한 미션 오토노미 프레임워크의 적응성 개선 — 앞서 소개한 LLM·AI Planning·BT 통합 접근을 더 유연하게 만드는 작업입니다. ④ KAI(한국항공우주산업)와는 유무인 복합 전투기(MUM-T) 시나리오 연구를, ⑤ KAIST(오현우 교수 연구실)와는 배터리 레벨을 고려한 태스크 할당 공동 연구 논문을 작성 중입니다.

보충 설명

이번 섹션 전체를 관통하는 메시지는 "좋은 연구 도구가 곧 연구 경쟁력"이라는 점입니다. 알고리즘(태스크 할당·연합 형성)을 검증하려면 빠르게 시나리오를 바꿔가며 실험할 수 있는 소프트웨어(PyGame, py_bt_ros)와, 분산 통신을 실제로 시험할 수 있는 하드웨어(MONA-SPACE)가 모두 필요합니다.

세 도구는 시뮬레이션 → 부분 현실 → 완전 분산으로 이어지는 검증 사다리를 이룹니다. PyGame으로 알고리즘 아이디어를 빠르게 거르고, py_bt_ros·Webots로 ROS 환경에서의 동작과 교육을 챙기며, MONA-SPACE에서 P2P·온보드로 실제 분산 환경을 재현하는 흐름입니다. 또한 이 모든 연구가 KAI·KAIST 같은 산업체·타 대학과의 협업으로 이어진다는 점은, 멀티로봇 분야가 학계 안에만 머물지 않고 국방·물류 등 실제 응용으로 확장되고 있음을 보여줍니다.

용어표 · English ↔ 한글

English

한글

의미

Multi-Robot System

멀티로봇 시스템

여러 대의 로봇이 협력해 하나의 임무를 수행하는 시스템.

Decentralization

분산화

중앙 통제 없이 각 로봇이 로컬 정보로 스스로 결정하는 구조.

Single Point of Failure

단일 장애점

한 지점(중앙)이 고장 나면 전체 시스템이 마비되는 취약점.

MUM-T (Manned-Unmanned Teaming)

유무인 복합체계

유인 자산과 무인 로봇이 한 팀으로 협업하는 체계.

Mission Autonomy

미션 오토노미

고수준 미션만 받으면 시스템이 스스로 행동 계획을 세우고 실행하는 자율성.

Course of Action (COA)

행동 방책

목표 상태에 도달하기 위한 일련의 액션 시퀀스.

Task Decomposition

태스크 분해

큰 미션을 실행 가능한 세부 작업으로 쪼개는 과정.

Coalition Formation

연합 형성

특정 태스크를 함께 수행할 로봇 그룹(연합)을 구성하는 문제.

Task Allocation

태스크 할당

어떤 로봇이 어떤 작업을 맡을지 결정하는 문제.

HTN (Hierarchical Task Network)

계층적 태스크 네트워크

복잡한 작업을 계층적으로 분해하는 전통적 AI 플래너.

Behavior Tree (BT)

행동 트리

모듈성·가시성·반응성을 갖춰 FSM보다 유연한 행동 제어 구조.

Backward Chaining

후진 추론

목표에서 거꾸로 추론해 행동 트리를 자동 생성하는 기법.

Nash Equilibrium

내쉬 균형

각자 전략을 바꿀 유인이 없는 상태로, 분산 알고리즘 수렴 증명에 활용.

OODA Loop

OODA 루프

Observe-Orient-Decide-Act, 변화에 반응하는 의사결정 순환.

스스로 점검

중앙집중형 멀티로봇 시스템이 가진 네 가지 한계를 설명하고, 각각이 왜 분산화를 요구하는지 말할 수 있는가?
MUM-T가 '완전 자율 군집'으로 가는 로드맵에서 어떤 위치를 차지하며 왜 중간 단계로 추가되었는가?
미션 오토노미에서 사람의 역할과 시스템의 역할은 어떻게 나뉘며, COA는 어떻게 만들어지는가?
LLM, AI Planning(HTN), Behavior Tree 세 방법론의 강점과 한계를 비교하고, 왜 결합하려 하는지 설명할 수 있는가?
Behavior Tree가 Finite State Machine보다 우수하다고 평가받는 세 가지 속성(Modularity·Visibility·Reactivity)을 예로 설명할 수 있는가?
분산형 태스크 할당의 'Local Decision → Conflict Resolution → 반복' 패턴이 어떻게 수렴하며, 게임 이론이 왜 필요한가?
Mission BT를 모든 로봇이 실행하고 중앙-분산 하이브리드로 설계하는 것이 장애 대응과 확장성 측면에서 어떤 이점을 주는가?

멀티로봇 시스템과 미션 오토노미: 분산형 협업의 설계
Multi-Robot Systems & Mission Autonomy (Week 13 특강)

핵심 요약

① 왜 분산형인가

② 미션 오토노미

③ 태스크 플래닝 3대 도구

④ 구현 프레임워크

⑤ 태스크 할당 & 연합 형성

⑥ 연구 도구와 실증

01강의 소개와 연구자 배경

02멀티로봇 시스템은 왜 필요한가

03분산화(Decentralization)의 중요성

04MUM-T와 미션 오토노미의 부상

05미션 오토노미의 정의

06태스크 플래닝 방법론 (1)

07태스크 플래닝 방법론 (2)

08구현 프레임워크와 시뮬레이션 검증 (1)

09구현 프레임워크와 시뮬레이션 검증 (2)

10태스크 할당과 연합 형성

11연구 도구 개발과 진행 중인 연구

용어표 · English ↔ 한글

스스로 점검

멀티로봇 시스템과 미션 오토노미: 분산형 협업의 설계Multi-Robot Systems & Mission Autonomy (Week 13 특강)

핵심 요약

① 왜 분산형인가

② 미션 오토노미

③ 태스크 플래닝 3대 도구

④ 구현 프레임워크

⑤ 태스크 할당 & 연합 형성

⑥ 연구 도구와 실증

01강의 소개와 연구자 배경

02멀티로봇 시스템은 왜 필요한가

03분산화(Decentralization)의 중요성

04MUM-T와 미션 오토노미의 부상

05미션 오토노미의 정의

06태스크 플래닝 방법론 (1)

07태스크 플래닝 방법론 (2)

08구현 프레임워크와 시뮬레이션 검증 (1)

09구현 프레임워크와 시뮬레이션 검증 (2)

10태스크 할당과 연합 형성

11연구 도구 개발과 진행 중인 연구

용어표 · English ↔ 한글

스스로 점검

멀티로봇 시스템과 미션 오토노미: 분산형 협업의 설계
Multi-Robot Systems & Mission Autonomy (Week 13 특강)