시험
2026-1.로봇공학개론
핵심 요약
목차
시험 대비 · 핵심 요약

2026-1.로봇공학개론
전 회차 개념 요약 (시험 대비용)

시험 직전에 흐름을 잡는 용도입니다. 회차마다 5~10분이면 읽도록 개념 위주로 정리했고, 사담·일정 안내는 뺐습니다. 공식은 정말 중요한 것만 '의도'를 짚었습니다.

회차  13개구성  개념 · 용어 · 시험 포인트읽기  회차당 약 5~10분
Week 2김완수교수님

01김완수교수님

완전 자동화의 한계를 출발점으로, 사람을 대체하지 않고 증강·보조·협력하는 '인간 중심 협업로봇'을 안전(Safety)·공존(Coexistence)·협업(Collaboration)의 단계로 구현하는 방법 — 실시간 인간공학, 가변강성 웨어러블, 공유 자율성 — 을 다룬 회차.
핵심 개념

이 강의의 출발점은 완전 자동화(full automation)가 왜 한계에 부딪히는가이다. 고령화로 생산 가능 인력이 줄면서 제조·헬스케어·물류·건설·농업 전 분야로 자동화 요구가 커지지만, 공장처럼 통제된(정형) 환경과 달리 조명·자재·형태가 시시각각 변하는 비정형 환경(unstructured environment)에서는 작은 변동 하나로 시스템이 멈춰버린다. 대표 사례가 테슬라의 'Flufferbot' 실패로, 배터리팩 위에 부드러운 천(비정형 물체)을 덮는 사소한 작업조차 머신 비전이 처리하지 못해 라인 전체가 정지했다. 이는 모라벡의 역설(Moravec's paradox) — 사람에게 쉬운 일이 로봇에겐 어렵고, 사람에게 어려운 일(정밀 반복 계산)이 로봇엔 쉽다 — 을 보여준다.

여기서 핵심 통찰은 효율성(Efficiency)과 회복 탄력성(Resilience)의 맞교환이다. 하나의 작업에 최적화해 효율을 높일수록, 공급망 충격이나 맞춤형 생산(Mass Personalization) 같은 예측 불가능한 변수에 적응·회복하는 능력은 오히려 떨어진다. 그래서 사람을 배제하는 것이 아니라 사람의 유연한 손과 로봇의 힘·정밀함을 결합하는 협업(collaboration)이 더 현실적인 해법으로 부상한다.

이 흐름은 인더스트리 4.0 → 5.0 전환으로 정리된다. 4.0은 IoT 기반으로 모든 장비를 연결·디지털화한 '기술 주도' 시대였고, 로봇은 펜스 안에서 사람과 물리적으로 분리되어 자기 일만 반복했다. 5.0은 4.0을 보완하는 '가치 주도' 개념으로, 유럽연합 집행위원회가 정의한 세 기둥 — 인간 중심(Human-centric)·회복 탄력성(Resilient)·지속가능성(Sustainable) — 을 강조한다. 인간 중심 산업이란 기술이 아니라 사람을 위해 노력하는 산업으로, 근로자를 비용이 아닌 '투자'로 보고 노동력을 증강(enhancement)·지원(assistance)·회복(recovery)시키는 기술을 만드는 것이 공학자의 역할이다.

인간–로봇 작업은 작업 공간·과업을 얼마나 공유하느냐에 따라 단계적으로 분류된다: Conventional(펜스로 완전 분리) → Coexistence/Autarkic(펜스 없이 공간 분리) → Synchronised(공유 공간을 한 번에 하나씩) → Cooperation(공간 공유, 과업은 다름) → Collaboration(공간·과업까지 공유, 접촉 발생). 안전 기준은 자의가 아니라 ISO 10218 / ISO/TS 15066 국제 표준이 규정하며, 협동 운전을 4레벨로 나눈다: SMS(근접 시 정지)·HG(손으로 유도)·SSM(거리·속도 감시로 감속)·PFL(접촉 시 힘·파워 제한). 이 4레벨은 다시 안전(Safety, 충돌 감지·반응), 공존(Coexistence, 충돌 회피), 협업(Collaboration, 조율된 동작)으로 묶이며, 모든 표준이 최우선으로 두는 가치는 안전(Safety)이다.

Pillar 1(인간 이해·보호)의 핵심은 인간공학(ergonomics) 평가를 기존의 사후(reactive) 방식에서 실시간/사전(proactive) 방식으로 바꾸는 것이다. 부상은 한 번의 큰 동작이 아니라 작은 부하의 반복 누적으로 생기므로, ① 관절 부하를 실시간 모니터링하고 → ② 위험 자세를 시각(빨간 관절 표시)·촉각(ErgoTac 진동) 피드백으로 교정 유도하며 → ③ 로봇이 애초에 위험 자세로 가지 않도록 선제 제어한다. 평가 지표는 운동학(kinematic)(관절 변위·속도·가속도, 힘은 보지 않음)과 동역학(dynamic)(과부하 토크·피로·보상력, 실제 부하 반영)으로 나뉜다. 진동 피드백은 30~60% 범위로 줘야 인지 부하(cognitive load)를 최소화하면서 목표 자세로 수렴한다. 더 나아가 예측형(Proactive) 협업은 들고 있는 공구의 무게·힘 방향까지 인식해, 사람이 자세를 취하기 전에 최적 자세를 미리 제안한다.

Pillar 2(신체 증강)는 웨어러블 로봇으로, 리지드(rigid)(큰 힘·위험·거추장)와 소프트(soft)(안전하나 부피 큼·힘 약함, 공압)의 단점을 결합한 가변강성(variable stiffness)이 핵심이다. 평소엔 부드럽다가 필요할 때만 단단해져 안전성과 힘 전달을 동시에 잡는다. 두 메커니즘은 레이어 재밍(layer jamming)(겹친 층의 마찰로 강성 변화 — 종이 여러 장을 겹쳐 누르면 안 휘는 원리, 정렬 0%일수록 단단)과 꼬임 줄 구동기(TSA, Twisted String Actuator)(모터로 실 묶음을 꼬면 짧아져 큰 감속비를 얻음)이다. 제어의 전제는 행동 인식(activity recognition)으로, 보행 국면(gait cycle 0~100%)과 지형(평지·계단·오르막)에 따라 제어가 크게 달라지므로 멀티태스크 학습(multitask learning)으로 새 사용자도 2~3스텝 안에 적응시키고, 소형화 제약 때문에 소수 IMU로 경량 추론한다.

Pillar 3(공유 자율성)는 사람과 로봇이 상황에 따라 제어 권한·작업을 나눠 갖는 공유 자율성(shared autonomy)이다(완전 수동 조종도, 완전 자율도 아닌 중간). 팔레타이징 예처럼 작은 박스는 사람, 중간은 로봇, 큰 박스는 협동으로 역할을 동적 분배한다. 안전의 수학적 보장이 신뢰의 토대인데, ① 에너지 탱크(energy tank)로 시스템의 수동성(passivity)을 보장해(외부에서 받은 것보다 많은 에너지를 만들지 않음 → 발산하지 않음), 여유 자유도(redundancy)의 널 스페이스(null space) 동작까지 제한된 에너지를 조화롭게 배분하고, ② 리아푸노프 안정성(Lyapunov stability)을 만족하는 임피던스 파라미터를 도출(CLF-MPC)해 접촉이 갑자기 생기거나 사라져도 안정성을 보장한다. 실내 위치추정은 UWB·IMU·기압계를 센서 퓨전(LSTM)으로 결합하고, 시선(gaze)·스켈레톤으로 사람의 의도(intent)를 인식한다. 학습 측면에서는 VR 텔레오퍼레이션으로 모방 학습(imitation learning, ACT) 데이터를 모으되, 단순 미미킹이 아닌 충돌 인지(collision-aware) 제어로 품질 높은 데이터를 효율적으로 확보한다. 마지막으로 LLM+MCP+ROS 연동으로 자연어 명령을 ROS 동작 시퀀스로 번역해, 코드 수정 없이 기존 로봇을 제어한다.

시험 포인트
  • 인간 중심 협업로봇(Human-centered Collaborative Robot) — 사람을 대체하지 않고 증강·보조·협력하는 로봇. 강의 전체를 관통하는 주제이며, 결론은 "로봇은 노동의 대체재가 아니라 인간의 잠재력을 증강하는 지속 가능한 동반자"이다.
  • HRI(Human-Robot Interaction) — 사람과 로봇이 같은 공간에서 안전하고 자연스럽게 함께 일하도록 만드는 연구 분야. 감정적·물리적 상호작용 중 이 강의는 물리적 협업에 무게.
  • 완전 자동화의 한계 3가지 — ① 비정형 환경의 취약성, ② 유연성 부족(재프로그래밍 비용), ③ 회복 탄력성 저하. 시험에 "왜 완전 자동화가 실패하는가"로 출제 가능.
  • 효율성 vs 회복 탄력성(Efficiency vs Resilience) — 한 작업에 최적화할수록 효율은 오르나 충격 흡수·적응 능력은 떨어지는 맞교환 관계. 핵심 대비 개념.
  • 모라벡의 역설(Moravec's paradox) — 사람에게 쉬운 일(부드러운 천 다루기)이 로봇엔 어렵고, 어려운 일(정밀 반복)이 쉽다. Flufferbot 사례의 공학적 교훈.
  • 비정형 물체/환경(unstructured object/environment) — 천·끈·과일처럼 형태가 고정되지 않아 머신 비전·제어가 다루기 어려운 대상/조건. 완전 자동화 실패의 직접 원인.
  • Industry 4.0 vs 5.0 — 4.0은 IoT 기반 '기술 주도'·인간과 기계 물리적 분리; 5.0은 '가치 주도'·인간 중심 연결. 가장 큰 차이는 인간-기계의 분리 여부. 빈출 비교.
  • Industry 5.0 세 기둥 — Human-centric(인간 중심)·Resilient(회복 탄력)·Sustainable(지속가능). EU 집행위 정의.
  • 노동력 3대 기술 방향 — 증강(enhancement)·지원(assistance)·회복(recovery). 인간 중심 산업에서 공학자의 역할.
  • 인간-로봇 작업 5단계 분류 — Conventional → Coexistence(Autarkic) → Synchronised(공간 한 번에 하나) → Cooperation(공간 공유·과업 다름) → Collaboration(공간·과업 공유·접촉). Cooperation vs Collaboration 구분이 핵심.
  • ISO 10218 / ISO/TS 15066 — 협동 운전 안전 국제 표준. 최우선 가치는 Safety.
  • 협동 운전 4레벨SMS(Safety-rated Monitored Stop) 근접 시 정지 · HG(Hand Guiding) 손 유도 · SSM(Speed and Separation Monitoring) 거리·속도 감시 감속 · PFL(Power and Force Limiting) 접촉 힘·파워 제한. 현 상용 로봇은 레벨3까지, 산업계는 레벨4로 이행 중.
  • 안전·공존·협업 3분류 — Safety=충돌 감지·반응(L1), Coexistence=충돌 회피(L2), Collaboration=조율된 동작(L3·4). 4레벨을 가치로 재정리한 틀.
  • 인간공학(Ergonomics) — 사람이 작업 시 어디에 힘이 어떻게 실리는지 분석하는 학문. 반복 부하 누적이 만성 질환으로 이어짐.
  • 사후(reactive) → 실시간/사전(proactive) 전환 — 기존은 사후 분석 후 환경을 정적으로 설계; 핵심 아이디어는 작업 중 상태를 실시간 측정해 임계치 전에 개입하는 동적 접근. 매우 중요한 시험 포인트.
  • 운동학 vs 동역학 지표(Kinematic vs Dynamic) — 운동학은 변위·속도·가속도(힘 무관, 움직임만), 동역학은 토크·피로·보상력(실제 부하). 같은 자세도 든 무게에 따라 토크가 달라 동역학 지표 필요.
  • 과부하 피로 모델(Overloading Fatigue Model) — 순간 토크가 아니라 시간에 따라 근육에 누적되는 피로를 추정. 가벼운 물체도 오래 들면 위험 → 협업 안전의 출발점.
  • ErgoTac / 진동·시각 피드백 — 위험 자세를 빨간 관절(시각)·진동(촉각)으로 알려 교정 유도. 인지 부하(cognitive load) 최소화를 위해 진동을 30~60% 범위로 조절하는 것이 설계 핵심.
  • CBF(Control Barrier Function) — "값 ≥ 0이면 안전 영역"이라는 제약. 항상 ≥0이면 인간공학적 안전 한계를 넘지 않음을 보장.
  • BoS / CoP(Base of Support / Center of Pressure) — 지지면과 압력중심. CoP가 BoS 안에 있으면 넘어지지 않는 안정 상태. 자세 안정성 판정.
  • 가변강성(Variable Stiffness) — 평소 부드럽다가 필요 시 단단해지는 기술. 리지드·소프트의 단점을 보완해 안전성과 힘 전달을 동시에 확보.
  • 레이어 재밍(Layer Jamming) — 겹친 층의 마찰력으로 강성 변화(정렬 0%일수록 단단). 모터로 슬라이드를 넣고 빼 강성 조절(공압 불필요).
  • TSA(Twisted String Actuator) — 실 묶음을 꼬으면 길이가 짧아져 큰 감속비를 얻는 가벼운 텐던 구동. 단독으론 큰 힘 전달이 어려워 실리콘과 결합.
  • 리지드 vs 소프트 로봇(Rigid vs Soft) — 리지드는 큰 힘이나 위험·거추장스러움, 소프트는 안전하나 부피 크고 힘 약함. 두 장점 결합이 연구 방향.
  • 슬랙(slack) — 텐던 구동에서 줄이 느슨해져 생기는 미스매치. 기구적 보완 + 제어 예측으로 줄여 에너지 손실 최소화.
  • 행동 인식 / 보행 사이클(Activity Recognition / Gait Cycle) — 웨어러블 제어의 전제. 보행 국면(0~100%)·지형마다 제어가 달라 실시간 판단 필수.
  • 멀티태스크 학습(Multitask Learning) — 보행 단계·지형을 동시 판단하고, 새 사용자도 2~3스텝 안에 적응. 소수 IMU로 경량(on-device) 추론.
  • 공유 자율성(Shared Autonomy) — 완전 수동/완전 자율의 양극단이 아닌 중간; 상황에 따라 제어 권한·작업을 동적 분담. 박스 크기별 역할 분배가 예시.
  • 여유 자유도(Redundancy) / 널 스페이스(Null Space) — 손끝 위치를 유지하면서 팔꿈치 등을 움직일 수 있는 여유. 유연성을 주지만 외란 시 발산 위험.
  • 임피던스 제어(Impedance Control) — 말단을 부드럽게(스프링-댐퍼처럼) 거동시키는 제어. 접촉 작업에 적합.
  • 에너지 탱크(Energy Tank) / 수동성(Passivity) — 쓸 수 있는 에너지 총량을 정해두고 모든 작업에 배분. 받은 것보다 많은 에너지를 만들지 않으면(passivity) 발산하지 않아 다중작업 안정성 보장.
  • 리아푸노프 안정성(Lyapunov Stability) / CLF-MPC — 안정성을 수학적으로 증명하며 임피던스 파라미터를 도출. 접촉 손실·공구 진동·외란에도 안정 → 협업 신뢰의 토대.
  • 센서 퓨전(Sensor Fusion: UWB·IMU·기압계 + LSTM) — 실내 3D 위치 추정. UWB는 실내 측위에 강하나 다중경로 오차 → IMU(자세)·기압계(고도)를 LSTM으로 융합해 약점 보완(Geo-LSTM).
  • 의도 인식(Intent Perception, 시선·스켈레톤) / HIPCP — 부른 위치에 멈추는 베이스라인과 달리, gaze·skeleton으로 실제 작업 지점까지 접근해 사람의 이동·수고 절감.
  • 모방 학습(Imitation Learning) / ACT — 사람 시연 데이터로 정책 학습; ACT는 여러 시점 동작을 묶어 예측. 데이터의 양뿐 아니라 일관된 품질이 성능을 좌우.
  • 충돌 인지 텔레오퍼레이션(Collision-Aware Teleoperation) — 단순 미미킹이 아니라 로봇의 가동 한계·충돌을 반영해 깔끔한 데이터 확보 → 학습 가속(작업 시간·이동 거리 약 62% 단축).
  • MCP(Model Context Protocol) + ROS — LLM이 외부 도구·센서에 표준 방식으로 접근하는 어댑터 규약. ROS와 결합하면 자연어 의도를 ROS 명령 시퀀스로 번역해 코드 수정 없이 기존 로봇 제어 가능.
공식의 의도

CBF(x) ≥ 0 — 인간공학적 안전 제약을 "값이 0 이상인 영역 = 안전"으로 정의해, 작업 궤적 내내 이 값이 음수가 되지 않게 함으로써 관절 과부하·낙상 한계를 넘지 않음을 보장하려는 것.

에너지 탱크: P_task + P_sub ≤ E_total — 시스템이 쓸 수 있는 에너지 총량을 정해두고 말단 작업과 여유 자유도 동작에 배분해, 수동성(passivity)을 지켜 외란 시에도 발산하지 않고 안정하게 만들려는 것(구체적 값·유도는 시험 무관).

Week 3서태원교수님 (보류)

02서태원교수님 (보류)

노동을 '줄이는' 기계와 '대체하는' 로봇의 차이에서 출발해, 복잡한 제어 대신 기구 설계 자체에 지능을 심는 기계적 지능과, 변형 바퀴·외벽청소 로봇이 부딪히는 접촉 모드 전환(하이브리드 시스템)·양산 단가·현장 실용성의 벽을 관통한 회차.
핵심 개념

강의는 노동(labor)의 의미라는 질문에서 출발한다. 세탁기 같은 기계는 인간의 '수고'를 줄여 삶을 보조하지만, 로봇(robot)은 노동을 대체·재배치한다는 점에서 개념이 다르다. 그래서 로봇은 단순한 기술 문제를 넘어, 일자리·자본주의 구조 같은 사회·경제적 질문으로 확장된다. "기술이 삶을 더 행복하게 할지 불확실하게 할지"를 함께 설계(design)해야 한다는 문제의식이 전체 강의의 밑바탕이다.

로봇 상용화의 결정적 벽은 양산 단가(cost)다. 연구실 시제품(prototype)은 맥슨 모터(Maxon motor) 같은 고가 정밀 부품을 자유롭게 쓰지만, 양산 제품은 가격을 맞춰야 한다. 거친 경험칙으로 양산가 ≈ 판매가의 약 1/20이어서, 2천만 원에 팔려면 제조 원가를 100만 원대로 끌어내려야 사업성이 난다. 휴머노이드 한 대에 수십 개의 액추에이터(actuator)가 들어가므로 모터 단가가 조금만 높아도 전체 가격이 비현실적으로 치솟는다. '랩 시연'과 '상용화'의 간극을 만드는 핵심 이유다.

여기서 '설계(design)'는 형상을 그리는 일이 아니라 기구학(kinematics)동역학(dynamics)을 포함한 공학적 설계를 뜻한다. 이 연구실을 관통하는 키워드는 기계적/물리적 지능(mechanical/physical intelligence)으로, 학계에서 형태 지능(morphological computation)이라 부르는 사고방식과 닿아 있다. 보통 로봇을 똑똑하게 만든다 하면 센서·알고리즘·제어기를 떠올리지만, 이 접근은 반대로 몸체(하드웨어)의 형상과 물성 자체를 잘 설계하면 별도의 피드백 제어 없이도 환경에 알맞게 반응하게 만들 수 있다고 본다. 턱을 넘기 위해 트랙을 둘로 나눈 멀티트랙(multi-track) 구조가 그 예다. 이런 직관(intuition)은 상용 툴 의존이 아니라 부품을 직접 깎고 접촉·구속을 직접 모델링하는 로우 레벨(low-level) 작업에서 길러진다.

컴플라이언스 설계(compliance design)는 트랙·몸체를 유연하게 만들어 '구렁이가 담 넘듯' 장애물을 부드럽게 넘는 방식이다. 전형적 트레이드오프(trade-off)를 보이는데, 장애물 극복·적응에는 강하지만 페이로드(payload)와 안정성(stability)에는 불리하다. 강성(stiffness)과 순응성(compliance) 사이의 균형 잡기가 소프트·변형 로봇 설계의 핵심 난제다.

변형 바퀴(transformable wheel)는 "왜 로봇 요소가 이렇게 설계되는가"라는 질문에서 나왔다. 모터(motor)는 본래 한 방향 회전에 최적화돼 바퀴·자동차·전기차에 유리하지만, 가감속을 반복하는 다리형 로봇은 힘을 계속 발산해 발열(heat dissipation)이 성능 저하의 핵심 이슈가 된다. 그래서 평지에선 바퀴로 굴러가다 장애물 앞에선 스포크(spoke)가 펴지는 디자인을 설계 공간(design space) 탐색으로 찾는다. 어려운 핵심은 접촉 양상이 계속 바뀐다는 점이다: 바퀴의 롤링 접촉(rolling contact)점 접촉(point contact) → 두 점이 동시에 닿는 이중 점 접촉(double point contact)으로 동역학이 전환된다.

접촉 모드가 이산적으로 바뀌면 지배 방정식이 매 순간 교체되므로, 제어 관점에서 이는 스위치드 시스템(switched system) 혹은 하이브리드 시스템(hybrid system) 제어 문제가 된다. 연속 동역학(continuous dynamics)과 이산 모드 전환(discrete mode switch)이 섞여 있어, 한 모드에서 안정한 제어기를 짜도 전환 순간 전체가 불안정해질 수 있다. 연구실의 제어 변천은 이 어려움을 우회하려는 자연스러운 흐름이다: 백스테핑(backstepping)(입력 제약을 못 넣어 입력이 튐) → MPC(Model Predictive Control)(입력 구속을 명시적으로 처리) → 강화학습(reinforcement learning)·액터-크리틱(actor-critic)(모델 없이 정책 학습, 단 심-투-리얼(sim-to-real) 격차 존재).

실용 지향(deployable) 사례가 계단 등반 배달 로봇이다. 4절 링크(four-bar linkage)로 스포크의 홈을 계단 모서리에 걸쳐 한 칸씩 올라가는 단순·안정 구조다. 바닥 휠 두 개로 방향 전환은 해결되지만, 진짜 약점은 계단 치수 의존성(stair-size dependency)이다(A 아파트에 맞추면 B 아파트에선 못 씀). 해법은 "안 되면 말랑하게" — 스포크를 소프트 재질로 만들어 적응(adaptation)·접지력(traction)을 확보하되 미끄러짐(release)은 막는 상충 조건을 동시에 만족시키는 것이며, 대신 등반 안정성은 다소 떨어진다. 또 다른 갈래인 모듈러 로봇(modular robot)·리컨피규러블 트러스(reconfigurable truss)는 같은 모듈을 레고처럼 재조합하는데, 우주 환경에서 부품 하나가 고장 나도 재구성으로 대응하는 여유도(redundancy)가 핵심 가치다.

외벽청소 로봇(facade cleaning robot)은 현장 제약을 보여주는 대표 사례다. 곤돌라(gondola)에 매니퓰레이터를 얹는 초기 방식은 곤돌라 없이는 못 쓰는 한계가 있었고, 옥상 윈치(winch) 후 줄에 매달려 자력 이동하는 등반형으로 진화했다. 모델링이 까다로운 이유는 텐션 그래디언트(tension gradient)다: 위쪽은 고장력, 아래 자유단(free end)은 장력이 0이고 줄에서 미끄러짐(slip)까지 더해진다. 위에서 단순히 매달면 줄이 스프링처럼 깔끔하게 모델링되지만, 로봇이 줄 중간을 잡고 오르면 접촉점 위·아래 장력이 불연속해져 위치 추정(position estimation)이 비선형·불확정적이 된다. 그래서 룰 베이스(rule-based) 제어가 한계에 부딪혀 액터-크리틱 학습으로 넘어갔다.

시험 포인트
  • 노동을 줄이는 기계 vs 대체하는 로봇 (labor reduction vs replacement) — 세탁기는 인간의 수고를 줄여 보조하지만, 로봇은 노동 자체를 대체·재배치한다. 기술 문제를 넘어 사회·경제 구조의 질문으로 확장된다는 도입부 핵심 대비. A vs B 비교로 출제되기 쉽다.
  • 시제품 vs 양산 (prototype vs mass production) — 연구는 성능 위주(고가 부품 자유 사용), 양산은 단가·신뢰성·대량 생산 제약이 지배. 둘 사이 간극이 "로봇이 곧 일상에 온다"는 기대와 현실의 거리다.
  • 양산 단가 경험칙 (cost rule) — 양산가는 대략 판매가의 1/20. 수십 개 액추에이터가 들어가는 휴머노이드에서 모터 단가가 전체 가격을 비현실적으로 끌어올리는 이유를 설명하는 핵심 근거.
  • 맥슨 모터 (Maxon motor) — 스위스제 정밀 DC 모터로 의료·우주에도 쓰이는 고급 부품의 대명사. 랩에서는 당연히 쓰지만 양산엔 부적합 → 시연과 상용화의 간극을 보여주는 사례.
  • 설계 (design) — 형상 그리기가 아니라 기구학+동역학을 포함한 공학적 설계. 이 강의에서 '설계'의 정의를 묻는 문제가 나올 수 있다.
  • 기계적/물리적 지능 (mechanical/physical intelligence), 형태 지능 (morphological computation) — 센서·제어기 대신 하드웨어의 형상·물성 설계로 복잡한 제어 없이 환경에 반응하게 만드는 사고방식. 멀티트랙·유연 트랙이 예시. 강의 전체를 관통하는 최우선 개념.
  • 멀티트랙 (multi-track) — 턱을 넘기 위해 트랙을 둘로 나눈 구조. 피드백 제어 없이 물리적으로 똑똑하게 동작하게 하는 기계적 지능의 구현 예.
  • 이종 군집 구성 (heterogeneous swarm) — 동일 기종 30대가 아니라 벽붙기·점프·비행·지상 4종을 섞어 캐리어에서 살포. 동질 군집보다 수행 가능한 미션 조합이 크게 늘어남이 핵심.
  • 컴플라이언스 설계 (compliance design) — 구조를 유연하게 만들어 장애물에 부드럽게 적응. 장애물 극복엔 강하나 페이로드·안정성엔 불리한 트레이드오프. 강성 vs 순응성 균형이 핵심 난제.
  • 변형 바퀴 (transformable wheel) — 평지에선 바퀴, 장애물 앞에선 스포크로 변형. 모터의 발열 문제(가감속 시 힘 발산)를 회피하면서 장애물 극복을 노린 설계.
  • 발열 (heat dissipation) — 모터는 한 방향 회전에 최적화돼 바퀴·전기차에 유리. 가감속을 반복하는 다리형은 힘을 계속 발산해 발열이 성능 저하의 핵심 이슈. 바퀴형 선호의 근거.
  • 접촉 모드 전환 (contact mode: rolling → point → double point contact) — 변형 바퀴에서 접촉 양상이 바뀌면 동역학 방정식이 교체됨. 왜 변형 바퀴 제어가 어려운지의 직접적 원인.
  • 스위치드/하이브리드 시스템 (switched / hybrid system) — 연속 동역학과 이산 모드 전환이 섞인 시스템. 각 모드에서 안정해도 전환 순간 전체가 불안정해질 수 있어 안정성(stability) 보장이 어렵다. 변형 바퀴·계단 등반·줄 매달림 모두 이 틀로 설명.
  • 제어 변천: 백스테핑 → MPC → 강화학습 — 백스테핑(backstepping)은 입력 제약을 못 넣어 입력이 튐 → MPC는 입력 구속을 명시적으로 처리 → RL/액터-크리틱은 모델 없이 정책 학습(단 sim-to-real 격차). 각 단계가 '왜 다음으로 넘어갔는가'를 묻기 좋은 인과형 포인트.
  • 4절 링크 (four-bar linkage) — 계단 등반 배달 로봇에서 스포크 홈을 계단 모서리에 인앤아웃시켜 한 칸씩 오르는 단순·안정 메커니즘.
  • 계단 치수 의존성 (stair-size dependency) — 4절 링크 행정이 특정 계단 규격에 맞춰져 다른 규격엔 못 씀. 이 로봇의 진짜 약점(방향 전환이 아님 — 함정 선택지 주의). 해법은 소프트 스포크로 적응·접지력 확보하되 미끄럼 방지(release)와 동시 만족.
  • 모듈러 로봇 / 리컨피규러블 트러스 (modular robot / reconfigurable truss) — 동일 모듈을 레고처럼 재조합. 우주 환경에서 고장 시 재구성으로 대응하는 여유도(redundancy)가 핵심 가치.
  • 텐션 그래디언트 (tension gradient) · 자유단 (free end) — 줄 위쪽은 고장력, 아래 자유단은 장력 0. 줄에서의 슬립과 함께 모델링·장력 추정을 어렵게 만드는 외벽청소 등반 로봇의 핵심 난점.
  • 매달림 vs 잡고 오르기 (boundary condition) — 위에서 매달면 줄이 스프링처럼 단순 모델. 로봇이 줄 중간을 잡고 이동하면 접촉점 위·아래 장력 불연속+슬립으로 위치 추정이 비선형·불확정. 룰 베이스 한계 → 액터-크리틱 전환의 이유.
  • 위치 추정·청소 인식 (position estimation / cleaning recognition) — 줄·윈치 모델링과 더불어 외벽청소 로봇의 핵심 기술. "청소가 됐는지" 판별하는 인식 기술이 별도 과제로 중요.
  • 다족형 결합 (legged adaptation) — 본체(등반기)는 줄 따라 영역 커버리지, 다족 다리는 표면 장애물·곡면 적응(adaptation) 담당. 빠른 도약형 보행이 아닌 제약 하의 느린 적응 동작.
  • 비파지 조작 (non-prehensile manipulation) — 집기(grasp) 대신 밀기·긁기·쓸기로 환경 접촉을 이용해 물체를 다룸. 젓가락·휴지·포스트잇처럼 집거나 인식이 어려운 대상에서 단일 파지보다 유효한 복합 전략.
  • 실용 지향 (deployable) / 현장 검증 — 이론적으로 재밌는 제어 문제보다 '실제로 쓸 수 있는 것'을 지향. 랩 연구라도 반드시 현장을 가보고 활용 가능성을 따지라는 연구 철학(학문적 시사점으로 출제 가능).
Week 4한승호교수님

03한승호교수님

모델 기반 제어(MPC 계열의 MPPI)와 학습 기반 제어(RL), 그리고 이 둘을 융합한 전략으로 휠-레그 로봇을 제어하는 큰 흐름을 다루며, 핵심은 "확률적 모델에서 경로를 잔뜩 뿌려 비용으로 가중평균한다"는 MPPI의 유도와 직관이다.
핵심 개념

이 강의의 큰 줄기는 모델 기반 제어(Model-Based Control)데이터 기반 학습 제어(Reinforcement Learning, RL)둘의 융합이라는 세 단계다. 구체적으로는 세 가지 제어 전략 ① MPPI(샘플링 기반 모델예측제어), ② RL, ③ MPPI+RL을 순서대로 다룬다. 모델 기반은 시스템 모델을 그대로 따라가 신뢰성이 높지만 가정을 벗어나면 약하고, RL은 보장은 약하지만 불확실한 환경에서도 성능을 어느 정도 유지한다는 상호보완 관계가 강의 전체를 관통하는 핵심 대비다.

응용 대상은 휠-레그 로봇(Wheeled-Legged Robot, WLR)으로, 평지에서는 바퀴로 에너지 효율 좋게 빠르게 이동하고 계단·턱·험지는 다리로 극복하는 두 이동 방식의 장점을 결합한 플랫폼이다. 특히 라스트마일 배송(Last-mile delivery)에 적합한데, 배송은 First/Middle/Last mile로 나뉘고 마지막 구간(문 앞까지)은 계단·문턱 극복 능력이 필요하기 때문이다. 비교표상 WLR은 지형 적응성·페이로드·속도가 우수하면서 순수 보행 대비 약 83% 에너지를 절감해 종합적으로 가장 균형이 좋다.

WLR의 모델링(Modeling)에는 직관과 어긋나는 핵심 포인트가 둘 있다. 첫째, 바퀴가 붙어도 자유도(DOF)가 늘지 않는다 — 바퀴를 "고정된 관절 위치에서 미끄러지듯 움직이는 점 접촉(moving point contact)"으로 모델링해 바퀴 회전 항을 상태에서 제외하기 때문이다. 둘째, 일반 다리 로봇이 발 접촉에 반드시 거는 롤링 구속(rolling constraint, no-slip)을 WLR에서는 오히려 제거한다. 바퀴는 구르는 방향으로 미끄러져도(굴러도) 정상이기 때문이다. 결과적으로 자유도도 안 늘고 구속도 하나 빠져 문제가 더 단순해진다 — 이것이 다리 로봇과 WLR의 결정적 차이다.

MPC 정식화(MPC Formulation)의 강점은 구속조건(constraint)을 잘 다룬다는 점이다. 비용함수는 터미널 비용(terminal cost)과 경로를 따라 쌓이는 러닝 비용(running cost)으로 구성되고, 구속은 상태-입력 등식(라그랑지안), 순수 상태 등식(페널티), 부등식(완화 배리어 함수)으로 나눠 처리한다. 등식 구속은 "반드시 만족"(예: 발이 땅에 붙음), 부등식 구속은 "넘으면 안 되는 한계"(예: 관절 토크 한계)로 이해하면 된다.

강의의 클라이맥스는 MPPI(Model Predictive Path Integral)의 유도다. 출발은 제어-어파인 확률미분방정식(control-affine SDE)으로, 보통의 상태방정식에 위너 프로세스(Wiener process) 노이즈 항 B(x)dw를 더해 결정적(deterministic) 모델을 확률적(stochastic) 모델로 만든 것이다. 이 노이즈가 바로 화면에 흩뿌려지는 수백 개의 회색 후보 궤적의 원천이며, 현실의 모델 오차·외란을 반영한다. 비용을 최소화하는 가치함수(value function)를 정의하는데, 궤적이 여럿이므로 기댓값(expectation) 형태가 들어가는 것이 특징이다.

가치함수를 재귀형으로 쓰고 2차 테일러 전개하면 노이즈의 분산에 해당하는 트레이스 항 tr(BBᵀV_xx)이 살아남아 확률적 HJB(Stochastic Hamilton-Jacobi-Bellman) 방정식이 나온다. 이를 풀면 최적 제어가 나오지만 차원의 저주(curse of dimensionality)로 상태 차원이 4 이상이면 격자 방식으로는 사실상 못 푼다. 그래서 지수 변환(transformation) V = −λ log Ψ를 도입하고, 핵심 가정(assumption) λGR⁻¹Gᵀ = BBᵀ(제어가 노이즈와 같은 채널로 들어간다)와 트레이스 성질로 비선형 항을 상쇄시켜 선형 PDE로 바꾼다. 선형 PDE는 파인만-칵 정리(Feynman-Kac Lemma) 덕분에 "제어 없는 동역학으로 굴린 수많은 궤적의 기댓값"으로 풀린다 — 즉 어려운 미분방정식 풀이가 경로 샘플링의 가중평균으로 바뀐다. 여기에 매 스텝 재계산하는 모델예측 개념(receding horizon)을 더하면 MPPI가 완성된다.

융합 전략의 대표가 TD-MPC다. 확률적 MPC가 욕심 많은 탐색으로 지역 최소점(local minima)에 빠지는 문제를, 강화학습을 결합해 보완한다. 핵심은 두 가지: ⑴ 고차원 센서 입력을 압축한 잠재 동역학(latent dynamics)으로 미래를 예측해 계획을 가볍게 하고, ⑵ 비용 대신 신경망 가치함수 Q로 장기 가치를 평가한다는 점이다. RL 쪽 구조로는 MoE(Mixture of Experts)(직선·코너·곡선 전문가를 게이팅으로 혼합), 특권 정보(privileged state)와 LSTM 기반 추정, 비대칭 액터-크리틱(asymmetric actor-critic, PPO)이 등장한다.

시험 포인트
  • MPPI (Model Predictive Path Integral) — 미래 궤적 후보를 무수히 샘플링한 뒤 비용이 낮은 궤적에 큰 가중치를 줘 평균 내는 샘플링 기반 MPC. 미분 불가능·비선형 시스템에도 쓸 수 있고 GPU 병렬화로 실시간성을 확보. "회색 경로 → 가중합 → 빨간 최적 경로"가 한 줄 요약.
  • MPC (Model Predictive Control) — 예측 지평 동안 움직임을 시뮬레이션해 비용 최소 입력을 골라 한 스텝 실행하고 매 순간 재계산하는 제어법. 구속조건을 잘 다루는 것이 최대 장점.
  • 위너 프로세스 (Wiener process) — 브라운 운동을 수식화한 노이즈의 원천. dw~N(0,dt). 결정적 동역학(ODE)에 더하면 확률적 동역학(SDE)이 되어 궤적이 들쭉날쭉해진다. "다이내믹스를 비결정적으로 만든다"가 핵심 문장.
  • SDE vs ODE — ODE는 노이즈 없는 결정적 모델(이상적 세계), SDE는 노이즈 항이 추가된 비결정적 모델(현실에 가까운 세계). MPPI는 SDE 기반.
  • 제어-어파인 (control-affine) — 제어입력 u가 G(x)u처럼 1차(선형)로만 들어가는 형태. 최적화가 쉬워진다. 비-어파인은 G(x,u).
  • 가치함수 (value function) — 최소화 대상인 누적 비용 함수. 노이즈로 궤적이 여럿이라 기댓값으로 정의된다. 터미널 비용 + 러닝 비용 구조.
  • 러닝 비용 vs 터미널 비용 — 러닝 비용 q(x)+½uᵀRu은 상태 오차 벌점(Qx²)과 제어 에너지 벌점(Ru²)의 절충. 좋은 제어란 둘의 합을 최소화하는 지점 — 너무 세면(공격적) 에너지 폭발, 너무 약하면(약함) 오차 누적.
  • 확률적 HJB (Stochastic HJB) — 최적 가치함수가 만족하는 편미분방정식. 결정적 HJB와 달리 노이즈의 분산에 해당하는 2차 트레이스 항 tr(BBᵀV_xx)이 반드시 살아남는 것이 결정적 차이.
  • 차원의 저주 (curse of dimensionality) — 상태 차원이 늘수록 격자 기반 PDE 풀이의 계산량이 지수적으로 폭발(n≥4면 사실상 불가). MPPI가 샘플링으로 우회하는 이유.
  • 지수 변환 / 희망함수 (transformation, desirability Ψ)V=−λlogΨ로 비용을 '바람직함'으로 뒤집어, 곱·지수로 얽힌 비선형 HJB를 선형 PDE로 펴는 치환(Cole-Hopf). 적분의 치환과 같은 발상.
  • 핵심 가정 λGR⁻¹Gᵀ = BBᵀ — "제어가 노이즈와 같은 채널로 들어간다(제어 통로 G와 노이즈 통로 B를 일치)". 이 가정으로 비선형 항 두 개가 부호만 반대인 쌍이 되어 상쇄 → 선형 PDE 완성. 노이즈를 상태가 아니라 제어입력에 더하는 구현이 이 가정과 일관됨.
  • 파인만-칵 정리 (Feynman-Kac Lemma) — "복잡한 PDE의 해는 확률적 궤적들의 기댓값과 같다". 이 덕분에 PDE를 직접 푸는 대신 제어 없는 동역학으로 궤적을 굴려 가중평균하면 된다. 어려운 미분방정식을 시뮬레이션 샘플링으로 잇는 다리.
  • 몬테카를로 추정 / 가중치 w_i — 기댓값을 유한 샘플 합으로 근사. 가중치 w_i=exp(−X̂/λ)/Σexp(−X̂/λ)로 비용 작은 궤적일수록 큰 비중. 최저 비용 하나만 고르는 게 아니라 좋은 궤적들을 절충해 평균 → 안정적이고 부드러운 제어.
  • 온도 파라미터 λ — 가중치의 날카로움을 조절. 작으면 최저 비용 경로에 몰아줌(공격적), 크면 여러 경로를 부드럽게 섞음(보수적).
  • 모델예측 개념 / 리시딩 호라이즌 (receding horizon) — 미래 n스텝을 계획하되 첫 한 스텝만 적용하고 새 상태에서 다시 계산하는 반복. 예측이 틀려도 매 스텝 보정돼 모델 오차·외란에 강인. 순수 경로적분(한 번 계산해 끝까지 사용)과의 차이. PI + MPC = MPPI.
  • 모델 기반 vs 학습 기반 — 모델 기반(MPC)은 가정한 상황에서 신뢰성 ~100%지만 가정 이탈 시 급락. 학습 기반(RL)은 100% 보장은 아니나 불확실성 속에서도 성능을 부분적으로 유지. 불확실성 0이면 모델 기반, 예측 불가 불확실성이면 모델+학습 결합이 유리.
  • WLR 모델링 핵심 — 바퀴는 "moving point contact"로 다뤄 DOF 증가 없음 + 발에 걸던 롤링 구속(no-slip)을 제거해 바퀴 굴림을 표현. 다리 로봇 대비 오히려 단순해짐. 시험에 "왜 자유도가 안 느는가/롤링 구속을 빼는가"로 출제 가능.
  • 마찰 원뿔 (friction cone) — 접촉력이 이 원뿔 안에 있어야 미끄러지지 않는다는 물리 조건의 기하학적 표현.
  • TD-MPC & 잠재 동역학 (latent dynamics) — 확률적 MPC의 지역 최소점 문제를 RL로 보완. ⑴ 압축된 잠재공간에서 미래 예측(계산 경량화), ⑵ 비용 대신 신경망 가치함수 Q로 장기 가치 평가. 단기는 모델로 굴리고 그 너머는 학습된 Q로 메움(TD=Temporal Difference).
  • MoE (Mixture of Experts) — 상황별 전문가(직선·코너·곡선)를 따로 학습하고 게이팅 네트워크가 가중합. 성격이 다른 주행 구간을 각각 잘 처리.
  • 특권 정보 (privileged state) — 시뮬에선 알지만 실제론 측정 어려운 정보(지면 마찰·지형 높이 등). 학습 땐 활용하되 실전에선 고유수용감각(proprioception)만으로 추정. LSTM이 시계열로 지면 상태 추정을 도움.
  • 비대칭 액터-크리틱 (asymmetric actor-critic, PPO) — 액터(현실 정보만 보는 연기자)와 크리틱(시뮬의 모든 값을 보는 지도교수)이 보는 관측이 다른 구조. Isaac Gym 시뮬에서 학습.
  • 보상 설계 (reward design) — 알고리즘보다 실무에서 가장 중요. 예: 목표 거리 감소 시 +보상, 전복 시 페널티, 도착 시 속도 0 근처면 보상.
  • 커리큘럼 러닝 (curriculum learning) — 쉬운 것부터 단계적 난이도 상승(평지→낮은 턱→높은 턱). 학습 안정화에 필수.
  • Sim-to-Real & 도메인 랜덤화 (domain randomization) — 시뮬-현실 격차(마찰계수·타이어 다이내믹스·타임 딜레이)를 메우기 위해 마찰을 0.9~1.1 등으로 랜덤화해 학습. 현실 이식(transfer) 성능 확보.
공식의 의도

dx_t = f(x_t)dt + G(x_t)u_t dt + B(x_t)dw — 보통의 상태방정식에 위너 노이즈 항을 더해 결정적 모델을 확률적(SDE) 모델로 만드는 것. 수백 개 후보 궤적이 생기는 근원.

V(x_t,t) = min_u E[ E(x_T) + ∫(q + ½uᵀRu)dτ ] — 노이즈로 궤적이 여럿이므로 기댓값으로 평가한 누적 비용을 최소화하려는 것(오차 벌점과 에너지 벌점의 절충).

u*_k ≈ Σ_i w_i v_{k,i}, w_i = exp(−X̂_i/λ)/Σexp(−X̂_n/λ) — MPPI의 결론. 무작위로 뿌린 후보 입력들을 비용 기반 가중치로 가중평균해 최적 제어 하나를 합성하려는 것. 비용 작은 궤적일수록 크게 반영.

V = −λ log Ψ + 가정 λGR⁻¹Gᵀ=BBᵀ — 비선형 HJB를 선형 PDE로 바꿔, 파인만-칵으로 "샘플 궤적 기댓값" 풀이가 가능하게 만드는 결정적 트릭.

Week 5김기섭교수님

04김기섭교수님

전통 SLAM(로컬리제이션+매핑)에서 출발해, 3D 파운데이션 모델·메모리/RAG·VLN(VLA) 세 축으로 재편되는 자율 로봇 내비게이션의 흐름과, 그 진짜 병목이 모델이 아니라 '데이터·평가의 현실성'임을 정리한 회차.
핵심 개념

이 회차의 출발점은 SLAM(Simultaneous Localization And Mapping, 동시 위치추정·지도작성)이다. 로봇이 미지의 공간을 돌아다니며 지도를 만드는 일(mapping)과 그 지도 안에서 자기 위치·자세를 추정하는 일(localization)동시에 푸는 기술이다. '동시에'가 핵심인데, 위치를 알아야 지도를 정확히 쌓고, 지도가 있어야 위치를 추정할 수 있는 닭-달걀 관계이기 때문이다. 청소로봇·드론·물류로봇 등 스스로 움직이는 거의 모든 로봇의 기반이 된다. SLAM의 표면적 출력물은 지도(map)이며 전통적으로 point cloud(점군)나 점유 격자 지도(occupancy grid map)로 표현된다.

SLAM은 처리 방식에 따라 둘로 나뉜다. 오프라인(offline) 방식은 모든 이미지를 모아 시간을 들여 가장 정확한 답을 찾는다 — 대표적으로 COLMAP 같은 SfM(Structure-from-Motion)이 여러 사진만으로 카메라 포즈와 3D 점군을 동시에 복원한다. 반대로 실시간(online) 방식은 로봇이 움직이며 그때그때 처리한다 — 2D LiDAR 스캔을 쌓아 점유 격자 지도를 만드는 Cartographer가 예다. 점유 격자에서 흰색은 자유 공간, 검은색은 장애물, 회색은 미관측 영역이라, 로봇은 '어디가 뚫려 있고 어디를 더 탐사해야 하는지'를 스스로 안다.

지도가 한 번 만들어지면 관심은 매핑에서 로컬리제이션으로 옮겨간다. 사전 지도 위에서 내 포즈만 정밀 보정하면 되기 때문에 훨씬 가볍고 정밀해진다. 이때 누적되는 위치 오차(drift)를 보정하는 핵심 기법이 루프 클로징(loop closure)으로, 예전에 왔던 곳에 다시 도착했음을 인식해 그동안 쌓인 오차를 한꺼번에 펴준다("한 바퀴 돌아왔는데 시작점과 거의 일치"). 센서로 본 포인트를 포즈로 월드 프레임(world frame, 지도 좌표계)으로 변환했을 때 사전 지도와 딱 겹친다는 것이 곧 포즈가 정확하다는 증거다. cm 단위 정밀 위치추정은 공장·항만처럼 환경이 고정된 곳에서 특히 유용하며, 반대로 공도 자율주행(테슬라류)은 도로 전체의 사전지도를 깔 수 없어 이 방식을 쓰지 않는다.

전통 내비게이션 스택은 가로축=동작 주파수(O(1Hz) 전역·느림 ↔ O(100Hz) 즉각 제어·빠름)와 세로축=계층(Planning/Control → Mapping → State Estimation)으로 정리된다. 직관은 "위는 느리고 똑똑(어디로 갈지 전역 판단), 아래는 빠르고 단순(발 딛고 균형 잡는 제어)"이다. 센서는 고유수용감각(Proprioception)(관절각·IMU 등 자기 상태)과 외수용감각(Exteroception)(LiDAR·카메라 등 외부 환경)으로 나뉜다. 최근 흐름은 이 전통 스택의 많은 모듈이 사라지고 파운데이션 모델로 흡수·재해석되는 것이며, 구체적으로 세 자리가 바뀐다 — 전역 지도/위치추정 → 3D 파운데이션 모델, 중앙 추론 → 메모리(VLM reasoning), 전역 계획 → VLN(End2End Navigation Policy).

첫째 축인 3D 파운데이션 모델(3D Foundation Model)의 효시는 DUSt3R다. 이미지를 ViT(Vision Transformer) 패치 피처로 뽑고 디코더를 붙여, 보정(calibration) 정보 없이 이미지 한두 장만으로 픽셀마다의 3D 좌표(point map)를 한 번의 신경망 통과(feed-forward)로 출력한다. 이는 카메라 시점의 Z값일 뿐인 Depth 이미지와 다르다. '거대 데이터로 미리 학습해 실내·실외 가리지 않고 보정 없이 동작하는 범용성' 때문에 파운데이션 모델이라 부른다. 이를 멀티로봇 협업 SLAM(Multi-robot Collaborative SLAM)으로 확장하면, 처음엔 각자 자기 원점에서 시작한 로봇들이 장소 재인식(place recognition)으로 "내 여기가 네 여기"임을 알아채고 좌표 정렬(coordinate alignment)한다. 단안 카메라의 근본 한계인 스케일 모호성(scale ambiguity)(작은 물체를 가까이 vs 큰 물체를 멀리 구분 불가) 때문에, 시작 스케일을 1로 잡고 로봇 간 스케일을 일관(consistent)되게 맞춰주는 스케일 정렬이 핵심이다. 정리하면 '장소 재인식 → 좌표 정렬 → 스케일 정렬'의 3단계이며, 이종 플랫폼(다리형·바퀴형·핸드헬드)이라도 프론트엔드별 백엔드 수정 없이 공통 백엔드가 융합한다는 확장성이 강점이다.

둘째 축은 메모리(Memory)다. 요즘 카메라만으로도 오도메트리(odometry, 자기 위치 추정)가 잘 나와 '포즈 + 그 포즈에서 본 이미지 + 시간'을 손쉽게 정렬할 수 있다. 이 스트림을 비디오 요약 VLM에 넣어 구간별 캡션("여기에 무엇이 있다, 낮/밤")을 만들고 포즈 XYZ·시간을 메타데이터로 붙이면 JSON 형태의 DB, 곧 '경험'이 된다. 로보틱스가 원래 쓰던 수학적 맵(mesh·point cloud) 대신, 센서 데이터를 임베딩·텍스트화해 DB에 넣은 것을 LLM 진영이 '메모리'라 부르는 것이다. 여기에 RAG(Retrieval-Augmented Generation, 검색 증강 생성)를 붙인다. 사람이 맥락 없이 "벤치 어디야?"라고 물어도, RAG가 질문 맥락(내가 누구·어디 있는지)을 DB에서 꺼내 입력을 증강하고, LLM을 추가 학습시키지 않고 증강된 입력만 넣어 텍스트(위치 XYZ + 그 이유)를 받는다. 대표 사례가 ReMEmbR이며, 단 목표 지점까지 실제 이동은 전통 플래너(A* 등)에 의존한다는 한계가 있다. 발전형인 롱텀 내비게이션 메모리(Long-term Navigation Memory)는 환경 변화를 시간축으로 기억해(APPEAR/DISAPPEAR/MOVE/RE-APPEAR 등) 롱텀 질의에 답한다. 중요한 설계 원칙은 DB에 넣는 건 "세션1엔 여기, 세션2엔 저기"라는 객관적 사실(재료)일 뿐, "그게 이동했다"는 추론(reasoning)은 LLM이 매번 만든다는 점이다 — 결론을 미리 박아두면 새 질문에 유연하게 답할 수 없기 때문이다.

셋째 축은 VLN(Visual-Language Navigation) = 내비게이션용 VLA(Vision-Language-Action)다(Action을 떼면 VLN). 앞선 기법들이 인식·추론은 잘해도 '그래서 어떻게 가게 하느냐'는 결국 손으로 짠 플래너에 매여 있었고, 이를 데이터로 학습한 것이 End-to-end Navigation Policy다. 사람 지시 + (옵션)전역 지도 + 현재 영상을 모두 토큰화해 큰 네트워크에 넣고 액션을 뽑는다. 인지심리학의 System 1/2에 빗댄 빠른 사고(Fast)=웨이포인트 즉각 생성 / 느린 사고(Slow)=전역 경로 계획 구조를 쓰며, 최근 π0.5액션 익스퍼트(Action Expert)를 따로 두고 플로우 매칭(flow matching)으로 연속 행동을 생성해, "왼쪽/오른쪽"을 생토큰으로 뱉던 방식보다 일반화를 크게 높였다. 그러나 진짜 병목은 모델이 아니라 데이터다. 챗봇은 인터넷 전체를 봤지만 VLN은 시뮬레이터에서 수천 개, sim2real 갭 때문에 실제 환경에서 몇 개 더 모으는 수준이라 데이터가 절대적으로 부족하다. 그래서 "잘 된다"는 논문은 배포 코드를 공개 안 하거나 데모가 1분 이내·단순 환경인 경향이 있다 — 파운데이션 모델 성능은 결국 데이터를 따라가기 때문이다.

마지막으로 이 모든 문제는 수학적으로 이종 모달리티 매칭(heterogeneous modality matching)으로 환원된다. 일반 VLA가 '이미지+지시 → 액션'이라면, 텍스트 기반 라이다 장소 인식(text-based LiDAR place recognition)은 '자연어 지시 → 라이다 포인트'를 맞히는 문제다("회색 도로 위, 옆에 작은 기둥, 서쪽에 인도 → 어디?"). 형식이 전혀 다른 텍스트와 점군이라도 같은 장소면 공통 의미 공간에서 가깝게 정렬되어야 한다. 향후 방향은 둘이다 — ① 다중 자율 모빌리티가 메모리를 증강하며 암묵적 인간 지시까지 이해·상호작용하는 기술, ② 정밀 지도 대신 사람이 보는 약도(sketch map)를 입력으로 삼는 point-to-language grounded navigation(사람이 약도만 보고 길 찾듯).

시험 포인트
  • SLAM (Simultaneous Localization And Mapping) — 위치추정과 지도작성을 동시에 푸는 기술. '동시에'가 핵심(둘이 서로를 필요로 하는 상호의존). 거의 모든 자율 로봇의 기반이라 정의·구성요소를 묻는 단골 출제 대상.
  • Localization vs Mapping — 로컬리제이션은 로봇의 포즈(pose, 위치·자세) 추정, 매핑은 지도 생성. 지도가 완성된 뒤엔 매핑→로컬리제이션으로 관심이 이동(사전지도 위 포즈 보정만 하면 가볍고 정밀). A vs B 구분 포인트.
  • Offline SLAM (COLMAP / SfM) — 이미지를 모두 모아 시간을 들여 가장 정확히 복원하는 방식. SfM(Structure-from-Motion)은 여러 사진만으로 카메라 포즈+3D 점군을 동시 복원. 이미지만 써서 문제는 어렵지만 정확도 우선.
  • Online/Real-time SLAM (Cartographer) — 로봇이 움직이며 2D LiDAR 스캔을 실시간으로 쌓아 지도 생성. 오프라인과의 대비(정확도 vs 실시간성)가 시험 포인트.
  • Occupancy Grid Map (점유 격자 지도) — 공간을 칸으로 나눠 각 칸을 '비었다(흰)/막혔다(검)/모른다(회)'로 분류. 로봇이 통행 가능 영역·미탐사 영역을 스스로 판단하게 해줌.
  • Point Cloud (점군) — SLAM의 전통적 지도 표현(XYZ 3D 점들). 강의의 문제의식: '지도가 꼭 점군이어야 하나? 사람은 점군 없이도 공간을 이해' → 공간 표현(representation) 자체를 새로 고민.
  • Loop Closure / Loop Closing (루프 클로징) — 예전 방문 지점을 다시 인식해 누적 오차(drift)를 한꺼번에 보정. "한 바퀴 돌아오니 시작점과 거의 일치"의 원리. 멀티로봇에서는 로봇 사이에서 일어나(inter-agent loop closure) 서로의 지도를 묶음.
  • World Frame (월드 프레임, 지도 좌표계) — 센서 포인트를 포즈로 변환해 넣는 기준 좌표계. 변환 결과가 사전지도와 딱 겹치면 포즈가 정확하다는 증거.
  • 전통 내비게이션 스택의 두 축 — 가로축=동작 주파수 O(1Hz)(전역·느림) ~ O(100Hz)(제어·빠름), 세로축=계층(Planning/Control·Mapping·State Estimation). "위는 느리고 똑똑, 아래는 빠르고 단순" 직관을 묻기 좋음.
  • Proprioception vs Exteroception — 고유수용감각(관절각·IMU 등 자기 상태) vs 외수용감각(LiDAR·카메라 등 외부 환경). 센서 분류 A vs B.
  • 3D Foundation Model / DUSt3R — 보정 없이 이미지 한두 장을 feed-forward로 통과시켜 픽셀별 3D 좌표(point map)를 출력. 거대 데이터 사전학습으로 환경 불문 범용성을 가져 '파운데이션'이라 부름.
  • Feed-forward & Point Map vs Depth Image — feed-forward는 신경망 1회 통과(기하 최적화 반복 없이). point map은 픽셀별 3D 좌표, depth는 카메라 시점의 Z값일 뿐 — 이 차이 구분이 출제 포인트.
  • Scale Ambiguity (스케일 모호성) — 단안 카메라의 근본 한계(작은 것 가까이 vs 큰 것 멀리 구분 불가). 시작 스케일을 1로 잡고 로봇 간 일관되게 맞추는 스케일 정렬이 멀티로봇 SLAM의 핵심.
  • Multi-robot Collaborative SLAM & 3단계 — 각자 원점에서 시작 → place recognition(장소 재인식)coordinate alignment(좌표 정렬)scale alignment(스케일 정렬)로 하나의 지도로 융합. 이종 플랫폼도 백엔드 수정 없이 통합되는 확장성이 장점.
  • Front-end vs Back-end (SLAM 용어) — 프론트엔드=각 로봇이 센서로 즉석에서 포즈·특징 추출, 백엔드=모아서 전역 최적화(루프 클로저·번들조정). "백엔드 수정 불필요"=이종 로봇을 공통 백엔드가 그대로 융합.
  • Memory (메모리) — 로봇 센서 데이터를 임베딩·텍스트화해 DB(JSON)에 넣은 것. 로보틱스의 수학적 '맵(point cloud/mesh)'과 대비되는 LLM식 표현. 큰 공간에서 drift 부담을 줄이는 영리한 대안.
  • RAG (Retrieval-Augmented Generation, 검색 증강 생성) — 외부 DB에서 관련 자료를 검색해 프롬프트에 붙여 답하게 하는 방식. LLM을 재학습하지 않고 입력만 증강. '언제 DB에서 꺼내 컨텍스트에 넣을지'를 결정하는 역할.
  • 재료(fact) vs 추론(reasoning) 분리 원칙 — DB엔 "세션별 위치 사실"만 넣고, "이동했다" 같은 결론은 LLM이 매번 추론. 결론을 미리 박으면 새 질문에 유연 대응 불가. 롱텀 메모리 설계의 핵심 이유(why).
  • ReMEmbR & Long-term Navigation Memory — 롱텀 공간-시간 메모리로 질의응답. 변화 유형(APPEAR/DISAPPEAR/MOVE/RE-APPEAR/NONE/Compound)을 시간축으로 기억. 단 실제 이동 경로는 전통 플래너 의존이라는 한계.
  • VLA (Vision-Language-Action) / VLN (Visual-Language Navigation) — 영상+언어를 받아 로봇 행동을 출력하는 최신 모델 계열. 내비게이션에선 Action을 떼고 VLN. 입력(지시·지도·영상)을 토큰화해 End-to-end로 액션 학습.
  • Fast vs Slow Thinking (System 1 / 2) — 느린 사고=전역 경로 계획(Global), 빠른 사고=다음 몇 스텝 웨이포인트 즉각 생성(Local). 인지심리학 비유를 묻기 좋음.
  • Action Expert & Flow Matching (π0.5) — 행동을 생토큰("왼/오")으로 뱉던 방식 대신 연속 행동을 확률 흐름으로 생성하는 전용 모듈. 동작 일반화(generality)를 크게 향상.
  • 데이터 병목 & sim2real gap — VLN의 진짜 한계는 모델이 아니라 데이터 부족. 시뮬레이터 데이터와 실제 환경의 격차가 sim2real gap. "잘 된다는 논문은 배포코드 비공개·1분 데모" 편향도 데이터 편향의 결과.
  • Heterogeneous Modality Matching & Text-based LiDAR Place Recognition — 형식이 다른 모달리티(자연어↔라이다 점군)를 공통 의미공간에서 정렬하는 문제. '지시→라이다 포인트' 맞히기. 사람-로봇 대화의 수학적 환원.
  • Point-to-language grounded navigation (약도형 내비게이션) — 정밀 지도 없이 사람이 쓰는 약도(sketch map)를 입력 삼아 목적지를 찾아가게 하는 인터페이스 연구. "사람은 약도만 봐도 잘 오니 로봇도 그렇게"라는 발상.
  • Digital Twin / Multi-Hypothesis Problem / Social Navigation — 디지털 트윈=실제 공간을 가상에 복제한 모형(로봇 위치·계획의 토대). 멀티-가설=의도가 불명확해 여러 가능성을 동시에 유지하다 관찰·대화로 좁힘. 소셜 내비게이션=최단경로가 아닌 사람의 상태·의도·사회적 맥락을 고려한 길안내.
Week 6황유상펠로우님

05황유상펠로우님

반도체는 사람의 뇌(센싱·연산·기억)를 흉내 내는 부품이며, 미세화(무어의 법칙)가 한계에 이른 지금 산업의 무게중심은 '데이터 중심'으로 옮겨가 메모리·패키징·3D 구조가 부상하고, 그 종착점은 저전력·실시간·내구성을 갖춘 로봇(피지컬 AI)용 반도체다.
핵심 개념

반도체는 결국 사람의 뇌를 흉내 내는 부품이라는 관점에서 출발한다. 뇌의 기능을 센싱(감각)·프로세싱(사고)·저장(기억)으로 나누면 각 기능마다 전용 반도체가 대응한다 — 센싱은 이미지 센서·LiDAR·DVS(Dynamic Vision Sensor, 변화가 생긴 픽셀만 알려 저전력·고속), 프로세싱은 CPU·GPU·NPU, 저장은 메모리·스토리지다. 여기서 반드시 구분할 개념이 메모리(Memory) vs 스토리지(Storage)다. 메모리(DRAM)는 작업 중 데이터를 잠시 담는 임시 기억(책상 위 작업 공간)으로 전원이 꺼지면 사라지고, 스토리지는 전원이 꺼져도 남는 영구 기억(책장, 게임의 '세이브')이다. SSD는 NAND로 만들며 두 성격을 함께 갖는다.

반도체 산업의 비즈니스 모델은 셋으로 나뉜다. 팹리스(Fabless)는 설계만(NVIDIA·Apple·Qualcomm), 파운드리(Foundry)는 위탁 제조만(TSMC), IDM(Integrated Device Manufacturer)은 설계·제조를 모두 한다(Intel·삼성 메모리). 기술 계층은 아래에서 위로 소재·장비 → 단위공정 → CMOS FET → 표준셀 → IP/Block → SoC로 쌓이며, 아래일수록 설비·투자 집약적(무겁고), 위일수록 설계·IP 집약적(가볍다). 이 구조가 산업의 '천문학적 투자·높은 리스크'의 출발점이다.

반도체 산업의 본질적 특성은 PPAC로 요약된다 — Power(전력↓)·Performance(성능↑)·Area(면적↓)·Cost(비용↓)를 미세화(scaling)로 한꺼번에 개선한다. 핵심 직관은 "가격이 계속 떨어지는데도 돈을 버는" 구조다. 미세화하면 같은 웨이퍼에서 더 많은 칩을 찍어 칩당 원가가 떨어지므로, 남보다 먼저 미세화에 성공해 가격을 내리는 기업이 마진을 지키고 시장을 선점한다. 동시에 라인 하나 짓는 데 약 5조 원(향후 7~8조)이 드는 초고투자 산업이라, 투자 판단 실패가 곧 회사 존립을 위협한다.

산업의 키워드는 컴퓨터 중심(Compute-centric)에서 데이터 중심(Data-centric)으로 이동했다. AI·5G·자율주행·데이터센터가 쏟아내는 데이터가 폭증(이른바 Memory Big Bang)하면서, "얼마나 빨리 계산하느냐"보다 "막대한 데이터를 어떻게 담고 옮기느냐"가 성능을 결정하게 됐다. 상징적 사례가 알파고다 — 일반 PC는 메모리 비용이 CPU의 약 1/10이지만, 알파고 시스템에선 메모리 비용이 CPU의 약 1.5배로 역전됐다. "인공지능 파워 = 연산력 × 메모리 용량"이라는 직관처럼, AI 시대에 메모리가 가장 돈 되는 비즈니스로 떠올랐다(HBM이 그 수혜).

그러나 물리적 미세화는 한계에 도달해 무어의 법칙(Moore's Law)은 사실상 종료됐다. 5/4/3nm는 실제 치수가 아니라 마케팅상 '이펙티브(effective)' 명칭일 뿐 실제 디멘션은 여전히 10nm 이상이다. 이후 기술은 두 갈래로 갈린다 — 기존 미세화를 연장하는 More Moore(거의 마무리 단계)와, 방향을 틀어 기능을 다각화하고 칩을 적층·조립하는 More than Moore(HBM·3D 적층·어드밴스드 패키징·Emerging Memory). 막힌 한 축 대신 다른 축으로 성장 동력을 옮긴 것이다.

이 흐름의 정점이 로봇(피지컬 AI)이다. 로봇은 고정 기계에서 스스로 판단하는 자율 에이전트(autonomous agent)로 진화하며 휴머노이드로 수렴한다. 로봇을 신체에 빗대면 두뇌=NPU/GPU(연산·SLAM), 감각=CIS/LiDAR/Radar(3D 인식), 심장=PMIC(전력관리, 가동시간의 핵심), 근육=MCU·모터 드라이버·MEMS(전기→운동)다. 핵심은 엣지 브레인(Edge Brain) — 클라우드에 의존하면 통신 지연·단절·보안 취약이 생기므로 연산을 기기 안(온디바이스)에 심어야 한다. 그래서 휴머노이드용 반도체의 '생존 조건'은 초저전력(약 5W)·실시간·내구성 세 가지다.

이 세 조건을 막는 근본 원인이 폰 노이만(Von Neumann) 구조다. 연산(CPU)과 메모리가 떨어져 있어 데이터를 끊임없이 실어 나르며 전력·지연을 소모한다("폰 노이만 병목"). 해법은 "데이터를 옮기지 말고 연산을 데이터 옆으로 가져가라"이며, 거리에 따라 단계가 나뉜다 — 현재의 HBM(통로 IO를 1024개로 늘려 이동만 빠르게) → PNM(메모리 옆) → PIM(메모리 안) → CIM(같은 소자에서 저장·연산 통합) → Brain-like(뇌처럼 한 몸). HBM은 별도 메모리가 아니라 DRAM을 TSV(Through Silicon Via, 수직 관통 배선)로 쌓은 것으로, 핀당 속도는 낮춰 전력을 줄이는 대신 IO를 1024개 이상으로 늘려 고대역폭·저전력을 동시에 달성한다(다만 적층으로 칩이 커지고 인터포저 탓에 단가가 높음).

소자 차원의 진화는 PPA를 평면에서 막히면 3차원 공간으로 우회하는 공통 전략이다. Performance는 신소재·스트레스 엔지니어링에서 3D 구조로(숏채널 이펙트 극복), Power는 게이트 제어력 향상으로 — 게이트가 채널을 감싸는 면이 1면(Planar)→3면(FinFET)→4면(GAAFET/MBCFET 나노시트)으로 늘수록 누설을 억제하고 문턱전압(Vth)을 낮춰 동작 전압·전력을 줄인다. Area는 전원선을 웨이퍼 뒷면으로 옮기는 BSPDN(Back-Side Power Delivery Network)으로, Cost는 수평 미세화 대신 수직으로 쌓는 3D NAND(200단 이상, 비트당 비용↓)로 개선한다.

시험 포인트
  • 메모리 vs 스토리지(Memory vs Storage) — 메모리(DRAM)는 작업 중 데이터를 담는 휘발성 임시 기억, 스토리지는 전원이 꺼져도 남는 비휘발성 영구 기억. 'A vs B' 구분 문제로 출제되기 쉬움. SSD는 NAND 기반으로 두 성격을 겸함.
  • DVS(Dynamic Vision Sensor) — 매 프레임 전체를 찍지 않고 '변화한 픽셀'만 출력하는 센서. 저전력·고속이라 로봇·자율주행 실시간 응용에 유리.
  • 팹리스/파운드리/IDM — 설계 전문(NVIDIA·Apple) / 위탁 제조 전문(TSMC) / 설계+제조 통합(Intel·삼성 메모리). 대표 기업과 함께 묻기 쉬움.
  • SoC 기술 계층 — 소재·장비→단위공정→CMOS FET→표준셀→IP/Block→SoC. 아래일수록 투자집약(무겁고), 위일수록 설계집약(가볍다).
  • PPAC — Power(전력↓)·Performance(성능↑)·Area(면적↓)·Cost(비용↓). 미세화로 동시에 추구하는 4대 목표. 가장 빈출 약어.
  • 스케일링(Scaling)으로 돈 버는 원리 — 미세화 → 웨이퍼당 칩 수↑ → 칩당 원가↓. 가격이 떨어져도 원가를 더 빨리 내린 기업이 승리.
  • Compute-centric → Data-centric — 산업 무게중심이 '빠른 연산'에서 '대량 데이터 처리·저장'으로 이동. Memory Big Bang(메모리 수요 폭발)의 배경.
  • 알파고 사례 — 일반 PC는 메모리 비용이 CPU의 ~1/10, 알파고는 메모리가 CPU의 ~1.5배로 역전. "AI 파워 = 연산력 × 메모리 용량"의 근거이자 AI 시대 메모리 부상의 상징.
  • 무어의 법칙(Moore's Law)과 종료 — 2년마다 칩당 트랜지스터 2배. 5/4/3nm는 실제 치수가 아닌 '이펙티브' 마케팅 명칭(실제는 10nm 이상)이라는 점이 함정 포인트.
  • More Moore vs More than Moore — 전자는 미세화를 수직으로 더 깊이(거의 종료), 후자는 옆으로 틀어 기능 다각화·적층·패키징(HBM·3D NAND·Emerging Memory). 'A vs B' 비교 출제.
  • 엣지 브레인(Edge Brain) / 온디바이스 — 연산을 기기 내부로 옮김. 클라우드 의존의 3대 문제(지연·단절·보안)를 해결. 엣지=현장, 클라우드=원격 데이터센터.
  • 휴머노이드 반도체 생존 조건 — 초저전력(약 5W, 휴대폰 충전 수준)·실시간(지연 없는 즉응)·내구성. 하나라도 못 맞추면 실용화 불가.
  • 로봇의 반도체 매핑 — 두뇌=NPU/GPU(연산·SLAM), 감각=CIS/LiDAR/Radar, 심장=PMIC(전력관리), 근육=MCU·모터 드라이버·MEMS.
  • 폰 노이만 병목(Von Neumann Bottleneck) — 연산-메모리 분리로 데이터 이동에 전력·지연 소모. "데이터를 옮기지 말고 연산을 데이터 옆으로"가 모든 차세대 구조의 공통 발상.
  • 아키텍처 진화 순서 — HBM(IO 확대) → PNM(메모리 옆) → PIM(메모리 안) → CIM(같은 칩 통합) → Brain-like(뇌처럼 한 몸). 순서·정의 매칭 빈출.
  • HBM(High Bandwidth Memory) — DRAM을 TSV로 적층한 메모리. 핀당 속도는 낮추고 IO를 1024개 이상으로 늘려 저전력+고대역폭 달성. 단점: 칩 크기↑(웨이퍼당 생산↓), 다단 적층 단가↑, 인터포저 비용↑.
  • TSV / 인터포저 — TSV(Through Silicon Via)는 칩을 수직 관통해 위아래를 잇는 구리 배선(HBM 적층의 핵심). 인터포저는 미세 배선을 위한 실리콘 기판으로 제작 난이도·비용이 높음.
  • Why HBM — 딥러닝은 대역폭·용량이 곧 성능. GDDR6 12개(24GB/768GB/s)보다 HBM3E 4개(144GB/4710GB/s)가 압도적 → AI 가속기엔 사실상 필수. 미래 HBM4는 IO 2048개·핀당 속도 인하, HBM5/6은 광배선·하이브리드 본딩.
  • Low Voltage Swing / VDDQ 인하 — 신호 전압 진폭(스윙)을 줄여 전력 절감. HBM 세대마다 VDDQ가 1.2V→0.4V로 하락하는 저전력 설계.
  • PNM(Processing Near Memory) — 연산기를 메모리 '근처'(컨트롤러·패키지)에 배치하는 절충안. 메모리 칩은 거의 안 건드림. CXL 확장 메모리에서 효과적.
  • CXL(Compute Express Link) — CPU·GPU·메모리를 잇는 표준 인터페이스, 메모리 풀링(카드처럼 확장) 가능. PNM의 무대.
  • PIM(Processing In Memory) — 메모리 칩 내부에 연산 회로 삽입. Bank-level Parallelism으로 유효 대역폭 4~8배, 시스템 성능 2배·에너지 70% 수준. 단점: 메모리·로직 공정 통합 난이도. 메모리 바운드(Memory-Bound) 연산(AI 행렬·벡터)에 특화.
  • NPU(Neural Processing Unit) — 행렬 곱셈·딥러닝에 특화, 군더더기를 제거해 압도적 전성비. 연산 모듈마다 On-chip Memory 내장. GPU=학습(training) 강점, NPU=추론(inference) 강점.
  • 뉴로모픽(Neuromorphic) — 뇌의 뉴런·시냅스를 실리콘으로 모사, 연산·저장 미분리. 시냅스 연결 강도를 저항성 메모리(ReRAM·PRAM·MRAM·FeRAM)의 가변 전도도로 구현. 초저전력이나 범용 연산엔 부적합.
  • 이종 컴퓨팅(Heterogeneous Computing) — CPU(복잡 제어)·GPU(병렬 학습)·NPU(실시간 추론)를 한 SoC에 통합해 워크로드별 역할 분담. 무어의 법칙 둔화 후 패키징·구조로 성능을 올리는 More than Moore 흐름과 연결.
  • 3D 채널 구조: Planar→FinFET→GAAFET(MBCFET) — 게이트가 채널을 감싸는 면이 1→3→4면으로 늘수록 게이트 제어력↑ → 누설↓, Vth↓ → 동작전압·전력↓. (호스를 손가락 하나보다 손 전체로 쥐면 더 잘 통제) 삼성: 3nm MBCFET.
  • BSPDN(Back-Side Power Delivery Network) — 전원선을 웨이퍼 뒷면으로 이동, 앞면엔 신호선만 남겨 면적(Area) 절감. 삼성 2nm 적용. PPA 중 Area 해법.
  • 3D NAND — 셀을 수직 적층(200단↑)해 비트당 비용↓. 수평 미세화의 셀 간섭 한계를 우회. 깊은 채널 홀 가공·균일 충전 등 공정 난이도·수율이 과제. DRAM도 3D DRAM으로 같은 방향 연구.
  • 숏채널 이펙트(Short-Channel Effect) — 채널이 20nm 이하로 짧아지면 게이트가 채널을 제대로 못 잡는 현상. 평면 미세화의 한계이자 3D 구조 전환의 직접 원인.
  • 로봇 Co-Roadmap 3단계 — Automated(자동화, CPU/GPU) → Autonomous(자율화, NPU/온디바이스 AI) → Social & Collaborative(상호작용, 뉴로모픽). 단계 상승에 따라 요구 반도체가 고도화.
공식의 의도

인공지능 파워 = 연산력 × 메모리 용량 — AI 성능이 빠른 연산만으로 결정되지 않고, 처리할 데이터를 담아 둘 메모리 용량에 동등하게 좌우됨을 강조하는 식. AI 시대에 메모리가 핵심 비즈니스로 부상하는 이유를 설명한다(알파고에서 메모리 비용이 CPU를 역전).

Week 7서정욱교수님

06서정욱교수님

"더 센 모터·제어로 밀어붙이기 전에, 기구 설계로 애초에 필요한 힘·에너지를 줄이자" — 생체모방 3대 설계 원리(중심부 구동·구동기 협응·탄성 활용)를 케이블 구동 수술 로봇·웨어러블 로봇·중력보상 기구로 구현해 온 흐름.
핵심 개념

이 강의의 핵심 관점은 로봇의 성능·효율을 제어(control)나 AI의 문제가 아니라 기구 설계(mechanism design)의 문제로 본다는 것입니다. 그 출발점이 생체모방(bio-mimetics)으로, "왜 자연은 더 큰 모터를 선택하지 않았을까?"라는 질문에서 세 가지 설계 원리를 끌어냅니다. 즉 더 강한 로봇이 아니라 더 유리한 구조를 가진 로봇을 지향합니다.

원리 1 — 큰 구동기는 중심부에, 말단은 가볍게. 사람은 손가락 근육을 손바닥이 아니라 전완(팔뚝)에 두고 힘줄(tendon)로 운동을 원격 전달합니다. 이렇게 무거운 구동 요소를 근위부(proximal)에 모으면 전체 무게가 같아도 관성 모멘트(moment of inertia)가 줄어듭니다. 관성 모멘트는 질량이 회전축에서 멀수록 커지므로(거리²에 비례), 말단을 가볍게 하면 가속·감속 부담이 줄어 민첩성과 정밀 제어에 유리합니다. 로봇에서는 케이블 원격구동(remote cable actuation)으로 이 이점을 얻습니다.

원리 2 — 모든 관절을 독립적으로 구동하지 않는다. 자연은 자유도(DOF)를 1:1로 구동하지 않고 기능적으로 함께 움직이는 관절을 묶습니다(여러 손가락을 하나의 근육원으로 구동, 고관절·슬관절을 동시에 가로지르는 이관절 근육(biarticular muscle)). 이를 로봇으로 옮긴 것이 부족구동(underactuation)과 병렬기구로, 구동기 수와 제어 복잡도를 줄이면서 구조 자체에 기능적 협응(functional coupling)을 내장합니다.

원리 3 — 모든 운동을 능동적으로 하지 않는다. 힘줄은 생물학적 스프링처럼 작동해, 하중이 걸릴 때 탄성 에너지(elastic energy)를 저장했다가 추진 구간에서 폭발적으로 방출합니다(에너지 회수). 이렇게 수동(passive) 요소를 쓰면 적은 에너지로 비슷한 운동·순간 출력을 냅니다. 단, 스프링은 근육을 보조·재활용할 뿐 대체하지는 않습니다. 로봇에서는 관절에 스프링을 직렬로 넣은 탄성 구동기(SEA, Series Elastic Actuator)가 이 원리에 해당합니다.

이 원리들은 먼저 수술 로봇에서 구현됩니다. 복강경 수술(laparoscopy)은 막대 도구를 구멍에 끼워 자유도가 2개 부족해지므로 도구 끝에 관절 2개를 더해 보완하고, 의사 손동작은 원격조작(teleoperation)·마스터-매니퓰레이터로 전달합니다. 수술은 개복(incision) → 복강경 → 단일공(SPL, Single Port) → 자연 통로로 들어가 흉터를 남기지 않는 NOTES로 진화하며, 뒤로 갈수록 도구가 가늘고 유연해야 합니다. 그래서 핵심은 "가느다란 유연 관절을 어떻게 만드느냐"입니다.

그 해법이 PREF 관절(Pulleyless Rolling Joint with Elastic Fixtures)입니다. 직경 5mm급에서는 풀리를 넣을 공간이 없고 핀 관절은 케이블 장력 안정성이 떨어집니다. 구름 접촉(rolling contact)으로 두 톱니가 맞물려 굴러가면 케이블이 감기는 유효 반경이 일정해져 장력이 안정되고, 가운데를 비워 말단 구동용 채널도 확보됩니다. 핵심 설계 변수는 톱니 반경 R과 높이 B이며, R ≥ B일 때 안정합니다. 단일 관절은 1자유도뿐이라 여러 개를 직렬 적층(serial stacking)해 부드러운 굽힘을 만드는데, 핀 관절로 쌓으면 좌굴(buckling)이 생기지만 구름 방식은 이를 해결합니다. 다만 굽힐 때와 펼 때 자세가 다른 히스테리시스(hysteresis)가 마찰로 인해 생깁니다. 좌우·상하 관절을 교대 적층(Y-P 순서)하면 등방성 굽힘(isotropic bending)을 얻어 운동학이 단순해집니다.

같은 케이블 구동·롤링 관절 원리가 웨어러블 로봇으로 확장됩니다. 핵심 트릭은 비아조인트(via-joint)에서 케이블을 두 아이들 풀리에 대각선으로 교차 통과시켜 총 케이블 길이를 보존하는 것으로, 중간 관절이 어떻게 움직이든 말단 관절에 영향이 없는 디커플링(decoupling)을 만듭니다(실험상 타 케이블 장력 변동 ±0.8N 이내). 웨어러블의 고질병은 사람 관절축과 로봇 관절축이 어긋나는 관절 불일치(joint misalignment)로, 강체끼리 어긋난 채 묶이면 과구속(over-constraint)이 생겨 부하가 걸립니다. 그래서 수동으로 따라 구르는 idle(자유) 관절로 어긋남을 흡수해 자기정렬(self-aligning)을 구현하고, 사람 관절에 무부하가 되도록 합니다.

구동부의 핵심은 장력 증폭(tension amplification)편심 스프링(eccentric spring)입니다. 뒤쪽 어시스트 모터는 높은 감속비로 스프링을 미리 당겨 버티고, 앞쪽 드라이브 모터는 작고 섬세한 움직임만 담당합니다. 스프링을 회전축에서 편심되게 달면 특정 자세에서 스프링 토크가 중력 토크를 정확히 상쇄해 모멘트가 0이 되어, 자세 유지에 전류가 거의 들지 않습니다(에너지 효율↑, 소형 배터리 가능). 이것이 중력보상(gravity compensation)의 발상이며, 작업·사용자별로 보조력을 조절하는 Free Mode로 이어집니다. 더 나아가 모터 없이 캠 풀리·짐벌·무게추만으로 위치 3자유도·자세 3자유도를 받쳐 주는 순수 기구적 중력보상도 다룹니다.

마지막으로 모바일 로봇 조향에서, 바퀴마다 구동·조향 모터를 두어 모터 8개를 쓰는 4륜 조향 대신, 링크 구조로 네 바퀴가 공통 회전 중심을 공유하게 하는 애커만 조향(Ackermann steering)이 더 단순·경제적 대안으로 제시됩니다. 회전 시 안·바깥 바퀴의 회전 반지름이 다르므로 각도를 달리 꺾어 미끄러짐을 없애는 기하학입니다.

시험 포인트
  • 생체모방 (bio-mimetics) — 인체·동물 구조에서 로봇 설계 힌트를 얻는 접근. 이 강의 3대 원리의 출발점으로, "왜 자연은 더 큰 모터를 안 썼나"라는 질문이 핵심.
  • 관성 모멘트 (moment of inertia) — 회전 운동의 관성. 질량이 회전축에서 멀수록(거리²에 비례) 커짐. 말단 경량화가 왜 민첩성·효율에 유리한지를 설명하는 핵심 개념 → 출제 1순위.
  • 근위부/말단부 (proximal / distal) — 중심부(근위)에 큰 구동 요소를 모으고 말단은 가볍게. 힘줄/케이블로 원격 전달하는 설계 원리 1의 핵심 대비.
  • 힘줄·텐던 전달 (tendon transmission) — 구동기와 분리된 채 운동을 원격 전달. 로봇에서는 케이블 구동에 대응.
  • 기능적 협응 (functional coupling) vs 독립 구동 (independent actuation) — 자연은 1:1 독립 구동 대신 관절을 묶어 협응. 적은 구동기로 풍부한 움직임을 만드는 원리 2.
  • 이관절 근육 (biarticular muscle) — 고관절·슬관절 두 관절을 동시에 가로지르는 근육. 자연의 커플링 구동 예시.
  • 부족구동 (underactuation) — 구동기 수 < 전체 자유도 수. 가볍고 저렴하나 움직임이 묶여 협응을 설계로 잘 짜야 함. 완전구동(full actuation)과 대비. 로봇 그리퍼가 대표 응용.
  • 탄성 에너지 저장·방출 (elastic energy storage & return) — 힘줄을 생물학적 스프링으로 활용해 에너지 회수, 순간 출력·반복 효율 향상. 단, 근육 대체는 아님(보조·재활용).
  • SEA (Series Elastic Actuator) — 모터와 부하 사이에 스프링을 직렬로 넣은 탄성 구동기. 충격 흡수·에너지 효율. 본 강의 편심 스프링 구동기의 기반.
  • 복강경 수술 (laparoscopy) — 막대 도구를 구멍에 끼워 자유도 2개 부족 → 도구 끝 관절 2개로 보완. 개복(incision)보다 회복 빠르고 흉터 적음.
  • 수술 진화 단계 — 개복 → 복강경 → SPL(단일공) → NOTES(자연 통로, 무흉터). 뒤로 갈수록 도구가 가늘고 유연해야 한다는 인과를 기억.
  • 원격조작 (teleoperation)·마스터-매니퓰레이터 — 의사 손동작을 수술 도구 관절로 전달하는 방식.
  • 롤링 콘택트 관절 (rolling contact joint) — 톱니가 맞물려 미끄러지지 않고 굴러 회전. 핀 힌지와 달리 케이블 유효 반경이 일정해 장력 안정. 풀리 없이 소형화 가능.
  • PREF 관절 — Pulleyless Rolling joint with Elastic Fixtures. 풀리 없는 탄성 고정부 구름 관절. 4점 굽힘 유사 모멘트로 안정적 구름.
  • 안정 조건 R ≥ B — 톱니 반경 R이 높이 B와 같거나 약간 클 때 케이블 장력 안정·슬랙 방지. 시험에 부등호 그대로 나올 수 있음.
  • 좌굴 (buckling) — 핀 관절을 길게 직렬로 쌓을 때 옆으로 휘청거리는 불안정. 구름 관절이 이를 해결한 것이 핵심 성과.
  • 히스테리시스 (hysteresis) — 같은 입력이라도 진행 방향(굽힘/펼침)에 따라 결과가 달라지는 현상. 마찰이 원인이며 정밀 제어에서 오차로 작용.
  • 등방성 굽힘 (isotropic bending) — 어느 방향으로 굽혀도 동일한 작업공간. Pitch/Yaw 관절을 교대 적층해 얻으며 운동학을 단순화.
  • 비아조인트 (via-joint) — 케이블이 거쳐 가기만 하는 중간 관절. 두 아이들 풀리에 대각선 교차 통과시켜 총 길이 보존 → 디커플링 트릭의 핵심.
  • 디커플링 (decoupling) — 모터-목표 관절을 1:1 독립화해 한 관절 제어가 다른 관절에 간섭하지 않게 함. 역기구학·제어 단순화, 정밀도 향상. 실험상 타 케이블 장력 변동 ±0.8N 이내.
  • 관절 불일치 (joint misalignment) / 과구속 (over-constraint) — 사람·로봇 관절축이 어긋난 채 강체로 묶일 때 발생하는 부하. 웨어러블의 고질병.
  • 물리적 HRI (physical Human-Robot Interaction) — 사람-로봇 연결구를 스프링으로 모델링해 부하를 정량화(길이 유지=부하 0). 동작별 편함/불편함을 점수화.
  • 자기정렬 (self-aligning) / idle 관절 — 모터로 구동 안 하고 따라 구르며 관절축 어긋남을 흡수, 인체 관절 무부하 실현.
  • 장력 증폭 (tension amplification) — 어시스트 모터(고감속비, 버티기)와 드라이브 모터(섬세 동작)가 힘을 합치는 구조.
  • 편심 스프링 (eccentric spring) / 중력보상 (gravity compensation) — 스프링을 편심 배치해 특정 자세에서 스프링 토크가 중력 토크를 상쇄(모멘트 0). 자세 유지 전력 소모 ≈ 0. 천장에 매단 전동공구와 같은 발상.
  • Free Mode — 사전장력·모드 설정으로 보조력을 작업·사용자(근피로도·몸무게)별 맞춤 조절.
  • 기구적 중력보상 (모터리스) — 캠(신장형) 풀리·짐벌·무게추만으로 위치 3-DOF·자세 3-DOF 보상. 사람 부하를 100%→약 2.5~8.6%로 감소.
  • 배선 해법 — 드레스팩(dress pack), 중공(hollow) 액추에이터 내부 통과, 슬립링(slip ring). 엔드이펙터 추가 시 단선·사고 위험 완화.
  • 애커만 조향 (Ackermann steering) — 링크로 안·바깥 바퀴를 다른 각도로 꺾어 공통 회전 중심 공유, 미끄러짐 없는 조향. 모터 8개식 4륜 조향보다 단순·경제적.
  • QDD (Quasi-Direct Drive) — 감속비 낮은(≤1:6) 구동기. 역구동성(back-drivability)이 좋아 힘 제어·충격 흡수에 유리, 다이내믹스 예측 쉬움. 관절 직결 방식의 대표.
공식의 의도

ΣF_load = F_load + F_spring + F_in, 구동 출력 조건: ΣF_load = 0 — 편심 스프링 구동기에서 부하·스프링·입력 힘의 합이 0이 되는 자세를 만들겠다는 의도. 그 자세에서는 모터가 일을 하지 않아도 균형이 유지되어 자세 유지 전력을 0에 가깝게 만든다. (유도·계산은 불필요, 균형=무전력의 의미만 기억.)

R ≥ B — 구름 관절 톱니의 반경 R과 높이 B의 기하학적 안정 조건. 케이블 슬랙·장력 불안정을 방지해 안정적 구름 운동을 보장하려는 설계 부등식.

Week 8차영수교수님

07차영수교수님

소프트 로봇의 세 축(소프트 액추에이터·유연 센서·스마트 구조)을 압전효과와 정전기력이라는 두 물리 메커니즘으로 풀어내고, 이를 로봇 핸드·암·이동로봇의 구동과 재질·유체 인식 센싱, VR 햅틱·열 피드백·원격제어까지 확장하는 흐름을 다룬 강의.
핵심 개념

소프트 로봇(soft robot)은 몸체·구동기·센서가 모두 무른 소재로 되어 함께 변형되는 로봇이다. 이를 위해 세 가지 요소가 필요하다 — 소프트 액추에이터(soft actuator), 유연 센서(flexible sensor), 스마트 구조(smart structure). 이 세 요소의 공통 배경은 "무른 몸체에는 단단한(rigid) 부품을 붙일 수 없다"는 한계다. 일반 로봇은 관절마다 모터·엔코더를 달아 위치를 알지만, 문어 팔처럼 휘는 몸체에 딱딱한 부품을 박으면 그 지점만 안 휘어 전체 변형이 깨지기 때문이다. 그래서 구동기는 모터 없이 자체가 무르고, 센서는 변형(deformation)을 직접 측정할 수 있어야 한다. 외부 카메라로 변형을 재면 항상 카메라 시야 안에서만 움직여야 하는 제약이 생기므로 자체 소프트 센서가 필요하다.

소프트 구동을 만드는 물리 메커니즘 중 강의의 두 축은 압전효과(piezoelectric effect)정전기력(electrostatic force)이다(형상기억합금 SMA 등도 있으나 부차적). 압전효과는 한 물질이 기계적 특성과 전기적 특성을 동시에 가지며 둘이 커플링(coupling)되어 있는 현상이다. 외력을 가하면 변형이 생기고 그에 비례한 전기 신호가 나오므로 센서로 쓰이고(기계→전기), 반대로 전기를 가하면 변형이 일어나므로 액추에이터로 쓰인다(전기→기계). 즉 양방향(bidirectional) 변환이 핵심이다.

반면 정전기력은 마주 보는 두 전극에 전압을 걸면 한쪽은 +, 다른 쪽은 −로 대전되어 서로 끌어당기는 인력이 생기는 현상으로, 구조는 커패시터(capacitor)와 같다. 딱딱한 커패시터는 대전돼도 움직이지 않지만, 두 전극 사이 유전체(dielectric)가 무르면 그 인력으로 수축이 일어나 구동력이 된다. 단 전기→기계의 한 방향만 가능해 구동기 전용이다. 이 "압전=양방향(센서+구동), 정전기=단방향(구동 전용)"의 대비가 강의 전체를 관통하는 가장 중요한 구분점이다.

로봇 핸드(robotic hand)에서 이 원리가 구현된다. ① 전기유압 구동기(electro-hydraulic actuator): 유전체 유체가 든 늘어나지 않는 주머니에 탄소 전극을 붙이고 전압을 가하면, 정전기력으로 전극이 맞붙으며 유체가 다른 쪽으로 밀려 이동(fluid transport)하고, 이동한 유체가 손가락을 부풀려 굽힌다. 몸체는 모두 소프트하고 외부 입력은 오직 전기뿐이며, 전압 크기로 굽힘각(bending angle)을 조절한다. 약한 물체(딸기·알루미늄 컵·물풍선)를 손상 없이 잡는 것이 강점이다. ② 공압(pneumatic) + 오리가미 펌프(origami pump): 외부 컴프레서에 묶이지 않는 독립형(self-contained) 구동을 위해, 손가락 밑 오리가미 펌프를 텐던(tendon)으로 당겨 내부 공기를 챔버로 보내 굽힌다.

소프트 로봇 암(soft robotic arm)에서는 "손은 부드러워도 되지만 팔까지 너무 무르면 힘이 약해 제 역할을 못 한다"는 문제로 하이브리드(hybrid) 구조가 등장한다. 강체(rigid)와 소프트를 결합해 유연성과 지지력(강성)을 동시에 확보하는 것이다. 핵심 구현이 오리가미(origami) 기반인데, 일반 종이접기의 접힘선(Valley/Mountain/Crease)을 단단한 면(Facet)과 잘 휘는 경첩(Hinge)으로 재해석해 고무·3D프린팅으로 만든다. 그 결과 굽힘(bending)뿐 아니라 강체만으로는 불가능한 직선 신축(linear deformation)까지 가능해 코끼리 코 같은 동작을 낸다. 웨어러블 소프트 머니퓰레이터(약 1.35kg, 770mm)로 확장된다.

이동 로봇(mobile robot)도 원리는 같다 — 오리가미 구조를 다리로 쓴다. 오리가미 펌프 4족 로봇은 "액추에이터 하나로 두 동작": 펌프 챔버와 공압 챔버를 튜브로 떨어뜨려 잇고, 모터로 펌프만 눌러도 밀려난 공기가 떨어진 챔버를 굽힌다. 이후 텐던 구동(지지력↑), 자기장(Tesla)으로 원격 구동하는 접이식 다리, 스프링토이(슬링키) 영감의 전기유압 나선 로봇, 그리고 유연 압전 필름 PVDF 기반 로봇으로 발전한다. 일관된 철학은 "외부 동력원에 줄로 묶이지 않는 독립 로봇"이다.

소프트 센서(soft sensor)의 핵심은 단순 압력 측정을 넘어 재질(물질) 인식이다. 압전 소자 두 장을 붙여 하나는 진동을 보내는 액추에이터, 하나는 받는 센서로 쓰고, 사이에 낀 물체를 진동이 통과하면 재질마다 진동 전달함수(transfer function)가 달라 물체를 분류한다(컵을 두드려 소리로 재질을 맞추는 원리). 형상이 아닌 재질을 보므로 카메라가 약한 투명 필름도 인식하고, 겹친 장수(공기층·계면 때문에 통짜와 진동 특성이 다름)까지 센다. 여기에 열전달(heat transfer) 기반 인식을 더한다 — 금속이 차게 느껴지는 건 열전도율이 높아 손의 열을 빠르게 빼앗기 때문이며, RTD·TED로 능동 발열 후 온도 변화를 읽어 재질을 구분한다. 둘을 합친 멀티모달(multimodal) 시스템은 단독 센서의 한계를 넘는다(액체 분류: 열 47.5% + 진동 85.6% → 융합 97.5%).

모션 센싱과 햅틱 피드백(haptic feedback)으로 마무리된다. 압전 센서로 손가락 굽힘·관절 각도를 실시간 인식해 원격제어(teleoperation)에 쓰고, 출력 쪽에서는 정전기 기반 링 전극이 밀폐 공기를 중앙으로 몰아 압력감을 주고, 열전소자(TED, Peltier)가 전류 방향에 따라 온·냉감을 모두 낸다. 촉감은 법선력·전단력·진동 세 성분으로 나뉘는데, 가장 구현이 어려운 전단(shear)을 공압 회전으로 해결한 것이 성과다. 다중감각 통합(multisensory integration)에 의해 촉감·온도·시각이 동시에·같은 위치에 들어오면 사람은 더 강하게 느낀다(회색 막대를 빨강+1℃로 바꾸자 "뜨겁다"고 손을 뗀 실험).

시험 포인트
  • 소프트 로봇(soft robot) — 몸체·구동기·센서가 모두 무르게 변형되는 로봇. "단단한 부품을 못 붙인다"는 한계가 세 핵심 요소가 필요한 이유. 출제 1순위.
  • 소프트 로봇의 3대 요소 — 소프트 액추에이터 / 유연 센서 / 스마트 구조. 세 개를 묻거나 각각의 필요성을 묻는 형태로 나옴.
  • 압전효과(piezoelectric effect) — 기계·전기 특성이 커플링된 현상. 외력→전기(센서), 전기→변형(구동기)의 양방향이 핵심. "센서와 구동기 둘 다 되는 이유"를 설명할 수 있어야 함.
  • 정전기력(electrostatic force) — 두 전극을 대전시켜 끌어당기는 인력. 커패시터 구조이며 유전체가 무르면 수축이 구동력이 됨. 전기→기계 단방향, 구동 전용.
  • 압전 vs 정전기 (핵심 비교) — 압전은 양방향(센서+구동), 정전기는 단방향(구동만). 슬라이드 화살표 ⇄ vs → 의 차이가 곧 시험 포인트.
  • 커플링(coupling) — 두 물리 특성이 서로 묶여 한쪽 변화가 다른 쪽을 일으키는 것. 압전이 양방향인 근본 이유.
  • 유전체(dielectric) — 두 전극 사이 절연 물질. 무를 때만 정전기력이 수축·구동으로 이어진다는 점이 포인트.
  • 전기유압 구동기(electro-hydraulic actuator) — 정전기력으로 유전체 유체를 이동시켜 손가락을 굽히는 구동기. 입력은 전기뿐, 전압으로 굽힘각 조절. 약한 물체를 손상 없이 잡음.
  • 오리가미 펌프(origami pump) — 접히는 필름 챔버를 모터/텐던으로 눌러 내부에서 공기를 만드는 내장형 펌프. 외부 컴프레서 없는 독립형(self-contained) 구동의 핵심. 출력은 약하나 가볍고 부드러움.
  • 독립형 구동(self-contained) — 외부 동력원에 줄로 묶이지 않고 몸 안에서 동력을 만드는 것. 차 교수 연구실 전체를 관통하는 설계 철학.
  • 하이브리드 구조(hybrid structure) — 강체(Facet)와 소프트(Hinge)를 결합해 유연성+지지력을 동시 확보. 팔이 너무 무르면 힘이 약하다는 문제의 해법.
  • Facet / Hinge / Valley·Mountain·Crease — 면(단단)·경첩(유연), 그리고 골접기·산접기·접힘선. 오리가미를 고무 힌지로 재해석해 반복 변형에 견디는 탄력성 확보.
  • 직선 변형 vs 굽힘 (linear vs bending) — 굽힘은 쉬우나 강체만으론 길이 신축(직선)이 불가. 모듈 사이 고무가 직선 신축을 가능케 함(코끼리 코 동작).
  • 텐던 구동(tendon-driven) — 모터가 케이블을 당겨 구동. 공압보다 지지력이 좋아 다리·팔에 유리. 새 물리 원리가 아닌 기존 방식의 변형으로 분류됨.
  • 자기장 구동(magnetic, Tesla) — 모듈 속 자성 입자에 외부 자기장(1T 등)을 걸어 원격 구동. 전기 모터 없이 얇고 가볍게 만드는 장점. 슬라이드의 'T'는 시간이 아닌 테슬라.
  • PVDF(압전 고분자 필름) — 유연한 압전 필름. 세라믹 압전은 단단해 부적합. 가볍고 충격에 강함(고무망치 시험). 공진 주파수에서 작은 입력으로 큰 진동을 얻어 추진.
  • 진동 전달함수(transfer function) 기반 재질 인식 — 압전 한 쌍(액추에이터+센서) 사이 물체를 통과한 진동으로 재질 분류. 형상이 아닌 재질을 본다는 점, 17종 95.9% 같은 결과가 포인트.
  • 겹친 장수 세기(counting) — 0.1mm 5장 ≠ 0.5mm 1장: 총 두께가 같아도 층 사이 공기층·계면(interface)이 진동을 끊어 구별 가능. 인과 설명형 단골.
  • 열전달 기반 인식 / RTD·TED — 열전도율 차이로 재질 구분. 가만히 있으면 평형이라 정보가 없어 능동 발열 필요. RTD=측온저항, TED=열전소자.
  • 멀티모달(multimodal) 센싱 — 진동+열 등 다른 모달리티 결합. 단독보다 정확도 급상승(47.5%+85.6%→97.5%). "왜 합치면 좋은가"=서로 다른 물리량으로 상호 보완.
  • 혼동행렬(confusion matrix) 읽기 — 세로=실제, 가로=예측. 대각선이 진할수록 정확. 모달리티별로 행렬이 선명해지는 비교가 출제됨.
  • 비전(카메라)의 한계 보완 — 투명 필름·불투명 병 속 액체 종류/잔량은 카메라가 못 함. 들지 않고 잡는 순간 인공 스킨만으로 식별하는 것이 차별점.
  • 원격제어(teleoperation) — 사람 모션을 인식해 로봇에 전달, 로봇이 느낀 온도를 사람에게 되먹임(양방향). 위험(고온) 물체에서 즉시 손 떼게 함.
  • 모션 센싱의 '실' 트릭 — 넓은 관절은 센서 직접 부착 시 노이즈 큼. 관절에 실을 통과시켜 변형을 작은 압전 센서로 모아 인장으로 받으면 신호가 깔끔. 신장률–전압 곡선으로 각도 환산.
  • 햅틱 3성분: 법선력·전단력·진동 — 누르는 압력 / 옆으로 미끄러지는 마찰감 / 떨림. 전단(shear)이 가장 구현 어려워 공압 회전으로 해결. 미끄러짐 지각에 필수.
  • 열전소자(TED)·펠티에 효과(Peltier) — 전류 방향에 따라 한 면은 가열·반대 면은 냉각. 하나의 소자로 온감·냉감 모두 구현.
  • 다중감각 통합(multisensory integration)·시간 동기화 — 촉감·온도·시각이 동시에 같은 위치·타이밍에 오면 더 강하고 진짜처럼 느껴짐. 회색 막대+색+1℃ 착각 실험이 근거.
Week 9최성록교수님

08최성록교수님

로봇의 인지·내비게이션에서 반복되는 핵심은 "센서/모델의 약점을 어떻게 보완하고 단순화하느냐"이며, 경로계획(Theta#), GPS 측위(off-centered·기압계 융합), 단안 비주얼 오도메트리(단순화 모션 모델·스케일 복원), UAV 지오로컬라이제이션(VPR)으로 이 주제가 일관되게 흐른다.
핵심 개념

로봇 내비게이션 라이브러리(uRON, Universal Robot Navigation Library)는 다양한 로봇·시나리오에 재사용 가능한 자율주행 소프트웨어로, 그 기능은 위치추정(Localization)·지도작성(mapping)·경로계획(path planning)·경로추종(path following)·장애물 회피(obstacle avoidance)로 구성된다. 핵심 설계 사상은 센서와 플랫폼을 추상화(abstraction)하여 서로 다른 하드웨어에도 같은 코드를 그대로 끼워 쓸 수 있게 한 점이다. 이는 오늘날 ROS 내비게이션 스택이 표준으로 제공하는 역할을 ROS 이전에 선구적으로 구현한 사례로, "범용성·재구성성"이라는 가치가 왜 중요한지를 보여준다.

경로계획에서 가장 중요한 개념은 격자 지도(grid map) 위의 A*가 만드는 지그재그(zig-zag) 경로 문제다. A*8-이웃 탐색(8-neighbor search)옥타일 거리(octile distance, 직선 1·대각선 √2)를 비용 함수로 쓰는데, 이렇게 8방향으로만 확장하면 직선으로 갈 수 있는 길도 여러 갈래의 비용이 모두 같아져 계단처럼 꺾인 경로가 선택된다. 이를 해결하는 것이 임의각 경로계획(Any-angle path planning)이며 대표 알고리즘이 Theta*다. Theta*는 두 점을 직접 잇는 시선 탐색(Line-of-sight search)유클리드 거리(Euclidean distance)를 써서 자연스러운 직선 경로를 만든다. 단, 직선 전체에 장애물이 없는지 확인하는 충돌 검사(collision check)를 너무 많이 한다는 단점이 있다.

Theta#는 Theta*의 충돌 검사 비용을 동적 계획법(dynamic programming)으로 줄인 빠른 버전이다. 긴 시선 검사를 짧은 구간으로 쪼개면 부분 문제가 겹치므로(예: CA의 통과 가능성은 CB·BA가 자유로우면 알 수 있다), 이미 안전하다고 판명된 짧은 구간 결과를 별도 맵에 저장해 재사용하면 중복 검사를 제거할 수 있다. 또한 Theta#는 비균일 코스트맵(non-uniform costmap)으로 일반화되어, 카펫·잔디·경사처럼 칸마다 다른 통행 비용을 비용 가중 유클리드 거리(cost-weighted Euclidean distance)로 추가 오버헤드 없이 반영한다. 이진(뚫림/막힘) 지도는 그 특수한 경우일 뿐이라는 일반화 관점이 시험 포인트다.

실외 측위에서는 GPS/GNSS가 핵심 센서지만 위치만 줄 뿐 방향(orientation)은 주지 않는다. Off-centered GPS 연구의 반직관적 결론은 "GPS를 로봇 중심이 아니라 한쪽으로 치우치게(off-center) 달면 오히려 측위가 더 정확하다"는 것이다. 직관은 이렇다 — 중심에 단 GPS는 제자리 회전 시 위치가 거의 그대로라 방향 정보를 못 주지만, 치우친 GPS는 회전 시 점이 호(arc)를 그리며 움직여 위치 측정만으로도 방향각 θ를 관측할 수 있다. 이는 관측성(observability) 분석(상태를 측정만으로 유일하게 알아낼 수 있는가)으로 증명되며, 오프셋이 커질수록 공분산의 최소 고유값이 커져(=불확실성 감소) 추정이 더 안정적임을 정량적으로 보인다. 단, 치우치게 달면 좌표를 원점 기준으로 되빼는 변환이 필요하고, 이때 절대좌표계에서의 방향각 θ를 반드시 고려해야 한다.

GNSS + 기압계 융합(BVC)은 두 센서의 약점이 상보적임을 이용한다. GPS는 위성이 하늘에 넓게 퍼져 있어 수평 이동은 거리 변화가 커 잘 잡지만 수직(고도) 오차가 가장 크다. 기압계(barometer)는 고도를 매우 정밀하게 잡지만 드리프트(drift)로 절대값이 서서히 밀린다. 결정적 아이디어는 기압계를 "고도(위치)"가 아니라 수직 속도로 쓰는 것이다(BVC, Barometric Velocity Correction). 두 시점의 기압차를 미분해 수직 속도를 만들면 천천히 누적되는 드리프트가 차분 과정에서 상쇄되므로 편향(bias)에 강해진다. 이 둘을 확장 칼만 필터(EKF, Extended Kalman Filter)로 융합하면, 느린 드리프트는 GNSS의 절대 기준이 잡고 GNSS의 순간 튐은 기압계의 부드러운 속도가 눌러 정확하고 매끄러운 추정이 된다.

단안 비주얼 오도메트리(Monocular Visual Odometry, Milk)는 카메라 한 대 영상만으로 자기 이동량을 누적 추정한다. 오도메트리는 로컬하게는 정밀하나 누적될수록 드리프트가 쌓이는 성질이 있어, 전역 기준은 주지만 어반 캐년·터널에서 약한 GPS와 상보적으로 융합한다. 영상에서는 옵티컬 플로우(optical flow)의 움직임으로 카메라 운동을 기하학적으로 복원하며, 빠른 추적을 위해 KLT 트래커(Lucas-Kanade optical flow)로 이전 특징점을 계속 추적하고 버켓팅(bucketing)으로 화면 전체에 점을 고르게 분산한다. 두 난제는 ① 무거운 연산량(전체 시간의 대부분이 특징 대응 찾기와 이상치 제거에 소모됨)과 ② 스케일 모호성(scale ambiguity)이다.

단순화 모션 모델(simplified motion models)은 연산량 문제의 핵심 해법이다. 일반 카메라 운동은 6 DOF(자유도)지만, 로봇·차량은 대부분 바닥 위를 달리므로 평면 운동(planar motion, 3 DOF: X, Y, θ)으로 단순화할 수 있고, 더 나아가 차량이 뒷차축 중심으로 원호를 그린다는 평면 원호 운동(planar circular motion)으로 보면 각도 관계 θ=2φ가 성립해 2 DOF, 즉 점 하나만으로 운동을 푸는 1-point RANSAC이 가능하다. 제약(가정)을 더 걸수록 필요한 점·샘플 조합이 급감해 수십~수백 배 빨라진다는 것이 핵심 메시지다. 스케일 모호성은 단안 카메라가 "큰 공간을 빠르게"와 "작은 공간을 느리게"를 구분 못 하는 근본 한계(2m 터널과 1m 터널의 옵티컬 플로우가 동일)로, 일정한 카메라 높이(constant camera height) 제약으로 푼다 — 복원된 점군에서 지면을 찾아 잰 높이 l이 실제 높이 L이어야 하므로 스케일 ρ=L/l이 나온다. 즉 "스케일 찾기" 문제가 "지면 평면 찾기" 문제로 바뀐다.

지면 찾기에서는 커널 밀도 추정(KDE, Kernel Density Estimation)으로 3D 점들의 높이 분포에서 가장 밀집한 봉우리를 지면으로 본다. 다만 대칭 가우시안 커널은 편향을 낳는데, 물체(차·건물·보행자)는 항상 지면 위에 솟아 있고 아래에는 없다는 비대칭성 때문에 추정 지면이 위로 끌려 올라가기 때문이다. 그래서 비대칭 커널/비대칭 RANSAC(asymmetric kernel/RANSAC)으로 "지면 위는 아웃라이어, 지면 자체는 가우시안 노이즈"라는 노이즈 모델을 반영해야 정확하다. 마지막으로 GPS 차단(GPS-denied) 환경을 위한 TileLoc/VPR(Visual Place Recognition)은 UAV 영상을 공개 타일 지도와 정합해 위경도를 복원하는 영상 검색 문제로, 지역 특징(local feature)전역 특징(global feature) 방식의 트레이드오프가 핵심이다.

시험 포인트
  • uRON (Universal Robot Navigation Library) — 다양한 로봇에 재사용 가능한 내비게이션 라이브러리. 센서·플랫폼 추상화로 범용·재구성성을 확보. 기능 5종(위치추정·지도작성·경로계획·경로추종·장애물회피)을 묶어서 묻기 좋음. "ROS 이전의 ROS 내비게이션"이라는 위치를 기억.
  • 추상화 (Abstraction) — 서로 다른 하드웨어를 같은 인터페이스로 다뤄 코드 재사용을 가능케 하는 설계 원리. 범용성의 근거.
  • 8-이웃 탐색 (8-neighbor search) / 옥타일 거리 (octile distance) — 격자에서 8방향만 허용하고 직선 1·대각선 √2로 비용을 매기는 방식. 진짜 직선(임의각)을 표현 못 해 지그재그가 생기는 원인. "왜 A*가 꺾인 경로를 내는가"의 답.
  • 임의각 경로계획 (Any-angle path planning) / Theta* — 격자에 갇히지 않고 시선(Line-of-sight) 검사 + 유클리드 거리로 자연스러운 직선 경로를 얻는 접근. 단점은 충돌 검사 과다(Bresenham 직선으로 검사).
  • Theta# — Theta*의 충돌 검사를 동적 계획법(중복 부분 문제 재사용)으로 가속한 버전 + 비균일 코스트맵 일반화. "중복 검사 제거"와 "비용 가중 유클리드 거리"가 두 핵심 기여. 이진 지도는 특수 경우.
  • 비균일 코스트맵 (non-uniform costmap) — 모든 칸의 이동 비용이 1이 아닌 지도(카펫·경사 등 "지날 수는 있지만 힘든" 영역에 높은 비용). 현실적 경로 산출의 근거.
  • Off-centered GPS — GPS를 중심에서 벗어나 달면 회전 시 호를 그려 방향각 θ까지 관측 가능 → 오히려 더 정확. 4가지 구성(Centered / Pseudo-centered / Transformed / Off-centered) 구분이 시험 포인트.
  • 관측성 (Observability) / 결핍(deficiency) — 측정만으로 상태(위치·방향)를 유일하게 알아낼 수 있는가. 결핍 차수 r_d = n − rank(O_d)가 0이면 완전 관측. 중심 GPS는 방향이 결핍되기 쉽고, off-center는 결핍이 줄어든다.
  • 불확실성 분석 / 최소 고유값 — 공분산의 최소 고유값이 클수록 추정이 안정적(불확실성 작음). 오프셋이 길수록 이 값이 커진다 = off-centered가 더 정확하다는 정량 근거.
  • 뒷축 기준점 (rear axle) / 비횡슬립 가정 — 바퀴가 옆으로 미끄러지지 않는다는 가정 때문에 기준점을 뒷축에 두면 기구학이 단순해짐(차동구동·Ackermann). GPS 장착·좌표 변환의 이론적 배경.
  • GPS 오차의 비대칭성 — 위성이 하늘에 퍼져 있어 수평 오차는 작고 수직(고도) 오차가 가장 크다. 기압계 도입의 핵심 동기. "왜 기압계가 필요한가"로 출제 가능.
  • 기압계 (Barometer) / 드리프트(Drift) — 고도를 정밀하게 측정하나 시간이 지나며 기준이 밀림. 절대 기압값으로 고도를 못 박을 수 없는 이유(날씨·온도로 기압 기준 자체가 이동).
  • BVC (Barometric Velocity Correction) — 기압을 고도가 아니라 수직 속도(기압차의 미분)로 사용. 차분이 느린 드리프트를 상쇄해 편향에 강함. 비교군 BAC(고도 보정 계열)는 절대값 의존이라 편향에 취약 — 이 대비가 핵심.
  • EKF (Extended Kalman Filter) — 예측→보정 반복. 상태에 위치+속도(6차원)를 함께 두는 이유는 기압계를 속도 보정으로 쓰기 위함. 칼만 이득 K는 측정 잡음 R이 크면 작아져 측정을 덜 믿음.
  • 중앙값(median) 오차 지표 — GNSS 모드 변경 같은 순간적 튐(outlier)에 둔감해 "평소 성능"을 공정하게 평가하려고 평균 대신 median을 씀. CDF는 곡선이 왼쪽 위로 가파를수록 좋음.
  • 오도메트리 (Odometry) / 드리프트 vs 전역기준 — 한 스텝씩 적분하는 상대 추정이라 로컬은 정밀하나 누적 드리프트 발생. GPS(전역 정확, 방향 없음, 어반 캐년·터널에 약함)와 상보적. 융합의 당위.
  • 어반 캐년 (Urban canyon) — 고층 빌딩이 위성 신호를 가리거나 반사시켜(다중경로, multipath) GPS 오차가 커지는 환경. 터널은 신호 차단. GPS-denied 환경의 대표 사례.
  • 옵티컬 플로우 (Optical flow) / KLT 트래커 — 화면 점들의 흐름으로 카메라 운동 복원. Lucas-Kanade로 이미지 평면 위 2D 추적(2 DOF), Good-Feature-to-Track로 코너 선택, 버켓팅으로 화면 전체에 고르게 분산.
  • 자유도 (DOF) 단순화: 6→3→2 — 일반 6 DOF, 평면 운동 3 DOF(X,Y,θ), 평면 원호 운동 2 DOF(θ=2φ). 제약이 많을수록 필요한 점이 적어 빠름. 가장 중요한 시험 포인트 중 하나.
  • 1-point RANSAC / RANSAC — 이상치를 걸러내며 모델 추정. 필요한 점이 1개면 무작위 샘플 조합이 급감해 매우 빠름. 평면·원호 가정과 결합해 실시간 VO 달성.
  • 소동작 가정 (small-motion approximation) — 카메라가 초당 10장 이상 찍어 인접 프레임 간 움직임이 작음 → 무거운 전역 해 대신 국소 최적화로 빠르게 모션 갱신. 실제로 유용했던 단순화.
  • 스케일 모호성 (Scale ambiguity) — 단안 카메라는 공간 크기와 이동 크기가 결합되어 절대 스케일을 못 구함(2m 터널 vs 1m 터널의 플로우가 동일 → "up to scale"). 단안의 근본 한계.
  • 일정 카메라 높이 제약 → 지면 평면 찾기 — 실제 높이 L과 복원된 높이 l의 비로 스케일 ρ=L/l 복원. "스케일 찾기"가 "지면 찾기"로 환원됨. 추가 센서(속도계·IMU·GPS)나 초기값으로도 해결 가능.
  • 비대칭 커널/RANSAC (asymmetric kernel) — 물체는 지면 위에만 있다는 비대칭성을 반영해 지면을 정확히 피팅. 대칭 가우시안은 지면이 위로 떠오르는 편향. "휴리스틱을 노이즈 모델로 포뮬레이션하면 설득력↑"이라는 논문화 교훈도 개념적으로 기억.
  • PnP / BA (Bundle Adjustment)PnP(Perspective-n-Point)는 3D 지도점과 2D 영상점 대응으로 카메라 자세 추정, BA는 여러 프레임의 자세·점을 동시 최적화해 누적 오차 감소. WheelOdo 결합으로 실제 스케일(Real-scale) 확보.
  • VPR (Visual Place Recognition): 지역 vs 전역 특징지역 특징은 키포인트 대응 + 기하 검증(RANSAC/MAGSAC++)으로 회전·가림·스케일에 강건하나 전수 탐색이라 느림. 전역 특징(AnyLoc=DINOv2+VLAD 등)은 이미지를 한 벡터로 요약해 최근접 이웃 검색으로 빠르나 기하 변형에 약함. 이 트레이드오프가 베이스라인 선정의 핵심.
  • 전역 특징의 불변성 — 스케일·회전 변화에는 유사도가 크게 떨어지나(취약), 종횡비(aspect ratio) 변화에는 거의 불변. TileLoc의 기여(멀티줌 타일맵·회전 질의 배치·순차 매칭)는 이 약점 보완책.
  • 크로스뷰(cross-view) 정합의 난점 — UAV vs 항공영상의 스케일·커버리지 불일치, 시점 차이, 외관 변화(조명·식생·구조). GPS-denied 지오로컬라이제이션의 어려움.
공식의 의도

ρ = L / l — 단안 VO의 절대 스케일을 복원하려는 식. 미리 아는 실제 카메라 높이 L과, 스케일 미상 점군에서 잰 높이 l의 비로 전체 스케일을 정함(지면을 찾으면 나눗셈 한 번으로 끝).

r_d = n − rank(O_d(x₀)) — 어떤 센서 구성이 상태를 얼마나 못 보는지(관측성 결핍)를 세려는 식. 0이면 완전 관측 가능, 클수록 추정 불가능한 차원이 많음. off-centered GPS가 결핍을 줄임을 보이는 데 사용.

v_z^B = Δz^B(P_k, P_{k-1}) / Δt — 기압을 절대 고도가 아니라 두 시점 기압차의 미분(수직 속도)으로 바꿔, 드리프트의 영향을 제거하고 GPS의 수직 약점을 보강하려는 식(BVC의 핵심).

Week 10강병현교수님

09강병현교수님

손·허리·하지·발목에 적용한 소프트 웨어러블 로봇의 설계 철학(부드러움 속의 힘 전달)과, 센서를 최소화한 채 인체 움직임에서 '의도'를 읽어내는 AI 결합이 일관되게 관통하는 회차.
핵심 개념

소프트 웨어러블 로봇(soft wearable robot)은 금속·관절 같은 딱딱한 구조 대신 천·케이블·공압 같은 부드러운 재료로 만들어 몸에 입는 로봇이다. 무겁고 거추장스러운 기존 강체 외골격(rigid exoskeleton)과 달리 옷처럼 가볍고 신체에 순응(conform)해 일상 보조에 유리하다. 이 분야가 2000년대 부상한 배경은 ① 의료 발전으로 생존율이 높아져 장애 인구(특히 완전 손상이 아닌 불완전 손상)가 늘었고 ② 3D 프린팅으로 시제품 제작이 쉬워졌으며 ③ 사회적 약자에 대한 관심이 커진 데 있다. 보조의 목표 기준은 일상생활 동작(ADL, Activities of Daily Living) — 몸단장·식사·용변·이동·옷입기·목욕의 6가지를 스스로 해내는 자립도이며, 손 기능은 거의 모든 ADL에 관여하므로 손 보조가 삶의 질에 직접 영향을 준다.

손 로봇(EXO-Glove 계열)의 핵심 기여는 착용 부위 무센서(sensorless) 추정이다. 손가락에 센서를 붙이면 위생·착용성·내구성이 나빠지므로, 센서를 손이 아니라 구동기(actuator) 쪽에 두고 모터의 와이어 장력·전류 같은 신호만으로 물체 크기와 파지력(grasp force)학습 기반(learning-based)으로 추정한다. 구동은 건-시스 메커니즘(TSM, tendon-sheath mechanism) — 유연한 외피 속 줄을 모터가 당겨 힘을 멀리 전달하는, 자전거 브레이크선(보우든 케이블)과 같은 원리다. 장갑 설계의 근본은 강성 이방성(stiffness anisotropy)으로, 손에 닿는 부분은 부드럽게(저강성→체형 흡수·편안함), 힘을 전달하는 텐던 방향은 늘어나지 않게(고강성→효율적 힘 전달) 만들어 한 소재로 상충하는 두 요구를 동시에 만족시킨다. 천 소재는 위생 인증(FDA) 문제로 막혀 실리콘/폴리머로 전환했고, 통기성을 위해 구멍을 내고 부품을 줄였다.

AI 결합의 핵심은 의도(intention) 추론이다. 기존엔 기계 스위치나 생체신호(EEG·EMG·EOG)로 사람이 직접 명령을 줘야 해 불편했지만(양손 필요), AI가 의도를 스스로 추론하게 한다. 이론적 근거는 행동심리학의 두 명제 — "의도는 제3자 관점(third-person view)에서 더 정확히 정의된다", "사람은 움직임으로부터 의도를 유추한다(infer intentions from motions)" — 이며, 이로부터 "착용형 로봇이 사람의 행동에서 의도를 유추할 수 있는가"라는 연구 질문이 도출된다. 손 로봇 실험에서 손 영역을 마스킹해도 분류가 잘 됐다는 점은 AI가 손의 정확한 모양이 아니라 외곽선(궤적)=움직임만 본다는 증거이며, 결론은 "팔의 움직임 + 손-물체 상호작용 두 가지만으로 의도 감지가 가능하다(단, 둘 중 하나라도 안 보이면 실패)"는 패러다임 자체다.

특히 의도 감지(intention detection)의도 예측(intention prediction)의 구분이 중요하다. 감지는 의도가 생긴 뒤 알아채는 것이고, 예측은 생기기 전에 미리 내다보는 것이라 훨씬 어렵다. 이를 증명하기 위해 근전도(EMG)를 정답(ground truth)으로 삼았다 — 근육이 수축하기 시작하는 순간이 곧 사람의 실제 의도 발생 시점이므로, AI 신호가 EMG보다 빠르게 나오면 객관적으로 "예측"이라 부를 수 있다. 실제로 AI 신호가 사람보다 앞섰기에 논문에서 prediction(pre-action)으로 결론 내렸다. 신호 처리는 1차원 시계열을 영상 분류에 강한 CNN으로 다루기 위한 변환이 핵심이다 — IMU 신호를 CWT(연속 웨이블릿 변환)로 시간-주파수 이미지로 펼치거나, 시계열을 RGB 색 이미지로 인코딩하면 원시(raw) 데이터를 그대로 분류할 때보다 정확도가 크게 올랐다.

허리 로봇은 편평등 증후군(flat back syndrome)을 다룬다. 정상 척추는 흉추 후만(kyphosis)+요추 전만(lordosis)의 S자이지만, 요추 전만이 사라져 평평해지면 무게중심(center of gravity)이 앞으로 쏠려 몸이 앞으로 굽는다. 근본 원인은 근감소증(sarcopenia)과 척추기립근의 지방화(fatty degeneration)로, 허리를 받치는 근육(대요근·척추기립근·다열근)이 약해지면 자세가 나빠지고 근육이 더 빠지는 악순환(vicious circle)이 일어난다. 기존 치료인 척추 변형 수술은 위험·합병증이 크고 요추 운동성을 영구히 잃으며, 보조기(orthosis)는 혼자 착탈이 어렵고 굽힘이 안 되며 정밀 지지가 안 된다. 그 빈틈을 TSM 기반 소프트 로봇이 메우는데, 줄을 당겨 허리를 펴는 요추 신전(lumbar extension) 보조에 더해 사용자가 의도대로 허리를 굽힐 수 있는 능동적 각도 조절을 목표로 한다. 효과는 EMG로 검증해, 구동(exo on) 시 척추기립근(TES·LES) 활성도가 통계적으로 유의하게 감소함을 확인했다.

하지로 확장한 모듈형 하지 엑소슈트뇌졸중 편마비 보행(hemiparetic gait)을 표적으로 한다. 강체 외골격은 자연스러운 움직임에 저항하고 무거워 대사 비용(metabolic cost)을 높이는 반면, 소프트 슈트는 가볍고 순응적이다. 핵심 과제는 '착용 편안함(저강성)'과 '효율적 토크 전달(고강성)'의 균형이며, 이를 위해 ① 최적 고정점(anchor point) 배치, ② 강성 극대화(변형·전단력↓→피부 쓸림 방지), ③ 모듈화로 체형·환자별 적응성을 확보한다. 또 로봇이 사람의 자발적 움직임을 막지 않도록 백드라이버빌리티(backdrivability)가 높은 QDD(Quasi-Direct-Drive) 모터를 쓴다. 제어는 카메라/AI 대신 인솔(깔창) 압력 센서로 보행 위상(gait phase)을 판별해 단계별로 무릎·발목 토크를 넣는데, 유각기엔 발목을 들어 발 처짐(foot drop) 방지, 말기 입각엔 저측굴곡으로 추진력을 만든다. 임상(뇌졸중 환자 10명)에서 발목 각도 70%·무릎 각도 60% 개선, 대칭성 50~62.5% 개선이 확인됐다. 최신 갈래는 비전·AI 결합으로, EfficientNet-HED로 계단·연석 등 보행 환경을 실시간 인식하고, MobileNetV3 + Tucker-2 분해로 보행 주기(0~100%)를 경량·실시간으로 추정한다.

시험 포인트
  • 소프트 웨어러블 로봇(soft wearable robot) — 부드러운 소재로 만든 입는 로봇. 강체 외골격 대비 가볍고 신체에 순응. 전 회차를 관통하는 설계 철학이므로 정의·장점을 강체와 대비해 암기.
  • 강체 외골격 vs 소프트 엑소슈트(rigid exoskeleton vs soft exosuit) — 강체: 자연 움직임에 저항, 무겁고 부피 커서 대사 비용↑(예: ReWalk). 소프트: 유연·경량, 자연 움직임에 순응(예: Harvard). 대표적 A vs B 비교 문항.
  • ADL(Activities of Daily Living, 일상생활 동작) — 자립도 평가 기준 6가지(몸단장·식사·용변·이동·옷입기·목욕). 손 보조 로봇의 목표 성능을 정의하는 개념.
  • SCI(척수 손상)·뇌졸중(stroke) — 손·보행 기능 상실의 대표 원인. 경수(목) 손상일수록 손까지 마비. 불완전 손상 환자 증가가 보조 기술 수요의 배경.
  • TSM(tendon-sheath mechanism, 건-시스 메커니즘) — 유연한 외피 속 줄을 모터가 당겨 힘을 원거리 전달(보우든 케이블 원리). 무거운 모터를 착용부에서 떼어내 부드럽고 가볍게 만드는 핵심 구동 방식. 손·허리 로봇 공통.
  • 강성 이방성(stiffness anisotropy) — 방향에 따라 강성이 다르게 설계. 누르는 방향은 저강성(편안함), 힘 전달 방향은 고강성(효율). '편안함 vs 힘 전달' 상충을 한 소재로 해결하는 핵심 아이디어.
  • 착용 부위 무센서 추정(sensorless, learning-based) — 손가락이 아닌 구동기 쪽 신호(와이어 장력·전류)만으로 물체 크기·파지력을 학습 추정. 위생·착용성·내구성을 지키는 차별점. 왜 센서를 액추에이터에 두는지 인과로 출제 가능.
  • 위생·소재(폴리머 vs 천) — 천은 음식물·세탁 오염으로 위생 인증(FDA) 문제 → 실리콘/폴리머로 닦아 해결. 단 통기성↓라 구멍을 내 보완. 수동 엄지(passive thumb)는 엄지를 받침대로 고정해 안정적 파지.
  • 의도 감지 vs 의도 예측(intention detection vs prediction) — 감지=의도 발생 후 인지, 예측=발생 전 미리 내다봄(더 어려움). AI 신호가 EMG보다 빠르면 '예측(pre-action)'이라 부를 근거. 용어 구분이 시험 단골.
  • EMG를 정답(ground truth)으로 사용 — 근수축 시작 순간=실제 의도 시점. AI 시점이 그보다 앞서는지 비교해 '예측'을 객관 증명. 왜 EMG를 기준으로 쓰는지 설명 요구 가능.
  • 움직임 기반 의도 추론(behavioral psychology) — "의도는 제3자 관점에서 더 정확히 정의", "사람은 움직임에서 의도를 유추". 손 마스킹 실험으로 AI가 모양이 아닌 외곽선(궤적)을 본다는 것 확인. 한계: 팔/손-물체 중 하나라도 안 보이면 실패.
  • CWT(연속 웨이블릿 변환) / 시계열→이미지 인코딩 — 1차원 센서 신호를 시간-주파수(또는 RGB) 2D 이미지로 변환해 CNN으로 분류. raw 데이터보다 정확도↑. CNN 분류는 stay/to sit/to stand/walk 4클래스.
  • MVC 정규화 / 반복측정 ANOVA — MVC(최대 수의 수축)를 100%로 두고 개인차를 보정해 EMG 비교. 동일 피험자가 여러 조건을 수행하므로 일원 반복측정 분산분석 사용(독립집단 t검정 X). 왜 반복측정인지 출제 가능.
  • 혼동행렬·투표 시스템(voting) — 행=실제/열=예측, 대각선이 1에 가까울수록 정확. to stand와 walk가 혼동(둘 다 다리 폄). 실시간 오작동 방지를 위해 연속 5회 일치해야 구동.
  • 편평등 증후군(flat back syndrome) — 요추 전만 소실로 무게중심 전방 이동, 몸이 앞으로 굽음. 근감소증·척추기립근 지방화(fatty degeneration)가 근원. 근육(대요근·척추기립근·다열근) 위축 → 악순환.
  • 수술 vs 보조기 vs 소프트 로봇 — 척추 변형 수술: 위험·합병증·요추 운동성 영구 상실. 보조기: 착탈 어렵고 굽힘 불가·정밀 지지 부족. 소프트 로봇이 '수술은 과하고 보조기는 불편한' 빈틈을 메움. 요추 신전 보조가 목적.
  • 편마비 보행(hemiparetic gait)·foot drop·circumduction — 뇌졸중 후 근력약화·경직(spasticity)·선택적 운동제어 손상으로 좌우 비대칭, 보행속도·보폭↓, 발 처짐. 발끝 끌림을 피하려 다리를 반원으로 돌리는 휘돌림 보행(circumduction)이 보상 동작.
  • 백드라이버빌리티 / QDD 모터 — backdrivability: 모터를 끄거나 거꾸로 밀 때 관절이 쉽게 따라 움직이는 정도. 높을수록 사용자 움직임을 안 막아 안전·편안. QDD(Quasi-Direct-Drive)는 감속비를 낮춰 역구동성·토크 제어 우수 → 사람과 힘을 주고받는 웨어러블에 적합.
  • 고정점(anchor point)·모멘트 암(moment arm)·강성 설계 — 고정점이 밀리면 힘이 관절이 아닌 전단·변형으로 낭비(피부 쓸림). 모멘트 암은 관절축~힘 작용선 거리로 길수록 토크↑. 무릎 신전 지지는 굽힐 때 거리↑(토크 확보), 펼 때 거리↓(돌출 최소화). 허리 벨트는 단단한 장골능(iliac crest)에 앵커.
  • 보행 위상(gait phase)과 인솔 센서 제어 — 4단계: Loading Response·Mid Stance·Terminal Stance·Swing. 발 앞/뒤 압력 조합으로 단계 판별. 유각기엔 배측굴곡(DF)으로 발 처짐 방지, 말기 입각엔 저측굴곡(PF)으로 추진. low P-gain control은 약하게 끌어 사람을 구속하지 않는 전략. DF/PF/FLX/EXT 용어 숙지.
  • 임상 결과 해석(A→B / B→C / A→C) — A→B=착용만(구조 효과), B→C=구동(능동 보조 효과), A→C=합산. 단계 분리로 개선이 착용 때문인지 모터 보조 때문인지 구분. 발목 각도 70%·무릎 60%·대칭성 50~62.5% 개선. back knee(genu recurvatum, 무릎 과신전) 완화에 효과.
  • HED·EfficientNet / MobileNetV3·Tucker-2 — HED(Holistically-nested Edge Detection): 다중 해상도 윤곽선 검출로 계단 단차 포착. EfficientNet: 깊이·너비·해상도 균형 확장의 경량 모델. EfficientNet-HED로 평지·오르막·내리막·계단 실시간 분류(HED 전 단계 입력 시 성능↑). 보행 위상 검출은 MobileNetV3(AutoML 기반)+Tucker-2 분해(가중치 텐서 압축)로 경량·실시간 추론. 웨어러블의 실시간성 제약이 경량 모델 선택의 이유.
Week 11조영근교수님

10조영근교수님

필드로봇이 GPS·통신·조명이 보장되지 않는 비정형 실환경에서 장기 자율(long-term autonomy)을 달성하려면, SLAM의 핵심인 데이터 대응관계(correspondence)를 강건하게 지켜내는 것이 관건이며, 이를 위해 멀티모달 센싱·동적 객체 제거·다중로봇 지도 병합·강건한 상태추정/주행가능성/탐사가 하나의 파이프라인으로 엮인다.
핵심 개념

이 강의는 공간지능(Spatial AI)필드로봇(Field Robot)이라는 좁은 범위로 가져와 다룬다. 공간지능이란 시각 정보·IMU 같은 내부 센서 정보·공간 정보를 결합해 주변 환경의 기하 구조(geometry)의미(semantics)를 동시에 이해하고, 3차원 공간에서 사물의 위치·모양·크기·움직임을 예측하는 기술이다. 이는 화면 안에서 데이터만 다루는 생성형 AI와 달리, 실제 센서로 입력받고 액추에이터(actuator)로 물리 세계를 바꾸는 피지컬 AI(Physical AI)의 한 축으로, 로봇이 "내가 어디 있고(측위)·주변에 무엇이 있고(지도)·어떻게 가야 하는지(계획)"를 모두 알아야 한다는 요구에서 출발한다.

그 토대가 SLAM(Simultaneous Localization and Mapping)이다. 지도가 주어졌을 때 그 안에서 로봇의 위치·자세를 추정하는 것이 위치추정(Localization), 위치를 알 때 지도를 만드는 것이 지도작성(Mapping)이며, SLAM은 둘을 동시에 푼다. 한쪽이 정확하면 다른 쪽은 쉬워지지만 SLAM은 지도도 위치도 모두 부정확한 상태에서 출발하므로, 둘을 번갈아 갱신해야 하는 전형적인 닭과 달걀 문제(chicken-and-egg problem)가 된다. 그래서 카메라·LiDAR·IMU·GPS 등 여러 센서의 관측값을 결합하는 것이 본질적으로 중요하다.

SLAM 시스템은 프론트엔드(front-end)백엔드(back-end)로 나뉜다. 프론트엔드는 센서 원시 데이터를 가공해 특징 추출(feature extraction)·IMU 사전적분(preintegration)·다운샘플링을 수행하고, 무엇보다 데이터 연관(data association)—연속 프레임 사이에서 같은 지점이 어떻게 대응되는지—을 만들어 "단서"를 수집한다. 백엔드는 이 제약들을 모아 팩터 그래프 최적화(factor graph optimization)로 오차가 최소가 되도록 자세·지도를 동시에 추정하는 "퍼즐 풀이"를 한다. 연관에는 연속 프레임 간 단기(short-term) 연관과, 한참 뒤 같은 장소 재방문을 인식하는 장기(long-term) 연관이 있는데, 후자가 곧 루프 클로저(loop closure)다. 루프 클로저는 멀리 떨어진 두 자세 노드를 잇는 강력한 제약을 추가해 누적된 드리프트(drift)를 한 번에 잡아당겨 줄인다.

강의의 핵심 통찰은 카네기멜런 Kanade 교수의 "Correspondence, Correspondence, Correspondence"로 압축된다. 연속 모션 추정이든 루프 클로저든 SLAM의 모든 문제는 결국 데이터 간 대응관계를 정확히 잡는 문제로 귀결되며, 이는 "Garbage in, Garbage out"과 직결된다. 센서가 깨지면 → 대응관계가 깨지고 → 잘못된 제약 위에서 포즈가 어긋나고 → 그 포즈로 갱신한 지도가 무너지는 연쇄 실패가 일어난다. 거울·유리벽이 사람을 반사하거나, 곡면 금속에 LiDAR 빔이 반사되어 1m 직선 벽이 둥근 공간처럼 측정되는 것이 전형적 사례다. 따라서 강건한(robust) SLAM이란 이런 잘못된 대응(outlier)을 걸러내는 능력이다.

필드 로보틱스(Field Robotics)는 농업·숲·건설·수중·지하동굴·행성처럼 복잡하고 비정형적이며(unstructured) 예측 불가능한(unpredictable) 환경에서, 사람 개입 거의 없이 동작하는 로봇을 다룬다. 벤치마크(KITTI 등)에서 잘 도는 SLAM이 실제 로봇에서는 좁은 공간·저조도·동적 객체·비/눈·역광 같은 외란으로 쉽게 깨진다. 필드 로봇 설계에서 가장 먼저 결정되는 것은 구동부가 아니라 센서 조합(sensor suite)이다—이 환경에서 카메라가 강한지 LiDAR가 강한지, 의미 있는 측정이 어느 거리에서 들어오는지를 따져 센서 구성과 주행 방식이 모두 정해진다. 단일 센서는 약점(카메라=저조도/분진, LiDAR=거울/유리/비, 열화상=온도차 없으면 무력)이 있어 멀티모달(multi-modal) 상보 융합이 필수이고, 융합이 의미를 가지려면 센서들이 같은 순간을 가리키는 시간 동기화(time synchronization)가 전제된다.

필드 로봇이 추구하는 장기 자율(long-term autonomy)은 세 키워드의 결합이다. 강건성(Robustness)(외란 속에서도 안 깨짐), 신뢰성(Reliability)(무엇을 믿을지 불확실성을 정량화해 판단), 효율성(Efficiency)(제한된 자원으로 오래 버팀)이다. 셋은 맞물려 있다—데이터를 적게·잘 뽑으면(효율) 메모리가 안 차서 오래 돌고(자율), 좋은 정보만 남기면 외란 속 위치추정이 안정(강건)된다.

동적 환경에서의 핵심 난제는 Pose-Correspondence 문제다. 정보는 대응(correspondence) → 포즈(pose) → 지도(map) 순으로 흐르므로, 움직이는 사람·차가 랜드마크를 가려 맨 앞 단계 대응이 틀리면 오차가 누적·전파된다. 연구실의 해법은 세 갈래다. ① 자유공간(free space) 기반 온라인 동적 객체 제거—지면 위 비어 있어야 할 공간을 점이 차지하면 동적으로 판정하며, 거친→세밀(coarse-to-fine) 복셀과 슬라이딩 윈도우·재귀적 이진 베이즈 필터(recursive binary bayes filter)로 "복셀이 동적일 확률"을 누적 갱신한다. ② LiDAR-모달리티 무관(modality-agnostic) 장소 인식—LiDAR는 제조사마다(회전식 Ouster/Velodyne vs 비반복 스캔식 Livox) 스캔 패턴이 근본적으로 달라 사실상 다른 센서이므로, 포즈·스캔만 있으면 통합되는 ScanContext 계열 디스크립터(descriptor)에서 동적 객체를 제거해 강건한 단서를 만든다. ③ 중앙집중식 포즈그래프 최적화(PGO) 기반 지도 병합—GPS가 없어 각 로봇이 자기 원점에서 출발하므로, 앵커 노드(anchor node)로 좌표계를 묶고 로봇 간 루프 대응을 제약으로 추가해 한 좌표계로 정렬하며, 강건 커널(robust kernel)로 이상치 매칭의 영향력을 줄여 발산을 막는다. 이를 통합한 시스템이 Uni-Mapper(중앙집중), 이를 분산형으로 확장한 것이 SKiD-SLAM이다.

마지막으로, 지도만 믿고 갈 수는 없다(과거엔 갈 수 있던 길이 지금은 막힐 수 있음)는 인식에서 후속 파이프라인이 나온다. ① 복잡한 동역학 속에서도 자기 운동을 추정하는 강건한 상태추정(state estimation)(KISS-IMU), ② 현재 측정값에서 어디로 안전하게 갈 수 있는지 판단하는 주행가능성(traversability)(GSAT), ③ 지도 신뢰도를 높이는 방향으로 경로를 정하는 신뢰도 인지 탐사(confidence-aware exploration)(CUTE-Planner)가 순차적으로 의존한다. 특히 학습 기반 IMU 오도메트리는 직진·회전 같은 지배적 모션(dominant motion)에 편향되고 점프·넘어짐 같은 드물지만 결정적인 모션(rare but critical motion)이 과소표현되는 모션 불균형(motion imbalance) 탓에 일반화가 나빠진다는 점이 강조된다.

시험 포인트
  • Spatial AI(공간지능) — 시각·관성·공간 정보를 결합해 환경의 기하 구조와 의미를 동시에 이해하고 3D 상의 위치·형상·움직임을 예측하는 기술. 로봇 측위·지도·계획의 토대.
  • Physical AI vs 생성형 AI — Physical AI는 센서로 입력받아 액추에이터로 물리 세계와 상호작용하는 시스템; 생성형 AI는 화면 안 데이터만 다룸. "실제 환경과의 상호작용"이 구분 기준.
  • SLAM(Simultaneous Localization and Mapping) — 위치추정과 지도작성을 동시에 푸는 문제. 시험에 정의·왜 어려운지가 자주 출제.
  • Localization vs Mapping — 지도→위치 추정 = Localization, 위치→지도 작성 = Mapping. 한쪽이 정확하면 다른 쪽은 쉬워짐.
  • 닭과 달걀 문제(chicken-and-egg problem) — 지도도 위치도 모두 모르는 채 출발해 번갈아 갱신해야 하므로 SLAM이 본질적으로 어려운 이유.
  • Front-end / Back-end — 프론트엔드는 특징 추출·데이터 연관으로 제약(단서) 생성(인지 단계), 백엔드는 제약을 모아 최적화로 자세·지도 추정(그래프 최적화 단계). 웹 개발 용어와 무관.
  • 데이터 연관(Data Association) / Correspondence — 서로 다른 관측에서 같은 지점·특징을 대응시키는 일. Kanade의 "가장 중요한 세 가지=Correspondence"가 핵심—SLAM의 모든 문제가 여기로 귀결.
  • Loop Closure(루프 클로저) — "갔던 곳을 다시 방문했는가"를 인식하는 장기(long-term) 연관. 멀리 떨어진 자세 노드를 잇는 강한 제약으로 누적 드리프트를 보정. 단기 연관과 대비해 출제 가능.
  • Factor Graph Optimization(팩터 그래프 최적화) — 추정 변수(자세·랜드마크)를 노드, 측정 제약을 팩터(간선)로 둔 그래프를 최적화하는 백엔드 방식. 출력 = 추정 자세·지도.
  • IMU 사전적분(preintegration) — 고주파 IMU 측정을 매번 재적분하지 않고 미리 묶어 최적화 비용을 줄이는 기법.
  • Garbage in, Garbage out — 센서 오염 → 대응 깨짐 → 포즈 어긋남 → 지도 붕괴로 이어지는 실패 연쇄. 강건 SLAM의 동기. 거울·유리·곡면 금속 반사가 가짜 대응을 만드는 예시 기억.
  • Robust SLAM(강건한 SLAM) — 잘못된 대응(outlier)을 걸러내는 능력. 벤치마크 성공과 실환경 강건성은 전혀 다른 문제임을 구분.
  • Field Robot / Field Robotics — 비정형·예측 불가능한 실외(농업·숲·건설·수중·지하·행성) 환경에서 사람 개입 없이 동작하는 로봇/분야. 설계의 1순위는 구동부가 아니라 센서 조합.
  • Multi-modal Sensing(멀티모달) — 카메라·LiDAR·열화상·레이더 등 약점이 다른 센서를 상보적으로 융합. 한 센서가 무력화돼도 다른 센서가 보완. 저하된 인식(degraded perception) 극복 전략.
  • Time Synchronization(시간 동기화) — 서로 다른 센서가 같은 순간의 데이터를 확보하도록 맞추는 것. 융합이 신뢰성을 가지려면 반드시 필요한 전제(자주 간과됨).
  • 장기 자율 3대 키워드: Robustness·Reliability·Efficiency — 강건성(외란에 안 깨짐), 신뢰성(무엇을 믿을지 앎), 효율성(제한 자원으로 오래 버팀). 셋이 합쳐져 야지 배치 가능한 long-term autonomy. 서로 맞물린 관계 설명 가능해야 함.
  • 필드 인식 난제 6요인 — ① GPS 불가·제한 통신 ② 저가시성(안개·연기·비·눈·먼지·야간) ③ 다양한 센서 모달리티 ④ 특징 빈약 장면(사막·설원·수면·암반) ⑤ 다중 시간척도 동역학(초/분~시간/일~월) ⑥ 복잡·미지·비정형 환경.
  • Pose-Correspondence 문제 — 동적 객체가 대응을 망치면 포즈→지도로 오차가 연쇄 전파. 정보 흐름 = 대응→포즈→지도. 동적 객체 제거와 안정적 랜드마크 위주 대응이 출발점.
  • Dynamic Object Removal / Free Space Estimation — 지면 위 비어 있어야 할 공간을 점이 차지하면 동적으로 판정. coarse-to-fine 복셀 + 슬라이딩 윈도우 + 재귀 베이즈 필터로 동적 확률 누적.
  • Recursive Binary Bayes Filter(재귀 이진 베이즈 필터) — 점유격자(occupancy grid)에서 각 칸의 "참/빔" 확률을 새 관측마다 갱신. 한 프레임 노이즈에 안 휘둘리고 동적/정적을 구분.
  • ScanContext / Descriptor — 맵 기반 장소 기술자. 동적 객체가 남으면 모두 피처로 등록되어 위치인식 오차를 발산시키므로, 동적 제거된 깨끗한 디스크립터가 핵심.
  • Modality-agnostic Place Recognition — 회전식(Ouster/Velodyne) vs 비반복 스캔식(Livox)은 스캔 패턴이 근본적으로 달라 사실상 다른 센서. 포즈·스캔만으로 통합 가능한 표현이 필요한 이유.
  • Anchor Node / Anchor Factor — GPS 없이 각자 원점에서 출발한 여러 로봇의 좌표계를 묶는 기준 노드. 로봇 간 루프 제약과 함께 PGO로 단일 좌표계 정렬.
  • Robust Kernel(강건 커널) — 큰 오차를 내는 이상치 제약의 영향력을 줄여, 잘못된 루프가 섞여도 최적화가 발산하지 않게 함. 일반 최소제곱이 이상치 하나에 망가지는 것과 대비.
  • Uni-Mapper vs SKiD-SLAM — Uni-Mapper=중앙집중식(서버에 모아 병합), SKiD-SLAM=완전 분산형(메시지 풀로 디스크립터 교환, 로봇 간 위치인식·기하 매칭·아웃라이어 제거(Truncated MSE, PCM)). 중앙집중 vs 분산 비교 출제 가능.
  • State Estimation → Traversability → Local Planning — 강건한 상태추정 위에 주행가능성(현재 측정값에서 안전한 이동 영역) 판단, 그 위에 지역 경로계획. 지도만 믿고 갈 수 없는 이유(과거 가능 경로가 현재 막힘)와 연결.
  • Motion Imbalance(KISS-IMU) — 학습 기반 IMU 오도메트리가 지배적 모션(직진·회전)에 편향되고 드물지만 결정적인 모션(점프·넘어짐)이 과소표현되어 야외 일반화가 떨어지는 문제. IMU는 노이즈·드리프트가 커서 신경망 보정을 쓰되 희소 모션 균형 학습이 필요.
Week 12남우철교수님

11남우철교수님

미리 학습한 정책만으로는 빠르고 외란 큰 시스템(드론·사족보행)에서 추락하므로, 관측·행동 이력으로 현재 환경을 실시간 추정해 대응하는 적응형 강화학습(RL with Adaptation)이 핵심이며, 이를 위한 2단계 학습(특권정보 교사 → 이력 기반 적응 모듈)이 강의 전체를 관통한다.
핵심 개념

이 회차는 강화학습(Reinforcement Learning, RL)적응(Adaptation) 능력을 더해야 하는 이유에서 출발한다. RL은 에이전트가 시행착오로 보상을 최대화하는 정책을 배우는 방법이지만, 학습 환경(시뮬레이션)과 실제 사이에는 항상 Sim-to-Real gap이 존재한다. 드론처럼 동역학이 빠르고 외란(바람·무게중심·공기밀도 변화)이 큰 시스템은 이 차이를 비행 중 즉시 메워야 하므로 "적응하지 못하면 추락한다". 적응이란 "내가 이런 action을 했을 때 state가 이렇게 바뀌었다"는 경험으로 지금 환경이 어떤 환경인지를 추정해 그에 맞춰 행동을 바꾸는 것이다.

제어 실패 원인은 세 범주로 정리된다. ① 파라미터 불일치(Parameter Mismatch): 프로펠러 계수·항력계수·팔길이·질량·관성모멘트를 측정해도 100% 정확할 수 없음. ② 모델 불확실성(Model Uncertainty): 추력·항력·지면 효과(Ground effect)·센서 지연·배터리 잔량(SOC). ③ 환경 변화(Environment Variation): 풍속·풍향·돌풍·적재량. 교수는 셋 중 바람 변화 미인지가 가장 큰 실패 원인이라 보았고, 바로 이것이 적응의 동기가 된다. 특히 추력 F = k_f·ω²는 정지(static) 가정이며 실제로는 공기밀도(여름·겨울 10~20% 변동)·주변 기류·배터리에 따라 계속 변한다.

Vanilla RL vs RL with Adaptation이 핵심 대비다. Vanilla RL은 현재 관측 Observation(t)만 입력받지만, 적응형은 과거 100스텝까지의 관측·행동 이력(history)을 함께 본다. 다만 긴 이력을 정책에 직접 넣으면 입력 차원과 가중치가 폭발해 안 그래도 어려운 RL 학습이 더 나빠진다. 그래서 이력을 별도의 적응 모듈로 압축하는 설계가 필요하다. Domain Randomization(질량·마찰·바람을 무작위로 흔들어 강건성 확보)은 학습 범위를 벗어난 OOD(Out of Distribution)에서 성능이 보장되지 않는데, 적응은 "다 견뎌라"가 아니라 "현재 환경을 추정해 맞춰라"는 점에서 한 걸음 더 나아간다. 적응은 외란이 큰 시스템(드론, 비전 없는 사족보행 로봇)에서 특히 빛을 발한다.

대표 사례 RMA(Rapid Motor Adaptation)2단계 학습(Two-Phase Training) 골격을 세웠다. Phase 1에서는 시뮬레이터만 아는 특권 정보(privileged information)(질량·무게중심·마찰·지형높이·모터강도)를 환경 인자 인코더(Env Factor Encoder, μ)잠재 벡터(latent vector) z_t로 압축하고, 이를 상태와 함께 베이스 정책(Base Policy, π)에 넣어 인코더와 정책을 함께 RL로 학습한다. Phase 2(배포)에서는 특권 정보를 알 수 없으므로, 상태·행동 이력을 적응 모듈(Adaptation Module, φ)에 넣어 ẑ_t를 복원하고 이것이 Phase 1의 z_t와 같아지도록 지도학습한다. Phase 2는 RL이 아니라 supervised라서 훨씬 적은 반복(15,000 vs 1,000 iter)으로 끝난다. 또 잠재 벡터는 천천히 변하므로 적응 모듈은 10Hz, 빠른 제어가 필요한 정책은 100Hz로 비동기 실행한다.

적응 모듈을 무엇으로 학습하느냐가 관건이다. 옵션 1은 잘 걷는(정상) 데이터만으로, 옵션 2는 적응 모듈 스스로가 낸 (초기엔 엉망인) 행동으로 시뮬레이션을 돌려 나온 데이터로 학습한다. 논문은 옵션 2를 택한다. 자전거 비유: 균형이 무너지는 상황에서 핸들을 크게 흔들어 잡는 법을 배워둬야 나중에 자갈길에서도 회복할 수 있다. 이는 모방학습(imitation learning)의 한계와 연결된다 — Behavior Cloning은 전문가의 상태-행동 쌍만 흉내 내 새 상태(OOD)에서 틀린 행동을 내지만, DAgger는 정책이 실제 방문하는 상태(on-policy)에 전문가 라벨을 보강해 분포를 넓힌다. 옵션 2가 곧 이 on-policy 정신이다.

두 번째 사례(Lee et al., Science Robotics 2020)는 같은 2단계 골격에 적응형 지형 커리큘럼(Curriculum Learning)을 더했다. 핵심은 난이도를 지형 자체가 아니라 에이전트 입장에서 정한다는 것이다. Traversability(주파 가능성, Tr)는 에이전트가 잘 가면 1(쉬움)·못 가면 0(어려움)이고, 학습 효과가 가장 큰 것은 너무 쉽지도 어렵지도 않은(0.5~0.9) 지형(Terrain desirability, Td)이다. 정책이 발전하며 적정 난이도가 계속 바뀌므로, 지형 하나하나를 파티클로 두고 적정 난이도 지형에 큰 가중치를 주며 갱신하는 Particle Filter로 커리큘럼을 만든다. 학생 정책은 이력을 TCN으로 인코딩하고, 행동만이 아니라 latent까지 교사 것과 일치하도록 학습한다(Naïve IL보다 우수).

드론 파트는 왜 드론 제어가 더 어려운지로 이어진다. 드론은 앞으로 가려면 기울여야(자세를 바꿔야) 하므로 인과가 거꾸로 흐르는 계층형(Cascaded) 동역학을 가진다: 위치 → 자세 → 가속도 → 각도 → 각속도 → 모멘트 → 프로펠러 추력. 위 단계(위치, 50Hz)는 느리고 관성 좌표계(Inertial Frame)·키네매틱스에 가깝고, 아래 단계(각속도, 250Hz~1kHz)는 빠르고 몸체 좌표계(Body Frame)·다이나믹스에 가깝다. Allocation matrix(A)는 4개 프로펠러 추력→총추력·모멘트, 그 역인 Mixer matrix(M)는 원하는 추력·모멘트→각 프로펠러 추력을 준다. 사족보행은 넘어져도 되지만(High inertia, 각도 명령) 드론은 추락하면 끝이고(Low inertia, RPM 명령, 공기역학으로 모델 불완전) RPM→추력 변환이 기체마다 달라 학습이 어렵다.

이를 푸는 설계 철학이 저수준 제어 어댑테이션(Zhang et al., T-RO 2025)이다. 기체가 바뀌어도 상위 PID와 사람이 만든 궤적은 그대로 두고("No tuning needed"), 변하는 부분은 저수준 제어기가 적응으로 흡수한다. 핵심은 상위 명령에 다이나믹스가 섞인 변수를 넣지 않는다는 것 — 모멘트(힘·관성에 엮임) 대신 각속도·각도(키네매틱스)를, 추력 대신 질량 정규화 추력(thrust/mass, 가속도 차원)을 명령으로 쓴다. 또 RL이 잘 되려면 행동 결과가 즉시 상태에 드러나야 하는데, 행동인 프로펠러 속도가 가장 빨리 바꾸는 것은 추력(다이나믹스)이고 그에 가장 가까운 키네매틱 상태가 각속도·z축 가속도라 이를 상태로 넣는다. 드론은 순수 RL이 곧 추락하므로 초기엔 전문가 모방 비중을 크게, 후반엔 RL 비중을 키우는 IL-guided RL을 쓰고, 정답 궤적 없는 End-to-End 착륙에서는 Safe Region(피치·롤 40° 이하, 수직속도 1m/s 이하)을 벗어나려 하면 전문가가 개입한다.

시험 포인트
  • 강화학습(Reinforcement Learning, RL) — 에이전트가 시행착오로 보상을 최대화하는 행동 정책을 학습. 초기 샘플 효율이 나빠 학습이 잘 안 되며, 입력 차원이 커지면 더 어려워진다는 점이 적응 모듈 설계의 근거.
  • 적응(Adaptation) — 행동→상태 변화 경험으로 현재 환경을 추정해 그에 맞춰 제어하는 능력. "다 견뎌라"가 아니라 "지금 환경이 뭔지 알아내 맞춰라". 강의 전체의 핵심 키워드.
  • Sim-to-Real gap — 시뮬레이션과 실제 환경의 차이. System ID, 센서 지연, 노이즈 등이 원인. 빠른 시스템일수록 비행 중 즉시 메워야 함.
  • Vanilla RL vs RL with Adaptation — 전자는 현재 관측만, 후자는 관측·행동 이력(t~t-100)까지 입력. 단, 긴 이력을 정책에 직접 넣지 않고 적응 모듈로 압축하는 이유(입력·가중치 폭발)를 묻기 좋음.
  • Domain Randomization(도메인 무작위화) — 학습 중 질량·마찰·풍속·풍향을 무작위로 흔들어 과적합을 막고 강건성 확보. 한계는 학습 범위 밖(OOD)에서 성능 미보장.
  • OOD(Out of Distribution) — 학습 시 본 Training Range를 벗어난 구간. 적응의 강점으로 자주 제시되나, 강의자는 실제 외삽 폭이 그리 크지 않아 OOD 일반화 주장은 다소 과하다고 평가(비판적 시각도 시험 포인트).
  • 2단계 학습(Two-Phase Training) — Phase 1: 특권 정보로 교사 정책+인코더를 RL 학습(latent z_t 생성). Phase 2: 이력으로 적응 모듈이 ẑ_t를 supervised로 복원(z_t와 일치). Phase 2가 RL 아닌 지도학습이라 반복 수가 훨씬 적다.
  • 특권 정보(Privileged information) — 시뮬레이터만 아는, 실제 센서로 못 재는 환경 변수(질량·무게중심·마찰·지형높이·모터강도). 교사가 정답에 가까운 행동을 배우게 함.
  • 잠재 벡터(Latent vector, z) — 환경 인자 인코더가 압축한 환경 표현. 베이스 정책의 추가 입력이며, 적응 모듈은 이력으로 이를 복원하는 것이 목표.
  • 적응 모듈(Adaptation Module, φ) — 상태·행동 이력으로 잠재 벡터를 추정하는 네트워크. 잠재가 천천히 변해 저주파(10Hz)로 비동기 실행. 발표 마지막 강조: 행동복제 방식으로 별도 학습된다.
  • Asymmetric Actor-Critic — Critic만 시뮬레이터 특권 정보(Pitch·Roll 등)를 보고, Actor는 실제 얻을 수 있는 관측+이력만 사용. 학습은 풍부하게, 배치는 현실적으로 → Sim-to-Real에 유리.
  • 회귀 옵션 1 vs 옵션 2 — 옵션1: 정상(잘 걷는) 데이터로만 학습. 옵션2: 적응 모듈 스스로 낸 (엉망일 수 있는) on-policy 데이터로 학습 → 위기 상황 회복 가능(자전거 비유). 논문은 옵션 2 채택.
  • Behavior Cloning vs DAgger — BC는 전문가 상태-행동을 흉내만 내 새 상태(OOD)에 취약. DAgger는 정책이 실제 방문하는 상태에 전문가 라벨을 보강해 분포를 확장(옵션 2와 직결).
  • 커리큘럼 러닝(Curriculum Learning) — 쉬운 것부터 점차 어렵게. 페널티·환경 파라미터 난이도를 점진 상향. 처음부터 어려우면 학습이 안 되기 때문.
  • Traversability(Tr) / Terrain desirability(Td) — 난이도를 에이전트 관점으로 정의. Tr=1 쉬움, 0 어려움. 학습 효과가 가장 큰 적정 난이도는 Tr 0.5~0.9 구간.
  • Particle Filter(파티클 필터) — 지형 하나하나를 파티클로 두고 적정 난이도(0.5~0.9) 지형에 큰 가중치를 주며 리샘플링해 커리큘럼을 자동 갱신. 정책 수준 변화에 맞춰 난이도가 따라 올라감.
  • 비주얼 서보잉 IBVS vs PBVS — IBVS는 이미지 평면 위치를 그대로 제어 입력으로, PBVS는 추정기(예: EKF)로 3D 실제 위치를 추정한 뒤 제어. 정밀 제어엔 PBVS가 필요.
  • Reachable set(도달 가능 집합) — 현재 상태에서 일정 시간 안에 도달 가능한 모든 상태의 집합. 차량 미래 위치를 한 점이 아닌 집합으로 다뤄, 무작위로 움직여도 카메라 시야(FOV) 안에 가둬 추적 놓침 방지.
  • 계층형(Cascaded) 제어 — 위치(느림, 관성계, 50Hz) → … → 각속도(빠름, 몸체계, 250Hz~1kHz). 빠른 안쪽 루프(자세)가 느린 바깥 루프(위치)를 받침. 위는 키네매틱스, 아래는 다이나믹스.
  • Allocation matrix vs Mixer matrix — A: 프로펠러 추력→총추력·Pitch/Roll/Yaw 모멘트. M: 원하는 추력·모멘트→각 프로펠러 추력(A의 역). 제어는 사슬을 거꾸로 내려가며 M으로 RPM 명령 산출.
  • 사족보행 vs 회전익 드론 — 사족보행: 전복 비치명적, High inertia, 각도 명령, Torque-to-Angle. 드론: 추락 치명적, Low inertia(외란 취약·빠른 반응), RPM 명령, RPM-to-thrust(기체 의존·공기역학으로 모델 불완전). 드론이 더 어려운 이유를 묻기 좋음.
  • 키네매틱스 명령 원칙 — 기체가 바뀌어도 상위 제어기를 재튜닝하지 않으려면 명령에 다이나믹스 변수(모멘트·추력)를 넣지 말고 각속도·각도, 질량 정규화 추력(thrust/mass)을 사용. 변하는 부분은 저수준 적응이 흡수.
  • 상태 선택 원칙 — RL은 행동 결과가 즉시 상태에 드러나야 학습이 잘 됨. 프로펠러 속도가 즉시 바꾸는 추력에 가장 가까운 키네매틱 상태인 각속도·z축 가속도를 상태로 넣는다.
  • IL-guided RL — 드론은 순수 RL이 곧 추락하므로 초기엔 전문가 모방 비중을 크게, 학습이 진행될수록 RL 비중을 키움(가중치 α=e^(−0.001·t_epoch)).
  • Safe Region(안전 운용 범위) — 정답 궤적 없는 End-to-End 착륙에서 피치·롤 40° 이하, 수직속도 1m/s 이하 등을 벗어나려 하면 전문가가 개입해 교정하는 안전장치.
  • 드론 공기역학 효과 — ① Induced flow(하강기류)에 의한 추력 감소(호버링 시 추가 throttle 필요, 전진 시 신선한 공기로 양력 증가=Translational lift), ② Rotor drag(전진 시 advancing/retreating 블레이드 양력 비대칭), ③ Blade flapping(회전=가진=고유진동수 공진, 90° 위상 지연으로 블레이드가 앞으로 들려 추력 벡터 기울어짐). 모두 모델링이 어려워 적응이 필요한 근거.
  • RL with Adaptation 장점 — ① Zero-shot deployment(System ID 생략), ② 복잡한 물리 모델링 생략, ③ 2단계 학습으로 RL 수렴성 향상, ④ OOD 강건성.
공식의 의도

F = k_f·ω² — 프로펠러 추력은 회전수의 제곱에 비례. 역으로 풀면 원하는 추력에서 모터 RPM(ω=√(F/k_f))을 얻어 최종 명령을 산출. 단, 이는 정지(static) 가정이며 실제 추력은 기류·공기밀도·배터리에 따라 변한다는 한계가 적응의 동기.

τ_des = J·ω̇_des + ω × (Jω) (오일러 회전 방정식) — "원하는 각속도에 도달하려면 어떤 토크가 필요한가"를 물리식으로 계산해 목표 토크를 정하고, 학습된 제어기의 실제 토크가 이를 따라가도록 보상을 설계하려는 것.

Tr(c_T, π), Td := Pr(Tr ∈ [0.5,0.9]) — 지형 난이도를 에이전트 성공 여부로 정량화하고, 학습 효과가 가장 큰 적정 난이도 지형을 골라내 커리큘럼을 자동 구성하려는 의도.

Week 13장인모교수님

12장인모교수님

중앙집중형의 한계를 넘어 여러 로봇이 스스로 임무를 이해·분배·실행하는 '분산형 미션 오토노미'를, 태스크 플래닝 → 태스크 할당(연합 형성) → 모션 제어로 이어지는 계층 구조와 그 핵심 알고리즘으로 정리한 회차.
핵심 개념

이 회차의 큰 줄기는 군집·멀티로봇 시스템(Swarm / Multi-Robot Systems)이 하나의 임무를 협력 수행할 때 이를 어떻게 자율적으로 계획·할당·실행하게 만드느냐입니다. 용어 구분이 중요한데, 군집(Swarm)은 단순한 개체가 매우 많이 모여 집단 행동을 내는 쪽(새 떼·개미 군집), 멀티로봇(Multi-Robot)은 능력 있는 소수 로봇이 역할을 나눠 협업하는 쪽을 가리키는 경우가 많습니다. 자율화의 최상위 목표는 사람이 하나하나 조종하는 단계에서 벗어난 완전 자율 군집(Fully Autonomous Swarm)입니다.

이 강의를 관통하는 핵심 주장은 분산화(Decentralisation)의 필요성입니다. 오늘날 상용 군집(물류창고·공항 수하물·드론쇼)은 대부분 중앙집중형(Centralised)이라 중앙 컴퓨터가 멈추면 전체가 마비되는 단일 장애점(Single Point of Failure) 문제를 안습니다. 분산화가 필수가 되는 이유는 네 가지로 정리됩니다 — ① 통신 제약(원자력 시설의 두꺼운 벽·실내 등에서 대역폭 확보가 어려움), ② 단일 장애점 회피(국방·시골 C-ITS처럼 중앙을 못 쓰는 환경), ③ 확장성(Scalability)(로봇 수가 늘어도 자율적으로 작동), ④ 프라이버시(Privacy)(여러 벤더 협업 시 정보 공유 문제). 핵심 통찰은 "로컬 정보 + 통신 = 글로벌 정보"로, 각 로봇이 자기 주변만 알고 이웃과 소통해도 전체 문제를 풀게 만드는 것입니다.

미션 오토노미(Mission Autonomy)는 완전 자율 군집으로 가는 중간 단계 개념입니다. 자율 시스템이 자신의 세계 지식·능력·상황을 바탕으로 명시된 목표 달성을 위한 행동 방안(Course of Action, COA)을 스스로 수립·선택·실행하는 능력을 뜻합니다. COA란 목표 상태에 도달하기 위한 일련의 액션 시퀀스로, 군 교리에서는 상황 이해 → 임무 이해 → COA 생성의 흐름으로 풀립니다. 즉 "사람은 고수준 미션만 주고, 시스템이 알아서 세부 계획을 짜 수행한다"가 핵심 지향입니다. 그 직전 단계로 정책·산업계가 주목하는 것이 유무인 복합체계(Manned-Unmanned Teaming, MUM-T)로, 인간의 적응성과 멀티로봇의 확장성을 결합해 리더-팔로워 방식으로 협업하는 형태이며 소방·수색구조·재난 대응 등 민간으로도 확장됩니다.

미션 오토노미는 계층적 워크플로로 구조화됩니다. ① 미션 레벨(스웜 레벨, "무엇을/어떻게"): 태스크 플래닝(Task Planning) = 태스크 분해(Task Decomposition)(복잡한 미션을 작은 태스크로 쪼갬) + 태스크 시퀀싱(Task Sequencing)(의존성을 고려해 순서 결정), 그리고 태스크 할당(Task Allocation, "누가") = 연합 형성(Coalition Formation)(로봇 팀 구성) + 할당. ② 태스크 레벨(에이전트 레벨): 할당받은 태스크를 위한 액션 플래닝. ③ 액션 레벨: 경로/모션 플래닝과 저수준 제어. 위로 갈수록 추상적 "무엇을", 아래로 갈수록 구체적 "어떻게 움직일지"를 다룹니다. (산업계의 Shield AI도 Autonomy Management → Mission Autonomy → Platform Autonomy의 거의 동일한 3계층으로 자율성을 분해합니다.)

태스크 플래닝을 실제로 푸는 방법론은 세 갈래입니다. Trend #1 — LLM/VLM 활용: 자연어 미션을 별도 변환 없이 입력받아 분해·연합형성·할당 코드를 자동 생성(예: SMART-LLM). 유연하지만 정확성·검증이 약합니다. Trend #2 — 전통적 AI 플래닝: 현재 상태에서 목표 상태까지의 행동 순서를 자동 탐색하는 분야로, 대표 도구가 계층적 태스크 네트워크(Hierarchical Task Network, HTN)입니다. 복잡한 작업을 상위·하위 태스크로 계층 분해해, 방대한 if-else를 손으로 짜지 않고도 완전한 규칙 시스템을 갖춥니다. Trend #3 — 행동 트리(Behaviour Tree, BT): 루트에서 tick 신호가 트리를 타고 내려가 잎 노드의 실제 행동을 실행하는 구조로, 유한상태기계(Finite State Machine, FSM)보다 모듈성·가독성·반응성에서 우수합니다. 최근에는 이 셋을 묶어(LLM이 형식화 → AI 플래닝으로 순서 결정 → BT로 로봇 프로그램 생성, 실패 시 재추론하는 실패 해소 루프) 통합하는 연구가 등장하고 있습니다.

멀티로봇 태스크 할당(Multi-Robot Task Allocation, MRTA)은 분해된 태스크를 "누가 맡을지" 정하는 문제로, 본질적으로 두 질문 — "한 로봇이 어떤 태스크를 맡나(할당)" vs "한 태스크에 어떤 로봇들을 묶나(연합 형성)" — 으로 나뉩니다(동전의 양면). 경로 관점에선 TSP/VRP와 맞닿습니다. 표준 분류는 Gerkey & Matarić(2004) 택사노미로, 세 축의 조합입니다: ST/MT(로봇이 한 번에 한 태스크냐 여러 태스크냐), SR/MR(태스크에 로봇 1대로 충분한가 여러 대 필요한가), IA/TA(지금 한 번만 즉시 배분하느냐 미래 순서까지 계획하느냐). 조합이 복잡할수록(예: MT-MR-TA) 문제는 NP-hard가 되어 근사·휴리스틱·게임이론이 필요합니다.

분산형 MRTA의 기본 골격은 2단계 파이프라인입니다 — Phase 1 로컬 의사결정(각 로봇이 자기 정보로 결정) → Phase 2 충돌 해소(Conflict Resolution)(이웃과 결과를 비교·조정) → 수렴할 때까지 반복(iterative). 분산형의 진짜 난제는 서로 다른 로봇이 같은 태스크를 동시에 집으려는 충돌을 어떻게 해소하고 합의에 이르느냐이며, 그래서 이론적 수렴 증명(수렴하는가·얼마나 빨리·중앙집중 최적해 대비 얼마나 좋은가)이 결정적으로 중요합니다. 대표 분산 알고리즘으로 경매 기반의 CBBA(Consensus-Based Decentralized Auctions)와 게임이론 기반의 GRAPE(Anonymous Hedonic Game)가 있습니다. 헤도닉 게임(Hedonic Game)은 각 플레이어가 자신이 속한 그룹(연합) 자체에 선호를 갖는 모델로, 로봇을 이기적 플레이어로 두면 아무도 팀을 옮기고 싶지 않은 내시 안정 분할(Nash-stable partition)로 수렴합니다. 이 모든 알고리즘은 결국 연산-통신 트레이드오프(로컬 연산량 ↔ 통신 라운드 수)라는 하나의 지형 위에 놓이며, 통신을 줄이면 라운드당 계산이 무거워지고 그 반대도 성립합니다.

시험 포인트
  • Swarm vs Multi-Robot — 둘 다 다수 로봇 협력 시스템이나, 군집은 단순 개체 다수의 집단 행동, 멀티로봇은 능력 있는 소수의 역할 분담 협업. 정의 구분 문제로 자주 출제될 수 있음.
  • 완전 자율 군집(Fully Autonomous Swarm) — 사람 개입 없이 로봇 떼가 스스로 협력하는 자율화 사다리의 최상위 단계. 미 국방부 로드맵의 장기 목표.
  • 분산화(Decentralisation)의 4대 이유 — ①통신 제약 ②단일 장애점 회피 ③확장성 ④프라이버시. "왜 분산형인가"를 묻는 핵심 인과형 문항. 통신 없는 환경(원자력 시설·전장)이 대표 동기.
  • 중앙집중형 vs 분산형(Centralised vs Decentralised) — 중앙집중은 전역 최적해를 한 번에 계산해 깔끔하나 단일 장애점에 취약(OR식). 분산은 부분 정보로 결정해 강건하나 충돌 발생(Robotics식). 트레이드오프 비교 문제.
  • 단일 장애점(Single Point of Failure) — 중앙이 죽으면 전체가 마비되는 구조적 약점. 분산화를 요구하는 핵심 근거.
  • 로컬 정보 + 통신 = 글로벌 정보 — 분산 시스템의 핵심 통찰. 각 로봇이 주변만 알고 이웃과 소통해도 전체를 풀 수 있다는 설계 원리.
  • 미션 오토노미(Mission Autonomy) — 자율 시스템이 목표·상황·자기 능력을 바탕으로 행동 방안(COA)을 스스로 세워 실행하는 능력. 이 회차의 중심 개념.
  • 행동 방안(Course of Action, COA) — 목표 상태 도달을 위한 액션 시퀀스. 군 교리상 상황 이해 → 임무 이해 → COA 생성으로 도출됨.
  • 유무인 복합체계(MUM-T, Manned-Unmanned Teaming) — 유인·무인 자산이 팀(리더-팔로워)을 이루는 중간 단계. 완전 자율 군집 전에 먼저 거치는 단계이며 민간(소방·구조·재난)으로도 확장. 시험에 단계론으로 출제 가능.
  • 자율성 3계층 — 미션/스웜 레벨(무엇을·태스크 플래닝+할당) → 태스크/에이전트 레벨(액션 플래닝) → 액션 레벨(경로·모션·저수준 제어). 위=추상, 아래=구체. 계층 매칭 문제 빈출.
  • 태스크 분해(Task Decomposition) + 태스크 시퀀싱(Task Sequencing) — 태스크 플래닝의 두 요소: 미션을 작은 태스크로 쪼개기 + 의존성 고려한 순서 정하기.
  • 태스크 할당 vs 연합 형성(Task Allocation vs Coalition Formation) — 로봇→태스크 관점이면 할당, 태스크→로봇팀 관점이면 연합 형성. 한 대로 안 되는 무거운 작업은 연합 형성 필요. 동전의 양면 관계.
  • LLM/VLM 기반 플래닝(Trend #1) — 자연어 미션을 분해·할당 코드로 자동 생성(SMART-LLM). 장점=유연·자동화, 단점=정확성·검증 약함. VLM은 이미지+언어를 함께 이해.
  • HTN(Hierarchical Task Network, Trend #2) — 작업을 상위·하위 태스크로 계층 분해하는 AI 플래닝. if-else 수작업 없이 규칙 시스템 구현(예: GTPyhop). "플래닝=상태→목표 행동 순서 자동 탐색".
  • 행동 트리(Behaviour Tree, BT) vs FSM(Trend #3) — BT는 Root/Control/Leaf 노드로 구성, tick이 잎까지 전파되어 행동 실행. FSM 대비 ①모듈성 ②가독성 ③반응성(실패 복구)에서 우수. FSM은 상태 늘면 전이가 폭발. ROS2 NAV2가 BT 채택. A vs B 비교 단골.
  • 세 트렌드의 융합 — LLM(형식화)+AI Planning(순서)+BT(프로그램 생성), 실행 실패 시 재추론으로 전제조건 보충하는 실패 해소 루프(Failure Resolution)가 도는 통합 접근.
  • MRTA 택사노미(Gerkey & Matarić 2004) — ST/MT(로봇 멀티태스킹 여부) × SR/MR(태스크당 로봇 수) × IA/TA(즉시 vs 시간확장 할당). 약어 풀이·케이스 분류 문제 필수. ST-SR-TA=전형적 할당, ST-MR-IA=연합 형성.
  • NP-hard — 조합이 복잡해지면(MT-MR-TA 등) 정확해를 구하기 사실상 불가능 → 근사·휴리스틱·게임이론 필요. 왜 분산·근사가 필요한지의 근거.
  • 2단계 파이프라인(로컬 의사결정 → 충돌 해소 → 반복) — 모든 분산 MRTA의 공통 골격. 충돌 해소와 합의 도달이 핵심 난제.
  • 수렴(Convergence)과 그 증명 — 분산 알고리즘이 반드시 멈추는가·얼마나 빨리·최적 대비 얼마나 좋은가를 수학적으로 보장해야 함. 내시 균형 등 게임이론이 도구.
  • 헤도닉 게임 / 내시 안정 분할(Hedonic Game / Nash-stable partition) — 플레이어가 소속 그룹 자체에 선호를 갖는 게임. 아무도 팀을 옮길 이유 없는 상태가 안정 분할. GRAPE의 이론적 기반.
  • CBBA vs GRAPE — CBBA=경매(Auction) 기반(소수 에이전트·다수 태스크에 강함), GRAPE=헤도닉 게임 기반(대규모 에이전트·소수 태스크 연합 형성). 분산·비동기·임의 연결망에서 작동.
  • GRAPE의 주요 결과 — 다항시간 수렴 O(#robots²), 특수 경우 최적해의 50% 이상 보장하는 차선해 하한, 재수렴 시간(에이전트 약 4~5배, 거의 선형→확장성 양호). 분산이 빨라도 품질이 무너지지 않는다는 안전판.
  • 연산-통신 트레이드오프 — 로컬 연산량 ↔ 통신 라운드 수는 파레토 경계(Front Line)를 이룸. 한쪽을 줄이면 다른 쪽이 늘어남. 그래프 지름 d_G가 반복 복잡도에 들어가는 이유: 가장 먼 두 로봇 간 정보 전달에 그만큼의 라운드가 필요.
  • 비동기·시간평균 강연결(Asynchronous / Strongly-connected over time) — 분산 통신 가정. 매 순간 동시 통신할 필요 없고, 끊겼다 이어져도 충분한 시간이면 모두에게 정보 전달 가능. 다수 문헌은 분석 편의상 동기 설정으로 단순화함.
  • Pre-Decoupled vs Pre-Coupled — 로봇 간 의존성을 언제 끊느냐. Decoupled=미리 분리해 따로 풀어 빠르나 최적성 손해, Coupled=상호작용 함께 고려해 품질 높으나 통신·연산 부담 큼.
  • 시뮬레이터의 편의성↔충실도 트레이드오프 — Gazebo·Webots는 사실적이나 무겁고, Stage 등은 가볍지만 단순. 분산 알고리즘은 이론 증명만으론 통신 지연·충돌 같은 현실 문제를 못 봄 → 이론과 실험 사이 '중간 다리' 도구가 필요.
공식의 의도

u_i,equal = (1/|S_j|)·V_j − c_i(t_j) — GRAPE의 기본 효용 함수. 태스크 가치 V_j를 그 태스크에 모인 로봇 수 |S_j|로 나눠 "너무 많이 몰리면 1인당 보상이 줄어 자연히 분산"되게 하고, 거기서 이동 비용 c_i(t_j)를 빼 각 로봇이 이기적으로 행동해도 전체가 균형 있게 수렴하도록 유도하는 것이 의도.

u_i,S-RA = (e_i / (ê²_{S∪i}·|S_j|))·V_j − c_i(t_j) — 자원(배터리 잔량 e_i)을 효용에 반영한 확장식. 자원이 많은 로봇이 더 부담을 지고 적은 로봇은 보존되게 해, 특정 로봇만 빨리 방전되는 것을 막고 군집 전체의 장기 가동 시간을 늘리려는 의도(장기 자율운용용).

Week 14원대희수석님

13원대희수석님

왜 우주에 로봇 팔이 필요한가(폐위성·잔해 처리, 궤도상 서비싱·조립)에서 출발해, 우주 환경이 부품·재료에 주는 영향 → 각국 우주 로봇 팔 사례 → 비협조 표적 포획의 임무 단계와 베이스가 떠 있는 상황의 제어 전략(프리플라잉 vs 프리플로팅)까지 이어지는 우주 로봇 개론.
핵심 개념

뉴스페이스(New Space)는 정부·국가가 주도하던 올드스페이스(Old Space)와 대비되는 개념으로, 스페이스X 같은 민간기업이 재사용 로켓으로 발사 단가를 낮추며 우주산업을 이끄는 시대를 뜻한다. 핵심 동인은 발사 비용으로, 1kg을 궤도에 올리는 비용이 과거 1억 원대에서 1,000만 원 이내로 급감하면서 "우주에서 로봇으로 일하는 것"이 비용 측면에서 현실화되었다. 이것이 K-ARM 같은 우주 로봇 팔 개발의 배경이다.

왜 우주에 로봇 팔이 필요한가가 이 강의 전체를 관통하는 질문이다. 기존 위성은 통신·관측 같은 정적(static) 임무만 수행했고, 자세 제어용 연료가 떨어지면 태양광으로 전기는 살아 있어도 폐기될 수밖에 없다. 추력기를 못 쓰면 고도가 낮아져 떨어지고, 수명이 남았는데도 버려진 폐위성은 멀쩡한 위성과 충돌 위협이 된다. 그래서 능동적으로 위성을 살리고 치우는 작업, 즉 궤도상 서비싱(OOS, On-Orbit Servicing)이 등장했다. OOS는 ① 연료 재보급(refueling)으로 수명 연장, ② 수리·부품 교체(repair), ③ 제거/데오비팅(removal)의 세 축으로 나뉜다.

OOS에서 한 단계 더 나아가면 우주에서 직접 만들고 조립하는 ISAM(In-Space Servicing, Assembly and Manufacturing) / OSAM이다. 큰 안테나·태양전지판·망원경 주경처럼 한 번에 발사하기 어려운 대형 구조물을, 작은 모듈로 올린 뒤 로봇 팔로 궤도에서 조립하자는 발상이다("스페이스 레고"). 조립에는 반드시 로봇이 필요하므로, ISAM은 우주 로봇 수요가 커지는 근본 이유다. 별도로 통제 불능 잔해를 적극적으로 치우는 임무는 능동 잔해 제거(ADR, Active Debris Removal)라 부른다.

우주 환경은 지상 로봇과의 결정적 차이다. ① 극고진공(UHV)에서는 재료 속 가스가 빠져나오는 아웃가싱(outgassing)이 광학계를 오염시키고, 같은 금속끼리 진공에서 들러붙는 냉간용접(cold welding)이 관절을 고착시킨다. ② 방사선은 가장 큰 위협으로, 태양 입자가 지구 자기장에 갇혀 만든 밴앨런대(Van Allen belt)(특히 양성자가 몰린 영역, 지상에선 남대서양 이상대 SAA)를 지날 때 전자부품이 오작동·고장난다. ③ 원자산소(atomic oxygen)는 저궤도에서 고분자 계열 접착제·필름·코팅 표면을 깎아낸다. ④ 햇빛면/그늘면 수백 도 극한 온도차, ⑤ 발사 시 극심한 진동, ⑥ 미소운석·우주쓰레기(MMOD)의 초고속 충돌도 위협이다.

방사선이 부품에 주는 대표 고장은 시험에 자주 나온다. 단일 사건 효과(SEE/SEU)는 입자 하나가 메모리 비트를 뒤집어(bit flip) 저장값을 바꿔, 지상에서 내리지 않은 엉뚱한 명령이 실행될 위험을 만든다. SEL(래치업)은 전압이 갑자기 바뀌며 소자가 잠기는 현상, TID(총이온화선량)는 임무 내내 누적되어 수명을 갉아먹는 효과(엑스레이 피폭 누적에 비유), DD(변위손상)는 격자 손상이다. 대응으로 차폐(shielding)가 필요한데 차폐는 곧 무게다. 기준은 알루미늄 약 3.81mm(150mil)이고, 가벼운 CFRP는 차폐력이 거의 없어 얇은 텅스텐(W)을 끼워 경량과 차폐를 동시에 잡는 복합 구조를 쓴다.

우주는 A/S(사후 수리)가 없다는 점이 시스템 엔지니어링(SE)의 엄격함을 낳는다. 요구사항→설계→검증을 V-모델의 게이트형 리뷰(MDR·SRR·PDR·CDR→TRR·MRR)로 관리해, 문제가 남으면 다음 단계로 넘어가지 않는다. 비행품을 한 번에 만들지 않고 DM→EM/EQM→QM→FM 순으로 모델을 단계적으로 만들어, 인증모델(QM)에서 진공·극한온도·worst case를 모두 시험하고 통과 후 실제 비행품(FM)은 아낀다. 비싼 우주급 부품과 상용품(COTS)을 어디에 쓸지는 제품보증(PA)·신뢰도 분석으로 균형을 잡는다.

제어의 출발점은 베이스(base)가 무엇이냐다. 캐나다암처럼 ISS·셔틀에 붙으면 베이스 관성 I_s가 팔 관성 I_m보다 압도적으로 커서(고정 베이스), 중력만 사라졌을 뿐 지상 산업용 로봇과 비슷하게 다룰 수 있다. 반대로 작은 위성에 팔을 달면 둘의 관성이 비슷해(이동 베이스), 팔을 움직이는 순간 반작용으로 본체가 같이 돌고 떠밀린다("튜브에 둘이 탄 상태"). 이 결합을 어떻게 다루느냐가 우주 로봇 제어의 핵심 난제다.

그래서 두 모드를 구분한다. 프리플로팅(Free-Floating)은 추력기를 꺼 베이스를 능동 제어하지 않는 상태로, 연료를 안 쓰고 플룸도 없으며 빠른 조작이 가능하지만, 잔여 운동량으로 베이스가 표류(drift)해 팔이 작업공간 한계까지 펼쳐지고 접촉 시 흔들린다. 프리플라잉(Free-Flying)은 추력기로 베이스 자세까지 제어해 완전한 도달성·정확한 자세를 얻지만, 연료 소모(=수명 단축)·플룸 충돌·추력기 포화·낮은 제어율(MIB 한계)이 단점이다. 절충으로 베이스 운동과 팔 운동의 결합을 끊어내는(decoupling) 전략, 그리고 연료 없는 자세 제어를 위해 반작용휠(reaction wheel)을 함께 쓰는 전신제어(WBC)가 연구된다.

비협조 표적 포획(capture)은 정해진 임무 단계를 따른다: 발사→위상조정(phasing)→원거리/근거리 랑데부→V-bar/R-bar 접근→표적 인식·계획→접촉(래칭)→안정화→디텀블링(detumbling)→실제 서비스. 표적이 협조적(cooperative)이면 자세를 유지해줘 쉽지만, 연료가 다해 굴러다니는 비협조(non-cooperative) 잔해는 신호도 제어도 주지 않아 카메라·라이다로 스스로 상태를 파악하고 회전부터 죽여야 한다. 잡는 순간 접촉력으로 위성이 흔들리므로, 무중력에서 동시에 강하게 물면 튕겨 날아가는 것을 막기 위해 와이어로 살짝 잡는 소프트 캡처 후 천천히 당겨 래치로 고정하는 하드 캡처 2단계(캐나다암의 스네어)를 쓴다.

시험 포인트
  • New Space / Old Space — 민간 주도(재사용 로켓·저비용) vs 정부 주도. 발사비용 급감이 우주 로봇 산업 활성화의 근본 동인. "왜 지금 우주 로봇인가"의 답.
  • OOS(On-Orbit Servicing, 궤도상 서비싱) — 연료 재보급·수리·제거로 위성 수명을 늘리는 작업. 세 축(refueling/repair/removal) 구분이 출제 포인트.
  • ADR(Active Debris Removal, 능동 잔해 제거) — 통제 불능 잔해를 적극적으로 포획·디오빗. ClearSpace-1, ELSA-d, ADRAS-J 등이 사례.
  • ISAM / OSAM(In-Space/On-orbit Servicing, Assembly and Manufacturing) — 우주에서 직접 조립·제조. 대형 구조물을 모듈로 올려 로봇 팔로 조립("스페이스 레고"). 로봇 팔 수요의 핵심 이유.
  • 도킹(docking) vs 버싱(berthing) — 도킹은 우주선이 스스로 결합, 버싱은 로봇 팔로 잡아 붙임. ISS의 Canadarm으로 화물선을 잡아 도킹하는 것이 버싱.
  • 데오비팅(deorbiting) / 탄도계수(ballistic coefficient) — 폐위성을 대기권으로 떨어뜨려 소멸. 폐기 시간은 탄도계수(≈질량÷항력계수·단면적)에 좌우, 무겁고 작을수록 천천히 떨어짐. 드래그 세일로 항력을 키워 20~30년→4~5년 단축. 초속 7~8km라 추력으로 곧장 떨어뜨리려면 연료가 막대.
  • 케슬러 증후군(Kessler syndrome) — 잔해 충돌이 또 다른 잔해를 낳는 연쇄로 궤도가 못 쓰게 되는 현상. ADR이 중요한 이유.
  • 밴앨런대(Van Allen belt) / SAA(남대서양 이상대) — 지구 자기장에 갇힌 고에너지 양성자·전자 영역. 통과 시 전자부품 오작동. 지상 투영점이 가장 심한 곳이 남대서양 상공.
  • SEU / SEL / TID / DD — SEU(단일사건반전): 비트 뒤집힘 → 엉뚱한 명령 위험. SEL(래치업): 소자 잠김. TID(총이온화선량): 누적 피폭으로 수명 단축. DD(변위손상): 격자 손상. 방사선 고장 4종으로 묶어 출제 가능.
  • 아웃가싱(outgassing) / 냉간용접(cold welding) — 진공 환경의 두 문제. 아웃가싱은 가스 방출로 광학계 오염, 냉간용접은 진공에서 금속끼리 들러붙어 관절 고착.
  • 원자산소(atomic oxygen) — 저궤도(LEO)에서 고분자 접착제·필름·코팅·복합재 표면을 침식. 자외선·이온 조사로 가속.
  • MMOD(미소운석·우주쓰레기) / 초고속 충돌 — 작은 조각도 총알의 10배 속도라 위성을 파괴. ≥10cm 약 4만, ≥1cm 약 110만, ≥1mm 약 1.3억 개.
  • 주석 휘스커(tin whisker) — 주석 도금이 실처럼 자라 합선(short) 유발. 코팅으로 예방. 발사 진동에 의한 PCB 균열, CCD 죽은 픽셀도 흔한 고장.
  • 차폐와 무게 / CFRP+텅스텐 — 차폐는 곧 무게. 기준 알루미늄 3.81mm(150mil). CFRP는 가볍지만 차폐력 거의 없어 얇은 W(0.1mm)를 끼우면 28.7MeV까지 막고 Al 대비 무게 90%. 폴리에틸렌(수소多)은 더 가볍지만(68%) 두꺼움.
  • 구조 재료(경량화) — 위성 무게=비용. 알루미늄 합금(2/6/7xxx, 차폐+경량)이 주력, 외피는 고강도 7000/2000계, 넓은 패널은 허니컴. 마그네슘·Mg-Li은 초경량+재진입 시 잘 타 없어짐(demise). 망원경엔 가벼운 마그네슘.
  • SE(시스템 엔지니어링) / V-모델 / 게이트 리뷰 — A/S 없는 우주에서 "한 번에 제대로". MDR·SRR·PDR·CDR(설계) → TRR·MRR(검증). 문제 남으면 다음 단계로 안 넘어감.
  • 개발 모델 단계(DM/EM·EQM/QM/FM) — DM: 형상 같으나 우주급 부품 미사용. QM(인증모델): 진공·극한온도·worst case 풀 인증. FM(비행모델): 통과 후 간단 점검만 하고 발사. 비싼 비행품을 아끼려 단계적 검증.
  • PA(제품보증) / 이력추적 / ITAR — 부품 하나(저항까지)도 추적·인증, 미국 수출제한(ITAR) 여부 확인. 신뢰도 분석으로 설계수명·COTS 사용 균형.
  • TRL(Technology Readiness Level) — 기술성숙도 1~9. TRL3=개념실증(PoC), TRL6=관련 환경(열-진공 챔버 등) 시제품 검증. 실임무 투입엔 단계가 더 남음.
  • 탑재체(payload, 페이로드) — 상대적 개념. 로켓엔 위성이, 위성엔 로봇 팔이 탑재체. 그래서 위성 개발팀과 팔 개발팀의 역할이 나뉨.
  • 대표 우주 로봇 팔 — Canadarm 1·2·3(2는 ISS 17.6m·7-DOF, 3은 게이트웨이용 자율), Dextre(SPDM, 정밀 "손"), JEMRMS(일본 키보, 고정형), CSSRMS(중국), ERA(유럽, 양 끝 번갈아 고정해 이동), OEDMS/Orbital Express(미·DARPA, 급유·부품교체 실증), ETS-VII(일본, 세계 최초 무인 랑데부·도킹·로봇팔), FREND(7-DOF, 그래플 픽스처 없는 위성도 비전으로 포획), MRV/MEP(GEO 수명연장 상업모델).
  • 재배치형(relocatable)·대칭형 팔 / 자벌레(inchworm) — 한쪽 끝을 베이스로 고정, 반대쪽으로 작업하고 끝을 옮겨 붙이면 베이스가 뒤바뀜. 적은 팔로 넓은 작업공간 확보. 우주에선 팔마다 받침대 설치가 천문학적 비용이라 표준화되는 추세(GITAI 등).
  • 고정 베이스 vs 이동 베이스I_s≫I_m(셔틀·ISS): 지상 로봇처럼 다룸. I_s≥I_m(추격·표적 위성): 팔 움직이면 본체가 반작용으로 따라 움직임 → 별도 모델링 필요.
  • Free-Flying vs Free-Floating — ★핵심 구분. 프리플라잉=추력기로 베이스 제어(도달성·자세 정확 / 연료소모=수명, 플룸, 포화, 낮은 제어율). 프리플로팅=추력기 끔(무연료·무플룸·고속 / 표류, 좁은 작업공간, 접촉 시 의도치 않은 드리프트).
  • 플룸 충돌(Plume Impingement) / MIB(Minimum Impulse Bit) — 플룸: 추력기 배기가 표적·주변 부품 교란·오염. MIB: 추력기 최소 분사량이 정해져 미세 제어 불가 → 모멘텀을 정확히 0으로 못 맞춤(프리플로팅의 "영모멘텀 가정"이 깨지는 이유).
  • 디커플링(decoupling): 완전 vs 부분 — 한 부분을 제어해도 다른 부분이 끌려가지 않게 함. 추력기 힘(force)은 병진이라 관절 토크와 깔끔히 분리되지만, 모멘트(토크)는 회전을 일으켜 팔 운동과 결합 → 그래서 "부분" 디커플링. 완전 디커플링은 베이스 요구 없이 엔드이펙터·CoM만 제어.
  • 반작용휠(reaction wheel) / 운동량 덤핑(momentum dumping) — 휠 각운동량을 바꿔 위성을 반대로 돌림(무연료 자세제어). 한 방향으로 계속 돌면 포화(saturation) → 추력기로 운동량을 버려 풀어줌. 장기 임무에 유리.
  • 협조 vs 비협조 표적 / 텀블링 / 디텀블링 — 협조 표적은 자세 유지로 작업 쉬움. 비협조(연료 다한 잔해)는 신호·제어 없이 텀블링 → 카메라·라이다로 인식 후 회전을 죽이는 디텀블링이 선행. 비접촉 와전류(eddy current) 감속도 연구.
  • 임무 단계(Mission Phases) — 발사→위상조정→원/근거리 랑데부→V-bar/R-bar 접근→인식·계획→접촉(래칭)→안정화→디텀블링→서비스. 순서 자체가 출제 가능.
  • V-bar / R-bar — 표적 기준 접근 축. V-bar=진행(속도) 방향, R-bar=지구 중심(반경) 방향. 궤도역학 때문에 아무 방향 직선 접근은 궤도가 어긋나, 이 두 축을 따라 천천히 접근해 충돌 위험을 줄임.
  • 소프트 캡처 vs 하드 캡처 / 스네어(snare) — 무중력에서 동시에 강하게 물면 반작용으로 위성이 튕겨 날아감 → 와이어로 부드럽게 잡아(소프트) 충격 흡수 후 래치로 단단히 고정(하드). 캐나다암 끝단의 스네어 메커니즘.
  • 포획 메커니즘 종류 — 프로브-콘(probe-cone, SRMS·LEE·ERA), 훅-클로(hook-claw, Orbital Express·SARAH), 그래플 픽스처(grapple fixture), 스네어. 표적 인터페이스에 맞춰 선택.
  • 그래플 픽스처(grapple fixture) / 런처(Marman) 링 — 잡기 위한 전용 손잡이. 비협조 위성엔 그래플 픽스처가 없으므로, 거의 모든 위성에 공통인 발사체 고정부 런처 링(Marman ring)을 비전 마커로 인식해 포획점으로 삼음.
  • 일반화 자코비안(generalized Jacobian) / FFSM — 자유부유 우주 매니퓰레이터(FFSM)에서 베이스가 수동 관절(passive joint)이라, 운동량 보존으로 베이스 속도를 소거하고 관절속도와 엔드이펙터를 잇는 자코비안. 잡은 물체의 미지 질량은 잔여 질량(residual mass) 항으로 보정(불확실성 인지 IK).
  • H∞ 강건 제어 — 잡은 물체의 질량·관성을 모르는(모델링 오차) 상황에서, 그 오차를 외란처럼 취급해 오차 증폭을 일정 한도(γ) 이하로 보장하는 제어. 우주에선 표적 질량을 모를 때가 많아 특히 유용.
공식의 의도

I_s ≫ I_m (고정 베이스) vs I_s ≥ I_m (이동 베이스) — 베이스 관성과 팔 관성의 상대 크기로 제어 난이도를 가르는 기준. 베이스가 압도적으로 크면 지상 로봇처럼, 비슷하면 반작용을 고려한 별도 모델링이 필요함을 한눈에 보이려는 분류식.

M_b q̇_b + M_bm q̇_m + M_bw q̇_w = 0 (운동량 보존) — 추력기를 끈 프리플로팅에서 베이스에 외력이 없을 때 전체 운동량이 보존된다는 조건. 이로부터 베이스 속도를 소거해 "팔만 움직였는데 본체가 끌려가는" 결합을 정량화하고, 일반화 자코비안을 끌어내려는 의도.

∫(xᵀQx + uᵀRu)dt ≤ γ²∫wᵀw dt (L2-게인 조건) — 최악의 외란/모델오차 w에 대해서도 상태·입력 오차의 증폭을 γ² 이하로 묶겠다는 H∞ 제어의 약속. 잡은 물체 질량을 몰라도 성능을 보장하려는 강건 제어의 핵심 부등식.