[최적제어] Differential game (1)

2023. 10. 4. 14:13·연구 Research/제어 Control

Game theory는 수학 분야 중의 하나로 여러 agents가 있을 때의 최적 의사결정을 다루는 학문이다.

 

Game theory는 경제, 통신 등 다양한 분야에서도 쓰이지만 Optimal control 분야에서도 많이 쓰이는데 대표적으로 Pursuit-evasion problem이다.

이는 Non-cooperative, two player, zero-sum game으로 볼 수 있고 이에 대한 formulation을 Pontryagin's maximum principle과 Bellman's equation 두 가지 approach를 통해 analytical solution을 구할 수 있다.

 

Pontryagin's maximum principle의 경우에는 시간에 대한 입력으로 결과가 나오기 때문에 open loop control이라고 볼 수 있다.

 

Bellman's equation은 closed loop control 형태로 나온다는 특성이 있다.

 

 

Bellman's equation을 적용해서 어떤 문제든 쉽게 풀 수 있으면 좋겠지만 기존의 Game theory 문제 중에 가정을 붙여서 Issac's equation이 도출되었다. (줄여서 HJBI라고도 부르는 듯)

 

여기서 가정은

1) The game is two players, zero-sum, and pursuit-evasion type. Being a pursuit-evasion game implies that final time is free (i.e., to be optimized), but this condition can be relaxed [8, p. 34].
• The Hamiltonian is separable on its controls [8, p. 35]

 

이 equation을 풀기 위해서 해석적이든, 수치적이든 풀 수 있고 State-dependent Riccati Equation(SDRE)을 이용해서 풀어낸 논문도 있다.

 

일단 Pursuit-evasion game을 정의하고 이를 푸는 전통적인 방법을 살펴본다.

그 다음에는 최근에 나온 풀이방법을 살펴보면 될 것 같다.

 

 


 

 

참고문헌

Parras, J., del Val, J., Zazo, S., Zazo, J., & Macua, S. V. (2016, June). A new approach for solving anti-jamming games in stochastic scenarios as pursuit-evasion games. In 2016 IEEE Statistical Signal Processing Workshop (SSP) (pp. 1-5). IEEE.

DW Yeung, LA Petrosjan, Cooperative stochastic differential games.

 

저작자표시 비영리 변경금지 (새창열림)

'연구 Research > 제어 Control' 카테고리의 다른 글

[제어] Uncertainty 개념  (0) 2022.12.21
[비선형제어] Diffeomorphism  (0) 2022.12.20
[제어] eigenvalue와 stability 분석 (algebraic multiplicity와 geometric multiplicity의 차이)  (0) 2022.12.14
[제어] Lyapunov stability theorem 증명  (0) 2022.09.29
[MATLAB] 3차원 vector field diagram과 시뮬레이션 결과 mapping  (0) 2022.09.26
'연구 Research/제어 Control' 카테고리의 다른 글
  • [제어] Uncertainty 개념
  • [비선형제어] Diffeomorphism
  • [제어] eigenvalue와 stability 분석 (algebraic multiplicity와 geometric multiplicity의 차이)
  • [제어] Lyapunov stability theorem 증명
보통의공대생
보통의공대생
수학,프로그래밍,기계항공우주 등 공부하는 기록들을 남깁니다.
  • 보통의공대생
    뛰는 놈 위에 나는 공대생
    보통의공대생
  • 전체
    오늘
    어제
    • 분류 전체보기 (470)
      • 공지 (1)
      • 영어 공부 English Study (40)
        • 텝스 TEPS (7)
        • 글 Article (21)
        • 영상 Video (10)
      • 연구 Research (99)
        • 최적화 Optimization (3)
        • 데이터과학 Data Science (7)
        • 인공지능 Artificial Intelligent (40)
        • 제어 Control (45)
      • 프로그래밍 Programming (103)
        • 매트랩 MATLAB (25)
        • 파이썬 Python (33)
        • 줄리아 Julia (2)
        • C++ (3)
        • 리눅스 우분투 Ubuntu (6)
      • 항공우주 Aeronautical engineeri.. (21)
        • 항법 Navigation (0)
        • 유도 Guidance (0)
      • 기계공학 Mechanical engineering (13)
        • 열역학 Thermodynamics (0)
        • 고체역학 Statics & Solid mechan.. (10)
        • 동역학 Dynamics (1)
        • 유체역학 Fluid Dynamics (0)
      • 수학 Mathematics (34)
        • 선형대수학 Linear Algebra (18)
        • 미분방정식 Differential Equation (3)
        • 확률및통계 Probability & Sta.. (2)
        • 미적분학 Calculus (1)
        • 복소해석학 Complex Analysis (5)
        • 실해석학 Real Analysis (0)
      • 수치해석 Numerical Analysis (28)
      • 확률 및 랜덤프로세스 Random process (2)
      • 추론 & 추정 이론 Estimation (3)
      • 기타 (26)
        • 설계 프로젝트 System Design (8)
        • 논문작성 Writing (56)
        • 세미나 Seminar (2)
        • 생산성 Productivity (3)
      • 실험 Experiment (1)
      • 유학 생활 Daily (8)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    에러기록
    LaTeX
    Dear abby
    Linear algebra
    서버
    논문작성법
    텝스공부
    Numerical Analysis
    고체역학
    matplotlib
    수치해석
    생산성
    논문작성
    JAX
    WOX
    IEEE
    옵시디언
    pytorch
    Julia
    인공지능
    Zotero
    ChatGPT
    obsidian
    MATLAB
    딥러닝
    Python
    Statics
    텝스
    teps
    우분투
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
보통의공대생
[최적제어] Differential game (1)
상단으로

티스토리툴바