관리 메뉴

πŸ–₯ dev-ruby

[인곡지λŠ₯] 6-2 κ³„νšμˆ˜λ¦½ λ³Έλ¬Έ

인곡지λŠ₯

[인곡지λŠ₯] 6-2 κ³„νšμˆ˜λ¦½

ruby_s 2021. 12. 12. 21:16
728x90
λ°˜μ‘ν˜•
SMALL

고전적 κ³„νš 수립

μƒνƒœκ³΅κ°„ κ³„νšμˆ˜λ¦½ : 초기 μƒνƒœμ—μ„œ λͺ©ν‘œ μƒνƒœλ‘œμ˜ 경둜 탐색

  • 초기 μƒνƒœλ₯Ό λͺ©ν‘œ μƒνƒœλ‘œ λ³€ν™” μ‹œν‚€λŠ” 일련의 μ—°μ‚°μž μ°ΎκΈ°
  • λ…Έλ“œ(node) : μ„Έκ³„μ˜ μƒνƒœ
  • 에지(edge) : μƒνƒœ 전이λ₯Ό μΌμœΌν‚€λŠ” 행동
  • 행동 = λ°”λ‘œ μ μš©ν•  수 μžˆλŠ” κΈ°λ³Έ 행동
    • μ—°μ‚°μž(operator) = κΈ°λ³Έ 행동
  • μ „ν–₯ 탐색
    • 초기 μƒνƒœμ—μ„œ μ‹œμž‘
    • μ μš©κ°€λŠ₯ν•œ μ—°μ‚°μžλ₯Ό λͺ©ν‘œ μƒνƒœμ— 도달할 λ•ŒκΉŒμ§€ 적용
    • λ„ˆλΉ„μš°μ„  탐색(Breadth-first search)
    • κΉŠμ΄μš°μ„  탐색(Depth-first search)
    • νœ΄λ¦¬μŠ€ν‹± 탐색 : A* μ•Œκ³ λ¦¬μ¦˜
  • ν›„ν–₯ 탐색
    • λͺ©ν‘œ μƒνƒœμ—μ„œ μ‹œμž‘
    • ν•΄λ‹Ή μƒνƒœλ₯Ό λ§Œλ“€μ–΄λ‚΄λŠ” 행동선택을 μ‹œμž‘ μƒνƒœμ— 도달할 λ•ŒκΉŒμ§€ 반볡
  • STRIPS μ•Œκ³ λ¦¬μ¦˜
    • ν›„ν–₯ 탐색 방법
    • λͺ©ν‘œ μƒνƒœκ°€ λ§Œμ‘±λ˜μ§€ μ•ŠμœΌλ©΄, λͺ©ν‘œ μƒνƒœλ₯Ό effect둜 λ§Œλ“€ 수 μžˆλŠ” μ—°μ‚°μžλ₯Ό μ„ νƒν•˜μ—¬ μ—°μ‚°μžμ˜ λ§€κ°œλ³€μˆ˜λ₯Ό μ„€μ •ν•˜κ³  precondition이 λ§Œμ‘±λ˜λŠ”μ§€ 확인
    • precondition 쀑에 λ§Œμ‘±λ˜μ§€ μ•ŠλŠ” 것이 있으면, 그것을 effect둜 ν•˜μ—¬ μœ„ κ³Όμ • 반볡
    • λͺ¨λ“  precondition듀이 만쑱되면 μ‚¬μš©λœ λ§€κ°œλ³€μˆ˜ μ„€μ •λœ μ—°μ‚°μžλ“€μ„ μ—­μˆœμœΌλ‘œ λ‚˜μ—΄ν•˜μ—¬ κ³„νšμƒμ„±
  • GraphPlan μ•Œκ³ λ¦¬μ¦˜
    • κΈ°μ‘΄ κ³„νšκ³΅κ°„ κ³„νšμˆ˜λ¦½μ— λΉ„ν•΄ 맀우 λΉ λ₯Έ 속도
    • λͺ…μ œ 단계와 행동 단계가 λ²ˆκ°ˆμ•„κ°€λ©° ꡬ성

λͺ…μ œ 단계 0

  • μ΄ˆκΈ°μƒνƒœμ— μ£Όμ–΄μ§€λŠ” 각 λ¦¬ν„°λŸ΄μ„ λ…Έλ“œλ‘œ ν‘œν˜„

행동 단계 1

  • λͺ…μ œ 단계 0의 λͺ…μ œλ“€μ— λŒ€ν•΄μ„œ 적용될 수 μžˆλŠ” 각 행동을 λ…Έλ“œλ‘œ ν‘œν˜„
  • λͺ…μ œ 단계 0에 λ‚˜νƒ€λ‚˜λŠ” Precondition의 λ¦¬ν„°λŸ΄ λ…Έλ“œμ™€ μ—°κ²°
  • λͺ…μ œ 단계 2에 λ‚˜νƒ€λ‚˜λŠ” Effect의 λ¦¬ν„°λŸ΄ λ…Έλ“œμ™€ μ—°κ²°

λͺ…μ œ 단계 2

  • 행동 단계 1의 ν–‰λ™μ˜ Effects 뢀뢄에 λ‚˜νƒ€λ‚˜λŠ” λ¦¬ν„°λŸ΄λ“€κ³Ό λͺ…μ œ 단계 0의 λ¦¬ν„°λŸ΄λ“€μ— λŒ€μ‘ν•˜λŠ” λ…Έλ“œ 생성
  • λͺ…μ œ 단계 0의 λͺ¨λ“  λ…Έλ“œλ₯Ό λͺ…μ œ 단계 2에 μœ μ§€

행동 단계 3와 λͺ…μ œ 단계 4λ₯Ό λ™μΌν•œ λ°©λ²•μœΌλ‘œ 반볡

행동 단계와 λͺ…μ œ 단계 ν™•μž₯

 

κ³„νšμˆ˜λ¦½ κ·Έλž˜ν”„μ˜ ν™•μž₯

  • μƒν˜Έλ°°μ œ 링크
    • 행동 단계와 λͺ…μ œ 단계 ν•œ 쌍의 μΆ”κ°€μ‹œ, λ™μ‹œμ— μ‹€ν–‰λ˜κ±°λ‚˜ 만쑱될 수 μ—†λŠ” 동일 λ‹¨κ³„μ˜ λ…Έλ“œλ“€ 사이 μ—°κ²°
  • 행동 λ‹¨κ³„μ˜ μƒν˜Έλ°°μ œ
    • μƒμΆ©λ˜λŠ” κ²°κ³Ό λ„μΆœ : ν•œ ν–‰λ™μ˜ effectκ°€ λ‹€λ₯Έ ν–‰λ™μ˜ effectκ°€ λ§Œλ“œλŠ” λͺ…μ œλ₯Ό μ œκ±°ν•˜λŠ” 경우
    • κ°„μ„­ : ν•œ 행동이 λ‹€λ₯Έ ν–‰λ™μ˜ preconditionμ—μ„œ μ‚¬μš©λ˜λŠ” λͺ…μ œλ₯Ό μ œκ±°ν•˜λŠ” 경우
    • κ²½μŸκ΄€κ³„ 사전쑰건 : 두 행동이 직전 λ‹¨κ³„μ—μ„œ μƒν˜Έλ°°μ œκ΄€κ³„μ— μžˆλŠ” λͺ…μ œλ“€μ„ preconditionμ—μ„œ μ‚¬μš©ν•˜λŠ” 경우
  • λͺ…μ œ λ‹¨κ³„μ˜ μƒν˜Έλ°°μ œ
    • μƒμΆ©λ˜λŠ” 지지 : λŒ€μ‘λ˜λŠ” 두 λͺ…μ œλ₯Ό λ§Œλ“€μ–΄λ‚΄λŠ” 이전 λ‹¨κ³„μ˜ λͺ¨λ“  행동이 μ„œλ‘œ μƒν˜Έλ°°μ œ 관계에 μžˆλŠ” 경우

κ³„νšκ³΅κ°„ κ³„νšμˆ˜λ¦½

  • κ³„νšκ³΅κ°„ : λͺ¨λ“  κ°€λŠ₯ν•œ (λΆ€λΆ„)κ³„νšμ˜ 집합
  • λ…Έλ“œ : λΆ€λΆ„κ³„νš
  • 엣지 : λΆ€λΆ„κ³„νšμ„ λ³€ν™˜ν•˜λŠ” μ—°μ‚°μž

계측적 κ³„νšμˆ˜λ¦½

  • νŠΉμ • μ˜μ—­μ˜ λ¬Έμ œν•΄κ²°μ„ μœ„ν•œ μž‘μ—… 방법에 λŒ€ν•œ 지식을 μ—¬λŸ¬ 좔상화 μˆ˜μ€€μ˜ 계측적인 ꡬ쑰둜 기술
  • 좔상적인 κ³„νšμ—μ„œ μ‹œμž‘ν•˜μ—¬ 점점 ꡬ체적인 κ³„νšμœΌλ‘œ ꡬ성
  • HTN μ•Œκ³ λ¦¬μ¦˜

 

728x90
λ°˜μ‘ν˜•
LIST