관리 메뉴

πŸ–₯ dev-ruby

[인곡지λŠ₯] 6-1 κ³„νšμˆ˜λ¦½ λ³Έλ¬Έ

인곡지λŠ₯

[인곡지λŠ₯] 6-1 κ³„νšμˆ˜λ¦½

ruby_s 2021. 12. 11. 19:54
728x90
λ°˜μ‘ν˜•
SMALL

κ³„νšμˆ˜λ¦½

주어진 κ³„νšμˆ˜λ¦½ 문제의 μž„μ˜μ˜ 초기 μƒνƒœμ—μ„œ λͺ©ν‘œ μƒνƒœ μ€‘μ˜ ν•˜λ‚˜λ‘œ 도달할 수 있게 ν•˜λŠ” 일련의 행동을 μƒμ„±ν•˜λŠ” 것

λ‘œλ΄‡μ˜ κ³„νš 수립

  • μ›€μ§μž„ κ³„νšμˆ˜λ¦½ : μ›ν•˜λŠ” μ›€μ§μž„ μž‘μ—…μ„ μˆ˜ν–‰ν•˜λ„λ‘ μ œμ•½μ‘°κ±΄μ„ λ§Œμ‘±μ‹œν‚€λ©΄μ„œ μ΅œμ†Œ λΉ„μš©μœΌλ‘œ 일련의 μ›€μ§μž„μ„ μ°Ύμ•„λ‚΄λŠ” 일
  • 경둜 κ³„νšμˆ˜λ¦½ : μ‹œμž‘ μœ„μΉ˜μ—μ„œ λͺ©μ  μœ„μΉ˜λ‘œ κ°€κΈ° μœ„ν•΄ κ΄€μ ˆμ΄λ‚˜ 바퀴λ₯Ό μ΄λ™μ‹œν‚¬ 순차적인 μœ„μΉ˜λ₯Ό κ²°μ •ν•˜λŠ” 일
  • ꢀ적 κ³„νšμˆ˜λ¦½ : 주어진 κ²½λ‘œμ™€ μ œμ•½μ‘°κ±΄μ„ κ³ λ €ν•˜μ—¬ 맀 μ‹œμ μ˜ κ΄€μ ˆ λ“±μ˜ μœ„μΉ˜, 속도, 가속도λ₯Ό κ²°μ •ν•˜λŠ” 일

κ³„νšμˆ˜λ¦½ 문제의 κ΅¬μ„±μš”μ†Œ

  • μ΄ˆκΈ°μƒνƒœμ— λŒ€ν•œ λͺ…μ„Έ
  • μ›ν•˜λŠ” λͺ©ν‘œ μƒνƒœμ— λŒ€ν•œ λͺ…μ„Έ
  • κ°€λŠ₯ν•œ 행동듀에 λŒ€ν•œ λͺ…μ„Έ

κ³„νšμˆ˜λ¦½ 문제의 ν˜•νƒœ

1. 고전적 κ³„νšμˆ˜λ¦½

  • κ°€μž₯ κ°„λ‹¨ν•œ κ³„νšμˆ˜λ¦½ 문제 λΆ€λ₯˜
  • κΈ°λ³Έμ „μ œ
    • 초기 μƒνƒœλŠ” ν•˜λ‚˜λ§Œ 주어진닀.
    • 행동듀은 μ§€μ†μ‹œκ°„μ΄ μ—†κ³ , ν–‰λ™μ˜ κ²°κ³Όκ°€ 결정적이고, ν•œ λ²ˆμ— ν•˜λ‚˜μ˜ ν–‰λ™λ§Œ μˆ˜ν–‰λœλ‹€.
    • 행동을 ν•˜λŠ” μ—μ΄μ „νŠΈλŠ” ν•˜λ‚˜μ΄λ‹€.
  • 일련의 행동듀을 μˆ˜ν–‰ν•œ μ΄ν›„μ˜ μ„Έκ³„μ˜ μƒνƒœ 예츑 κ°€λŠ₯

2. 마λ₯΄μ½”ν”„ κ²°μ •κ³Όμ •

  • ν–‰λ™λ“€μ˜ κ²°κ³ΌλŠ” 비결정적이고, μ—μ΄μ „νŠΈκ°€ 행동을 ν†΅μ œν•  수 μžˆλŠ” 문제
  • μ΄μ‚°μ‹œκ°„ 마λ₯΄μ½”ν”„ κ²°μ •κ³Όμ • 문제
    • 행동듀은 μ§€μ†μ‹œκ°„μ΄ μ—†λ‹€
    • ν–‰λ™μ˜ κ²°κ³Όκ°€ ν™•λ₯ μ— 따라 κ²°μ •λ˜μ–΄ 비결정적이닀.
    • ν–‰λ™μ˜ κ²°κ³ΌλŠ” κ΄€μΈ‘ κ°€λŠ₯ν•˜μ—¬ 확인할 수 μžˆλ‹€.
    • λ³΄μƒν•¨μˆ˜λ₯Ό μ΅œλŒ€ν™”ν•˜λŠ” 것을 λͺ©μ μœΌλ‘œ ν•œλ‹€.
    • 행동을 ν•˜λŠ” μ—μ΄μ „νŠΈλŠ” ν•˜λ‚˜λ‹€.

3. λΆ€λΆ„κ΄€μΈ‘ 마λ₯΄μ½”ν”„ κ²°μ •κ³Όμ •

  • ν–‰λ™μ˜ κ²°κ³Όκ°€ ν™•λ₯ μ— 따라 κ²°μ •λ˜λŠ” 비결정적인 마λ₯΄μ½”ν”„ κ²°μ •κ³Όμ •
  • ν–‰λ™μ˜ κ²°κ³Όκ°€ λΆ€λΆ„μ μœΌλ‘œλ§Œ μ œκ³΅λœλ‹€.
  • ν˜„μž¬ μƒνƒœμ— λŒ€ν•œ ν™•λ₯ μ μΈ 뢄포λ₯Ό 믿음이라고 함
  • 행동을 ν•˜λ©΄μ„œ λ―ΏμŒμ„ 계속 κ°±μ‹ 

4. 닀쀑 μ—μ΄μ „νŠΈ κ³„νšμˆ˜λ¦½

  • μ—¬λŸ¬ μ—μ΄μ „νŠΈκ°€ μžˆλŠ” 문제
  • ν•˜λ‚˜μ˜ 곡동λͺ©ν‘œλ₯Ό μœ„ν•œ μ—μ΄μ „νŠΈλ“€μ΄ κ³„νšμˆ˜λ¦½ν•˜λŠ” 것
  • ν˜‘μƒμ„ 톡해 κ³„νšμ„ μ •μ œν•˜λŠ” 것
  • μ—μ΄μ „νŠΈλ“€μ΄ μž‘μ—…μ„ μ‘°μ •ν•˜λŠ” 것

 

κ³„νšμˆ˜λ¦½κΈ°

주어진 λ¬Έμ œμ— λŒ€ν•œ κ³„νšμ„ μƒμ„±ν•˜λŠ” μ•Œκ³ λ¦¬μ¦˜ λ˜λŠ” ν”„λ‘œκ·Έλž¨

1. νŠΉμ • μ˜μ—­ κ³„νšμˆ˜λ¦½κΈ°

  • ν•΄λ‹Ή μ˜μ—­μ— νŠΉν™”λœ κ³„νšμˆ˜λ¦½ 방법
  • λ‹€λ₯Έ μ˜μ—­μ— 적용 λΆˆκ°€

2. μ˜μ—­ 독립 κ³„νšμˆ˜λ¦½κΈ°

  • μ˜μ—­μ— 상관없이 μ μš©ν•  수 μžˆλŠ” λ²”μš© κ³„νšμˆ˜λ¦½κΈ°
  • νŠΉμ •μ˜μ—­ κ³„νšμˆ˜λ¦½κΈ°μ— λΉ„ν•΄ μ²˜λ¦¬μ†λ„λŠ” 느림
  • λͺ¨λ“  κ³„νšμˆ˜λ¦½λ¬Έμ œμ— 효과적인 κ³„νšμˆ˜λ¦½κΈ° 개발 κ³€λž€
    • 적용 μ˜μ—­μ„ 일뢀 μ œν•œν•˜λŠ” κ³„νšμˆ˜λ¦½κΈ° 개발
  • κ³„νšμˆ˜λ¦½ 접근방법
    • μƒνƒœκ³΅κ°„ κ³„νšμˆ˜λ¦½
    • κ³„νšκ³΅κ°„ κ³„νšμˆ˜λ¦½

3. μ„€μ •κ°€λŠ₯ κ³„νšμˆ˜λ¦½κΈ°

  • μ˜μ—­ 독립 κ³„νšμˆ˜λ¦½κΈ°λ₯Ό μ‚¬μš©ν•˜λ©΄μ„œ ν•΄λ‹Ή μ˜μ—­μ˜ 문제λ₯Ό ν•΄κ²°ν•˜λŠ” 방법에 κ΄€ν•œ 정보λ₯Ό μž…λ ₯으둜 μ‚¬μš©
  • νŠΉμ •μ˜μ—­ κ³„νšμˆ˜λ¦½κΈ° 보닀 κ³„νšμˆ˜λ¦½μ˜ λ²”μš©μ„±μ΄ λ†’μŒ
  • μ˜μ—­λ…λ¦½ κ³„νšμˆ˜λ¦½κΈ° 보닀 처리 νš¨μœ¨μ„±μ΄ μ’‹μŒ

 

κ³„νšμˆ˜λ¦½ μ–Έμ–΄

  • κ³„νšμˆ˜λ¦½ 문제λ₯Ό ν‘œν˜„ν•˜λŠ” 데 μ‚¬μš©λ˜λŠ” μ–Έμ–΄
  • 고전적 κ³„νšμˆ˜λ¦½ 문제λ₯Ό ν‘œν˜„ν•˜λŠ” μ–Έμ–΄
    • STRIPS, PDDL
    • λ¦¬ν„°λŸ΄λ‘œ ν‘œν˜„λ˜λŠ” μƒνƒœλ³€μˆ˜κ°€ 쀑심

 

STRIPS

  • μƒνƒœμ™€ 행동을 ν‘œν˜„ν•˜κΈ° μœ„ν•΄ μˆ μ–΄λ…Όλ¦¬ μ‚¬μš©
  • μƒνƒœ : λ³€μˆ˜μ™€ ν•¨μˆ˜λ₯Ό ν¬ν•¨ν•˜μ§€ μ•Šμ€ 긍정 λ¦¬ν„°λŸ΄λ“€μ˜ λ…Όλ¦¬κ³±μœΌλ‘œ ν‘œν˜„
  • λͺ©ν‘œ : λ¦¬ν„°λŸ΄λ“€μ˜ λ…Όλ¦¬κ³±μœΌλ‘œ ν‘œν˜„, λΆ€μ • λ¦¬ν„°λŸ΄, μ‘΄μž¬ν•œμ •μ‚¬κ°€ 뢙은 κ²ƒμœΌλ‘œ κ°„μ£Όλ˜λŠ” λ³€μˆ˜ κ°€λŠ₯
  • 행동
    • 이름, λ§€κ°œλ³€μˆ˜, λͺ©λ‘, precondition, effect둜 ꡬ성
    • effect
      • ν–‰λ™μ˜ μ‹€ν–‰ 후에 μƒκΈ°λŠ” μƒνƒœλ³€ν™”λ₯Ό λ‚˜νƒ€λ‚Έ 것
      • ν•¨μˆ˜λ₯Ό μ‚¬μš©ν•˜μ§€ μ•Šμ€ λ¦¬ν„°λŸ΄λ“€μ˜ λ…Όλ¦¬κ³±μœΌλ‘œ ν‘œν˜„
      • κΈμ •λ¦¬ν„°λŸ΄λ“€μ€ 행동 μ‹€ν–‰μœΌλ‘œ μƒˆλ‘œ μƒκΈ°λŠ” μ„±μ§ˆ ν‘œν˜„ (add-list)
      • λΆ€μ •λ¦¬ν„°λŸ΄λ“€μ€ 행동 μ‹€ν–‰μœΌλ‘œ 더 이상 λ§Œμ‘±λ˜μ§€ μ•ŠλŠ” μ„±μ§ˆ ν‘œν˜„ (delete-list)

 

PDDL

 κ³„νšμˆ˜λ¦½ 문제λ₯Ό 두 개의 νŒŒμΌμ— λ‚˜λˆ„μ–΄ μ €μž₯

  • domain 파일 : μˆ μ–΄, 행동에 λŒ€ν•œ 정보 μ €μž₯ - 문제 μ˜μ—­ μ •μ˜
  • problem 파일 : 객체, 초기 μƒνƒœ, λͺ©ν‘œ μ €μž₯ - 문제 μ •μ˜
  • effectλΆ€λΆ„μ—μ„œ not이 λ˜λŠ” 뢀뢄이 STRIPSμ—μ„œ delete-list에 ν•΄λ‹Ή
  • 그렇지 μ•Šμ€ 뢀뢄은 add-list에 ν•΄λ‹Ή
  • ?둜 μ‹œμž‘ν•˜λŠ” 것은 λ³€μˆ˜

 

Quiz

κ³„νšμˆ˜λ¦½μ€ 과업을 μˆ˜ν–‰ν•˜λŠ” 쀑에 μˆ˜ν–‰λ  μˆ˜λ„ μžˆλ‹€. (O)

κ³„νšμˆ˜λ¦½μ€ κ³Όμ—… μˆ˜ν–‰μ΄ κ°€λŠ₯ν•œ κ³„νšμ„ μ°ΎλŠ”λ‹€λŠ” μ μ—μ„œ 탐색과 관련성이 μžˆλ‹€. (O)

κ³„νšμˆ˜λ¦½ λ¬Έμ œλŠ” 초기 μƒνƒœ, λͺ©ν‘œμƒνƒœ, κ°€λŠ₯ν•œ 행동듀에 λŒ€ν•œ λͺ…μ„Έλ₯Ό 톡해 μ •μ˜λœλ‹€. (O)

PDDLμ—μ„œ 행동을 κΈ°μˆ ν•˜λŠ” λ¬Έμž₯은 domainνŒŒμΌμ— μ €μž₯λœλ‹€. (X)

728x90
λ°˜μ‘ν˜•
LIST