Part 2: Agentic Patterns & Prompting
Content Level: 200
Suggested Pre-Reading
TL;DR
SLMμ μ£Όμ μ²λ¦¬ μμ΄μ νΈλ‘ νμ©νκ³ μ λ’°ν μ μκ±°λ 볡μ‘ν μν©μμμ Claudeμ κ°μ μμ© LLMλ‘ ν΄λ°±νλ νμ΄λΈλ¦¬λ ν¨ν΄μ λλ€. Claudeλ 쿼리 μ¬μμ±, κ³ν, νμ§ κ²μ¦κ³Ό κ°μ λ©ν μν μ μ²λ¦¬νκ³ , λ©ν° μμ΄μ νΈ μ€μΌμ€νΈλ μ΄μ μ ν΅ν΄ λ³λ ¬ μ²λ¦¬μ μ λ¬Ένλ μμ λΆλ°°λ₯Ό λ¬μ±ν©λλ€. SLM λꡬ μ¬μ©μλ μ λ‘μ· ν둬νν λ³΄λ€ ν¨μ· ν둬νν μ΄ λ ν¨κ³Όμ μ λλ€.
1. Agentic Patterns

κ·Έλ¦Ό 1. μ€νμμ€ SLM κΈ°λ° νμ΄λΈλ¦¬λ AI μν€ν μ²μ ν΅μ¬ λ©μ»€λμ¦
μ΄ λ€μ΄μ΄κ·Έλ¨μ μ€νμμ€ SLM κΈ°λ° νμ΄λΈλ¦¬λ μμ΄μ νΈ AI μν€ν μ²μ ν΅μ¬ λ©μ»€λμ¦μ 보μ¬μ€λλ€:
SLM μμ΄μ νΈ: μ¬μ©μ 쿼리λ₯Ό μ²λ¦¬νλ μ£Όμ μμ΄μ νΈ
μ λ’°λ νμΈ (Confidence Check): SLM μλ΅μ μ λ’°μ±μ κ²μ¦νκ³ νμμ ν΄λ°±μ νΈλ¦¬κ±°
LLMμΌλ‘ ν΄λ°±: 볡μ‘ν 쿼리λ μ€ν¨λ₯Ό λν μΈμ΄ λͺ¨λΈ Claudeμ μμ
LLM: 쿼리 μ¬μμ±, 컨ν μ€νΈ μμ½, λΌμ°ν /κ³ν, μλ΅ νκ° λ± λ€μν μμ μν
μμ΄μ νΈ μ€μΌμ€νΈλ μ΄μ : μμ μ λ³λ ¬ λλ μμ°¨μ μΌλ‘ μ²λ¦¬νλ λ©ν° μμ΄μ νΈ κ΅¬μ‘°
μ΄λ₯Ό ν΅ν΄ SLM μ€μ¬μ νμ΄λΈλ¦¬λ μν€ν μ²κ° λ€μν λ°©μμΌλ‘ μ λ’°μ±κ³Ό νμ₯μ±μ λ¬μ±ν μ μμ΅λλ€.
1.1. SLM-First Agent Execution
κΈ°μ μ±λ΄μ΄λ μ§μ νμ μμ΄μ νΈλ₯Ό ꡬμΆν λ μ€νμμ€ SLMμ μ£Όμ λͺ¨λΈλ‘ μ±ννλ©΄ μ§μ° μκ°κ³Ό λΉμ©μ κ·Ήμ μΌλ‘ μ€μΌ μ μμ΅λλ€. μν λͺ¨λΈμ νλΌλ―Έν°κ° μ μ΄ λ λΉ λ₯Έ μΆλ‘ μλλ₯Ό κ°λ₯νκ² νκ³ , μ체 νΈμ€ν μ API νΈμΆ λΉμ©μ΄ λ°μνμ§ μμ λμ©λ νΈλν½ μ²λ¦¬μ κ²½μ μ μ λλ€. μλ₯Ό λ€μ΄, νμ§ λμ λ΄λΆ FAQ λ°μ΄ν°λ‘ 7B κ·λͺ¨μ LLaMA ν¨λ°λ¦¬ λͺ¨λΈμ νμΈνλνλ©΄ μμ²μ΅ κ·λͺ¨ λͺ¨λΈκ³Ό λΉκ΅ν λ§ν μλ΅ μ νλλ₯Ό μ 곡νλ©΄μ μ체 μλ²μμ μμ μ μΈ μ€μκ° μλ΅μ μ λ¬ν μ μμ΅λλ€. μ°κ΅¬μ λ°λ₯΄λ©΄ νΉμ μμ μ λν΄ μ νμΈνλλ 10B κ·λͺ¨ λͺ¨λΈμ΄ λλλ‘ ν¨μ¬ ν° GPT-3 λͺ¨λΈκ³Ό λλ±ν μ±λ₯μ 보μ λλ€ β μ€νμμλ 1,400λ°° μμ λͺ¨λΈμ΄ GPT-3μ μ μ¬ν κ²°κ³Όλ₯Ό λ¬μ±νμ¬ κ²½λ μ λ¬Έν λͺ¨λΈμ ν¨μ¨μ±μ μ¦λͺ νμ΅λλ€.[2] λ°λΌμ νμμ λ°λΌ μ¬λ¬ μν λͺ¨λΈμ λ³λ ¬/μ μ© μν λ‘ λ°°ν¬νλ κ²μ΄ λ¨μΌ κ±°λ λͺ¨λΈμ κ³Όλνκ² μ¬μ©νλ κ²λ³΄λ€ λΉμ© ν¨μ¨μ μΌ μ μμ΅λλ€.
SLM μ°μ μ λ΅μ μ₯μ μ λ€μκ³Ό κ°μ΅λλ€.
Low Cost and High Throughput: μ€ν λͺ¨λΈμ API μμλ£ μμ΄ μ΄μν μ μκ³ μ¬λ¬ μΈμ€ν΄μ€λ₯Ό λ°°ν¬νμ¬ μν νμ₯μΌλ‘ λμ QPS(μ΄λΉ 쿼리 μ)λ₯Ό μ²λ¦¬ν μ μμ΅λλ€. μ€νμμ€ SLM μ체 νΈμ€ν μ ν΄λΌμ°λ API μ¬μ© λλΉ μ΅λ 5λ°° μ΄μμ λΉμ© μ κ°μ λ¬μ±νλ€κ³ λ³΄κ³ λμμ΅λλ€.[1]
Latency Stability: νμν APIλ νΈμΆ μ€ μ§μ° μκ° λ³λμ΄λ μΌμμ μ€ν¨λ₯Ό κ²½νν μ μμ§λ§, μ체 νΈμ€ν SLMμ μ μ΄ κ°λ₯ν μΈνλΌλ₯Ό ν΅ν΄ μΌκ΄λ μλ΅ μκ°μ 보μ₯ν μ μμ΅λλ€. GPU/κ°μκΈ° μ΅μ νλ‘ μ§μ° μκ°μ λμ± μ€μΌ μ μκ³ , μλ μ€μΌμΌλ§μΌλ‘ λΆν λμμ΄ κ°λ₯ν©λλ€.
Data Privacy and Security: λͺ¨λΈμ΄ λ΄λΆ μλ²μμ μ΄μλλ―λ‘ κ³ κ°/κΈ°μ λ°μ΄ν°λ₯Ό μΈλΆλ‘ μ μ‘ν νμκ° μμ΅λλ€. μ΄λ κΈμ΅κ³Ό μλ£ κ°μ μ격ν κ·μ λλ μ°μ μμ λ§€μ° μ€μν μ₯μ μΌλ‘, μ¨νλ λ―Έμ€ LLMμ΄ λ―Όκ°ν μ 보 보νΈμ κ·μ μ€μ μꡬμ¬νμ λ§μ‘±μν¬ μ μμ΅λλ€.
Easy Model Customization: μ€ν λͺ¨λΈμ κ°μ€μΉλ₯Ό νλνκ³ μ체 λ°μ΄ν°λ‘ νμΈνλνκ±°λ μΆκ° μ μ΄λ₯Ό μ μ©ν μ μμ΄ κΈ°μ λ³ ν€, μ§μ, κΈ°λ₯μ μ£Όμ ν μ μμ΅λλ€. λ°λλ‘ API λͺ¨λΈμ λ΄λΆ μ‘°μ μμ΄ ν둬ννΈ μμ§λμ΄λ§μλ§ μμ‘΄ν μ μμ΅λλ€. μ€ν λͺ¨λΈμ ν¬λͺ μ±μ λν μμΈ‘ν μ μλ μΆλ ₯μ λλ²κΉ νκ±°λ νΈν₯μ μμ νλ κ²μ λ μ½κ² λ§λλλ€.
λ¬Όλ‘ SLMμ΄ νμ λ§λ₯μ μλλ©°, μ§λμΉκ² μμ λͺ¨λΈμ μ§λ¬Έμ λμμ€λ₯Ό λμΉκ±°λ λꡬ μ¬μ© (tool usage)μμ μ€μλ₯Ό ν μ μμ΅λλ€. λν λ΄λΆ λ¬Έμμ κ°μ λ§€μ° κ΄λ²μν 컨ν μ€νΈλ₯Ό μ²λ¦¬νκ±°λ κ΄λ²μν μμ/μΆλ‘ μ΄ νμν λ¬Έμ λ μ¬μ ν μ΅μ λν λͺ¨λΈμ΄ μ 리ν©λλ€.[3]
λ°λΌμ μ λλ λ° λ°λ³΅μ μμ μ SLMμΌλ‘ λΉ λ₯΄κ² μ²λ¦¬νκ³ λ³΅μ‘ν λ¬Έμ λ μμ λͺ¨λΈμ μμνλ λ©μ»€λμ¦μ΄ νμν©λλ€. λ€μ μΉμ μμλ κ·Έλ¬ν μ λ’°λ κΈ°λ° ν΄λ°± (confidence-based fallback) μ λ΅μ λ€λ£Ήλλ€.
1.2. Confidence-Based Fallback to Claude
SLMμ μ£Όλ‘ νμ©νλλΌλ μμ€ν μ λΆνμ€ν μν©μ μΈμνκ³ μμ λͺ¨λΈμ λμμ ꡬνμ¬ λμ μ λ’°μ±μ μ μ§ν μ μμ΄μΌ ν©λλ€. μ΄ μν€ν μ²μμλ SLM μμ΄μ νΈκ° λ΅λ³ μμ± μ€ μ€ν¨ μ νΈλ₯Ό κ°μ§νλ©΄ Anthropic Claudeμ κ°μ λν μΈμ΄ λͺ¨λΈλ‘ μμ²μ μμ€μ»¬λ μ΄μ ν©λλ€. μ€ν¨ μ νΈλ λ€μκ³Ό κ°μ κ²½μ°λ₯Ό ν¬ν¨ν μ μμ΅λλ€:
Tool Usage Failures: SLMμ΄ νΈμΆν λκ΅¬κ° μ€λ₯λ₯Ό μμ±νκ±°λ κ²°κ³Όλ₯Ό ν΄μν μ μλ κ²½μ°(μ: API νμμμ, μ½λ μ€ν μ€λ₯, "νμΌμ μ°Ύμ μ μμ" λ±).
Output Format/Grammar Errors: SLMμ΄ μμ±ν μ½λλ SQL 쿼리μ ꡬ문 μ€λ₯λ κΈ°ν λͺ λ°±ν μ€ν μ€λ₯κ° μλ κ²½μ°.
User Feedback: μ¬μ©μκ° "νλ Έλ€"λ "λ€μ μλν΄"μ κ°μ μλ΅μΌλ‘ μλͺ»λ λ΅λ³μ λνλ΄λ κ²½μ°. μ΄λ λͺ¨λΈμ΄ 컨ν μ€νΈλ₯Ό μλͺ» μ΄ν΄νκ±°λ μ 보λ₯Ό λμ³€μμ μμ¬νμ¬ μμ λͺ¨λΈ κ°μ μ μ νΈ μν μ ν©λλ€.
Ambiguous Queries/Ambiguity: μ§λ¬Έ μμ²΄κ° λͺ¨νΈνκ±°λ μ¬λ¬ λ°©μμΌλ‘ ν΄μλ μ μλ κ²½μ°. SLMμ΄ μ§λ¬Έ μλμ λν΄ νΌλμ€λ½λ€κ³ νλ¨νλ©΄ Claudeμκ² μ¬μ§λ¬Έμ μμ²νκ±°λ Claudeκ° λͺ νν μ§λ¬Έμ μμ±νμ¬ μ¬μ©μμ μλλ₯Ό μ¬νμΈνλλ‘ ν μ μμ΅λλ€.
Sensitive or High-Risk Responses: μνκ³Ό λ²λ₯ μ²λΌ μλͺ»λ λ΅λ³μ΄ ν° μν₯μ λ―ΈμΉλ λΆμΌλ νμ¬ μ μ± μ λ°λΌ λ―Όκ°ν μ£Όμ μ λν 쿼리. μ΄λ° κ²½μ° μν λͺ¨λΈλ³΄λ€λ κ·μ λ RLHF λͺ¨λΈμΈ Claudeκ° μλ΅νλλ‘ νμ¬ μνμ μ€μ λλ€. λν μΈλΆ μ§μ κ·Όκ±° μνμ΄ λκ³ νκ° κ°λ₯μ±μ΄ μμ λ μ νμ±μ 보μ₯νκΈ° μν΄ μμ λͺ¨λΈμ ν λΉν©λλ€.
ν΄λ°±μ΄ νΈλ¦¬κ±°λλ©΄ Claudeλ μν©μ μ ν©ν μ§μ μ무λ₯Ό μνν©λλ€. μλ₯Ό λ€μ΄, SLM μ½λ μμ±μ΄ λ°λ³΅μ μΌλ‘ μ€ν¨νλ©΄ Claudeκ° μ§μ μ¬λ°λ₯Έ μ½λ μμ λ₯Ό μ 곡ν μ μμ΅λλ€. μΏΌλ¦¬κ° λͺ¨νΈνλ©΄ Claudeκ° λν μλλ₯Ό λͺ νν μ¬μ§μ νκ±°λ νμν μΆκ° μ 보λ₯Ό μμ²ν μ μμ΅λλ€. Claudeλ κ΄λ²μν μ¬μ μ§μκ³Ό κ³ κΈ μΆλ‘ λ₯λ ₯μ 보μ νμ¬ SLMμ΄ ν΄κ²°ν μ μλ 격차λ₯Ό λ©μ°λ μμ λ§ μν μ ν©λλ€.
ν΄λ°±μ ν΅ν΄ Claudeκ° μΌμμ μΌλ‘ λ°°μΉλκ³ λ¬Έμ κ° μμ νλ ν SLMμΌλ‘ μ μ΄κΆμ λ€μ μ΄μ νλ κ²μ΄ μ΄ μμ€ν μ νΉμ§μ λλ€. μλ₯Ό λ€μ΄, Goose νλ μμν¬μ 리λ/μ컀 λͺ¨λμμ μν λͺ¨λΈ(μ컀)μ΄ Nλ² μ°μ μ€ν¨νλ©΄ λν λͺ¨λΈ(리λ)μ΄ μΌμμ μΌλ‘ κ°μ ν λ€μ μν© ν΄κ²° ν μ컀μκ² μμ μ λ°νν©λλ€. λ§μ°¬κ°μ§λ‘ μ°λ¦¬ μν€ν μ²μμλ Claudeκ° λ΅λ³ νλ μμν¬λ₯Ό ꡬμΆνκ±°λ μ΄λ €μ΄ λ¬Έμ λ₯Ό ν΄κ²°ν ν μμΈν μλ΅ κ΅¬μ±μ΄λ μΆκ° μ¬μ©μ λνλ SLMμ΄ μ¬κ°ν©λλ€.[4] μ΄λ μ΅μ λΉμ©μΌλ‘ μ΅λ μ±λ₯μ λ¬μ±ν©λλ€.
λ€λ₯Έ κ΄μ μμ Claudeλ νμ§ λ³΄μ¦(QA) μν λ μνν©λλ€. SLM μ΄μ λ΅λ³μ΄ μμ±λλ©΄ Claudeκ° μ΄λ₯Ό νκ°/λΉνν μ μμ΅λλ€(μ: "μ΄ λ΅λ³μ μ€λ₯λ μν μμκ° μμ΅λκΉ?"λΌκ³ 묻기). Claudeμ νΌλλ°±μ SLM μκΈ° κ°μ μ μν νΌλλ°±μΌλ‘ μ¬μ©λ©λλ€. μ°κ΅¬μ λ°λ₯΄λ©΄ κ·Έλ¬ν μκΈ° λ°μ± 루νλ₯Ό λμ νλ©΄ λͺ¨λΈμ λ¬Έμ ν΄κ²° λ₯λ ₯μ΄ ν₯μλ©λλ€.[5] Anthropicμ λ©ν° Claude μμ΄μ νΈ μ€νμμ λ³λμ Claude νμ¬ λͺ¨λΈμ΄ λ€λ₯Έ μμ΄μ νΈμ κ²°λ‘ μ νκ°νμ¬ μ νμ±, μΆμ² μΌμΉ λ±μ μ μννκ³ λ¬Έμ κ° μμ λ μμ μ μꡬν¨μΌλ‘μ¨ μ΅μ’ μ±λ₯μ ν₯μμμΌ°μ΅λλ€. μ°λ¦¬ μν€ν μ²μμλ Claudeκ° SLM μλ΅μ κ²ν νκ³ νμμ μμ νμ¬ SLM λ¨λ λ³΄λ€ λ μμ μ μ΄κ³ μ λ’°ν μ μλ μλ΅μ μμ±ν©λλ€.
μμ½νλ©΄, SLM μ°μ μμ€ν μμ "μ€ν¨ μ μμ© LLMμΌλ‘ ν΄λ°±"μ΄λΌλ μ΄μ€ μμ λ§μ λμ΄ μ¬μ©μ μΏΌλ¦¬κ° μ무리 볡μ‘νκ±°λ μμΈμ μ΄μ΄λ κΆκ·Ήμ μΌλ‘ λν λͺ¨λΈ λ₯λ ₯μ ν΅ν΄ μλ£λλλ‘ λ³΄μ₯ν©λλ€.
1.3. Claude-Assisted Query Rewriting, Summarization, and Meta-Reasoning
νμ΄λΈλ¦¬λ μν€ν μ²μμ μμ© LLMμ μ΄λ €μ΄ μ§λ¬Έμ λν λ΅λ³ λμ²΄λ§ νλ κ²μ΄ μλλΌ μΏΌλ¦¬ ν΄μλΆν° λ΅λ³ κ²μ¦κΉμ§ λ€μν λ©ν κΈ°λ₯μ μνν©λλ€. μ£Όμ νμ© ν¨ν΄μ λ€μκ³Ό κ°μ΅λλ€:
Query Rewriting: μ¬μ©μ μ λ ₯μ΄ λͺ¨νΈνκ±°λ μ₯ν©ν λ Claudeκ° μ΄λ₯Ό λͺ ννκ³ λͺ¨λΈ μΉνμ μΈ λ²μ μΌλ‘ λ³νν©λλ€. μλ₯Ό λ€μ΄, Claudeλ λͺ¨νΈν μ§λ¬Έμ λ΄λΆμ μΌλ‘ μ¬λ¬ ν΄μμΌλ‘ μμν λ€μ κ°μ₯ μ μ ν ν΄μμ μ νν μ μμ΅λλ€. λλ μ¬μ©μμ κΈ΄ μμ ν μ§λ¬Έμ μμ½νμ¬ SLMμ΄ μ²λ¦¬νκΈ° μ½κ² λ§λ€ μ μμ΅λλ€. μ΄λ SLMμ΄ μλ μΈμ μ€λ₯ μμ΄ ν΅μ¬ μ§λ¬Έμ μ§μ€ν μ μλλ‘ λμμ€λλ€. Claudeμ μ°μν μΈμ΄ μ΄ν΄λ ₯μ΄ λΌμ°ν°μ²λΌ νμ©λ©λλ€.
Context Summarization: μ¬μ©μ λν 컨ν μ€νΈλ κ²μμ ν΅ν΄ κ²μλ λ¬Έμκ° λ§€μ° κ΄λ²μν λ Claudeκ° κ΄λ ¨ μ 보λ₯Ό μμ½/μ 리νμ¬ SLMμ μ 곡ν©λλ€. μλ₯Ό λ€μ΄, μ¬μ©μκ° μ¬λ¬ λ¬Έμλ₯Ό μ λ‘λνκ³ μ§λ¬Έν λ Claudeκ° κ° λ¬Έμλ₯Ό μμ½νκ±°λ 쿼리μ κ΄λ ¨λ λΆλΆλ§ μΆμΆνμ¬ SLMμ μ λ¬ν©λλ€. μ΄λ₯Ό ν΅ν΄ μ νλ 컨ν μ€νΈ μλμ°λ₯Ό κ°μ§ μν λͺ¨λΈμ΄ κΈ΄ 컨ν μ€νΈμ λ³Έμ§μ λ°μν λ΅λ³μ μμ±ν μ μμ΅λλ€. Claude 4 Sonnet λͺ¨λΈμ 1M ν ν°μ μ²λ¦¬ν μ μμΌλ―λ‘ Claudeκ° λ¨Όμ κΈ°μ λ°μ΄ν°λ² μ΄μ€λ λ³΄κ³ μμ λ°©λν μ 보λ₯Ό μμΆνμ¬ SLMμ΄ νμ©νλλ‘ νλ κ΅¬μ‘°κ° κ°λ₯ν©λλ€. μ΄λ RAG νμ΄νλΌμΈμμ μμ£Ό μ¬μ©λλ ν¨ν΄μΌλ‘, λν λͺ¨λΈμ΄ κΈ΄ ν μ€νΈ μμ½κΈ° μν μ ν©λλ€.
Dynamic Routing and Planning: μμ μ€λͺ ν λ°μ κ°μ΄ Claudeλ 쿼리μ λ°λΌ νμν μ μ°¨μ λꡬλ₯Ό κ²°μ νκ³ κ³νμ μ립ν μ μμ΅λλ€. μν λͺ¨λΈμ λΉν΄ Claudeλ λ Όλ¦¬μ κ³νμ λ°μ΄λλ©° 볡μ‘ν λ¬Έμ λ₯Ό μ μ ν λΆν΄ν©λλ€. μλ₯Ό λ€μ΄, "μ°λ¦¬ νμ¬ μ ν Aμ λν μμ₯ λ°μκ³Ό κ²½μμ¬ λν₯μ μλ €μ£ΌμΈμ"μ κ°μ 볡μ‘ν μμ²μ΄ λμ°©νλ©΄ Claudeκ° μ΄λ₯Ό "1) μ ν Aμ λν μμ λ―Έλμ΄ κ°μ μμ§, 2) κ²½μμ¬ μ μ ν λ°ν μ‘°μ¬, 3) λ μ 보λ₯Ό ν΅ν©νμ¬ μΈμ¬μ΄νΈ λμΆ"κ³Ό κ°μ λ¨κ³λ‘ λλ μ μμ΅λλ€. κ·Έλ° λ€μ κ° λ¨κ³μ μ μ ν μ λ¬Έ μμ΄μ νΈ/λꡬλ₯Ό ν λΉνλ λΌμ°ν μ μνν©λλ€. μ¬κΈ°μ Claudeλ λͺ¨λ μμ μ μ§μ μνν기보λ€λ μ§νμ μν μ νλ©°, SLM νμ μμ΄μ νΈκ° μ€νν μ§μμ¬ν(ν둬ννΈ)μ μμ±ν©λλ€. 리λ Claudeκ° κ³νμ μ립νκ³ μ§μ€λ λͺ©νλ₯Ό κ°μ§ νμ μμ΄μ νΈλ₯Ό μννμ¬ λ³λ ¬ νμμ μνν Anthropic μ¬λ‘μ μ μ¬ν©λλ€. Claudeμ λ©ν μ΄ν΄μ μ μ΄ λ₯λ ₯μ ν¨κ³Όμ μΈ λ©ν° μμ΄μ νΈ νμ μ κ°λ₯νκ² ν©λλ€.
Reflection and Critique: Claudeλ SLMμ΄λ λ€λ₯Έ μμ΄μ νΈμ μ€κ° μΆλ ₯μ΄λ μ΅μ’ λ΅λ³μ λν λΉνκ°λ‘ μλν©λλ€. μλ₯Ό λ€μ΄, Claudeμκ² "μ λ΅λ³μ μ½μ μ 무μμ λκΉ?" λλ "μΆκ° κ²μ¦μ΄ νμν λΆλΆμ μ΄λμ λκΉ?"λΌκ³ 묻λ κ²μ λ΅λ³μμ λΆμ ννκ±°λ λ Όλ¦¬μ μΌλ‘ λΆμΆ©λΆν λΆλΆμ μλ³νλ λ° λμμ΄ λ©λλ€. Claudeμ νΌλλ°±μ SLMμ΄ λ΅λ³μ κ°μ νκ±°λ μΆκ° μ‘°μΉλ₯Ό μ·¨νλ νΈλ¦¬κ±°λ‘ μ¬μ©λ©λλ€.
μμ½νλ©΄, Claudeλ λ¨μν μλ΅ μμ±κΈ°λ³΄λ€λ λ λμ μμ€μμ μ§λ₯μ μΌλ‘ μκ°νλ μ‘°μΈμ μν μ ν©λλ€. Claudeμ μ΄λ¬ν λΉμμ±μ νμ©μ μν λͺ¨λΈ μ€μ¬ μμ€ν μμ μ€μ μμ λ©μ»€λμ¦μ΄μ μμ°μ± ν₯μ μμκ° λ©λλ€. Claudeλ₯Ό μ λ₯ν λ¬Έμ ν΄κ²°μ¬λ‘ μμΉμν€κΈ°λ³΄λ€λ κ³ν/λΉν μ λ¬Έκ° AIλ‘ μμΉμν€λ κ²μ΄ μ 체 μμ€ν ν¨μ¨μ±μ ν₯μμν΅λλ€.
1.4. Multi-Agent Orchestration Patterns
λ¨μΌ μμ΄μ νΈκ° 볡μ‘ν λ¬Έμ ν΄κ²°μ νκ³κ° μμ λ, μ¬λ¬ LLM μμ΄μ νΈμ νμ μ ν΅ν΄ μ±λ₯μ κ·Ήλννλ λ©ν° μμ΄μ νΈ μν€ν μ²κ° λΉμ λ°ν©λλ€. μ£Όμ ν¨ν΄μ λ€μκ³Ό κ°μ΅λλ€:
μ€μΌμ€νΈλ μ΄ν°-μ컀 ν¨ν΄ (Orchestrator-Worker Pattern): μ€μ μ‘°μ μ(μ€μΌμ€νΈλ μ΄ν°) μμ΄μ νΈκ° μ‘΄μ¬νκ³ μ¬λ¬ μ컀 μμ΄μ νΈκ° μ€μ μμ μ μννλ ꡬ쑰μ λλ€. μΌλ°μ μΌλ‘ μ€μΌμ€νΈλ μ΄ν°λ κ³ μμ€ κ³νκ³Ό ν΅ν© μν μ μ²λ¦¬νκ³ (μ°λ¦¬μ κ²½μ° μ΄ μν μ SLMμ΄λ νμμ Claudeκ° μ²λ¦¬), μ컀λ κ°λ³ μμ μ μ΅μ νλ SLM μΈμ€ν΄μ€μ λλ€. μ€μΌμ€νΈλ μ΄ν°λ μ¬μ©μ 쿼리λ₯Ό λ°μ μμ μ λλκ³ κ°κ°μ μ΄λ€ μ컀/λꡬμ ν λΉν μ§ κ²°μ ν©λλ€. μ컀λ ν λΉλ νμ μμ (μ: νΉμ μ§λ¬Έ κ²μ, λ°μ΄ν°λ² μ΄μ€ 쿼리, ν μ€νΈ μμ½)μ μνν λ€μ κ²°κ³Όλ₯Ό μ€μΌμ€νΈλ μ΄ν°μκ² λ°νν©λλ€. λ§μ§λ§μΌλ‘ μ€μΌμ€νΈλ μ΄ν°κ° μ΄λ₯Ό μ’ ν©νμ¬ μ¬μ©μμκ² μλ΅ν©λλ€. μ΄ ν¨ν΄μ κ° λͺ¨λΈμ κ°μ₯ μ νμ©ν μ μλ λΆλΆμ λ°°μΉνμ¬ μ 체 ν¨μ¨μ±μ ν₯μμν΅λλ€.
λ³λ ¬ νμ μμ λ° ν ν° μ©λ νμ₯ (Parallel Sub-tasks and Token Capacity Expansion): λ©ν° μμ΄μ νΈμ μ£Όμ μ₯μ μ€ νλλ λ³λ ¬ μ€νμ ν΅ν μκ° λ¨μΆκ³Ό 컨ν μ€νΈ μ©λ μ¦κ°μ λλ€. μλ‘ λ€λ₯Έ μμ΄μ νΈκ° λμμ μ¬λ¬ μ 보 μμ€λ₯Ό νμνλ©΄ μμ°¨ μ²λ¦¬λ³΄λ€ ν¨μ¬ λΉ λ₯΄κ² λ κ΄λ²μν μ¬μ€μ μμ§ν μ μμ΅λλ€. μλ₯Ό λ€μ΄, Anthropic μ€νμμ λ¨μΌ Claudeκ° 30λ¨κ³μ 10λΆμ΄ κ±Έλ¦° μΉ μ°κ΅¬λ₯Ό 10κ°μ μκ·λͺ¨ Claude μμ΄μ νΈκ° λ³λ ¬λ‘ μμ νμ¬ ν¨μ¬ μ§§μ μκ°μ μλ£νμ΅λλ€. λν κ° μμ΄μ νΈκ° λ³λμ 컨ν μ€νΈ μλμ°λ₯Ό μ¬μ©νλ―λ‘ λ¦¬λ + Nκ° νμ μμ΄μ νΈκ° νμ νλ©΄ λ³Έμ§μ μΌλ‘ Nλ°°μ ν ν° μ»¨ν μ€νΈ νμ© ν¨κ³Όλ₯Ό μ 곡ν©λλ€. μ΄λ λ°©λν κ²μ 곡κ°μ λ€λ£¨κ±°λ ν λͺ¨λΈμ 컨ν μ€νΈ νκ³λ₯Ό λλ μ 보λ₯Ό μ²λ¦¬ν λ νΉν μ μ©ν©λλ€. Anthropicμ κ·Έλ¬ν λ³λ ¬ ν ν° μ¬μ©μ΄ μ±λ₯ ν₯μμ 80%λ₯Ό μ€λͺ νλ©°, μ€μ λ΄λΆ μμ μμ λ¨μΌ λͺ¨λΈλ³΄λ€ 90.2% λμ μ±λ₯μ λ¬μ±νλ€κ³ λ³΄κ³ νμ΅λλ€.
μμ°¨ μμ μνμ± λ° λ©λͺ¨λ¦¬ νΈλμ€ν (Serial Task Sequencing and Memory Handoff): μΌλΆ μλ리μ€μμλ λ³λ ¬λ³΄λ€ μμ°¨μ μμ΄μ νΈ μ²΄μΈμ΄ λ μ μ ν©λλ€. μ¬κΈ°μ μμ΄μ νΈ Aμ μΆλ ₯μ΄ μμ΄μ νΈ Bμ μ λ ₯μ΄ λκ³ , Bμ μΆλ ₯μ΄ Cλ‘ κ°λ νμ΄νλΌμΈμ νμ±ν©λλ€. μλ₯Ό λ€μ΄, κ³ κ° μ§λ¬Έμ λ΅νκΈ° μ μ μμ΄μ νΈ1μ΄ μ¬μ©μ μλλ₯Ό λΆλ₯νκ³ , μμ΄μ νΈ2κ° κ΄λ ¨ λ΄λΆ λ°μ΄ν°λ₯Ό 쿼리ν λ€μ, μμ΄μ νΈ3μ΄ μ΅μ’ λ΅λ³μ μμ±ν©λλ€. κ° λ¨κ³μλ μ λ¬Ένλ μμ΄μ νΈκ° μμΌλ©°, μ΄μ λ¨κ³μ λ©λͺ¨λ¦¬(λν 컨ν μ€νΈλ κ²°κ³Ό)κ° λ€μ μμ΄μ νΈμκ² μ λ¬λ©λλ€. μ€μ μ€μΌμ€νΈλ μ΄ν°λ κ° μ€κ° κ²°κ³Όλ₯Ό μ μ₯/κ΄λ¦¬νκ³ κ·Έλ¬ν λ©λͺ¨λ¦¬ μ μ‘μ μν΄ λ€μ μμ΄μ νΈ ν둬ννΈμ νμν λΆλΆλ§ ν¬ν¨ν©λλ€. λ©ν°ν΄ λνμμλ λν κΈ°λ‘μ΄ κ³΅μ λ©λͺ¨λ¦¬μ μ μ₯λμ΄ μ₯κΈ° 컨ν μ€νΈ μ μ§λ₯Ό κ°λ₯νκ² ν©λλ€. μ€μΌμ€νΈλ μ΄ν°λ μ€ν¨ μ 체ν¬ν¬μΈνΈλ‘ λ‘€λ°±νκ±°λ μμ΄μ νΈλ₯Ό κ΅μ²΄νμ¬ μ 체 νλ‘μΈμ€ μ€λ¨μ λ°©μ§νλ μν¬νλ‘μ° μ μ΄λ₯Ό μ²λ¦¬ν©λλ€.
μ λ¬Έκ° μμ΄μ νΈ λ° λꡬ μ¬μ© (Expert Agents and Tool Usage): κ° μμ΄μ νΈλ νΉμ λΆμΌλ λꡬ μ¬μ©μ μ΅μ νλμ΄ μ λ¬Έκ° κ·Έλ£Ήμ²λΌ μλν μ μμ΅λλ€. μλ₯Ό λ€μ΄, ν SLMμ μμ°μ΄ μμ½μ νΉνλκ³ λ€λ₯Έ νλλ μν ν λΉμ μν ν둬ννΈ μμ§λμ΄λ§μ΄λ νμΈνλμ ν΅ν΄ SQL 쿼리 μμ±μ λ°μ΄λ©λλ€. μ¬μ©μ μ§λ¬Έμ΄ 볡μ‘ν λ μ€μΌμ€νΈλ μ΄ν°λ "μ΄ λΆλΆμ λ°μ΄ν°λ² μ΄μ€ μΏΌλ¦¬κ° νμνλ―λ‘ SQL μμ΄μ νΈμκ², μ λΆλΆμ λ³΄κ³ μ μμ½μ΄ νμνλ―λ‘ μμ½ μμ΄μ νΈμκ²"μ κ°μ΄ μ μ ν μμ μ λΆλ°°ν©λλ€. μ΄λ₯Ό ν΅ν΄ κ° μμ΄μ νΈκ° μμ μ κ°μ μμμμλ§ μμ νμ¬ ν¨μ¨μ±κ³Ό μ νμ±μ ν₯μμν΅λλ€. μ΄ κ΅¬μ‘°λ μΈκ° μ‘°μ§ νμ κ³Ό μ μ¬νλ©°, κΆκ·Ήμ μΌλ‘ AI μμ΄μ νΈκ° νμΌλ‘ μμ νλ ν¨κ³Όλ₯Ό λ§λλλ€.
SLMμ μ€μ¬μΌλ‘ ν κ·Έλ¬ν λ©ν° μμ΄μ νΈ μ€μΌμ€νΈλ μ΄μ μ ꡬνν λ μ£Όμ κ³ λ €μ¬νμ μ€μΌμ€νΈλ μ΄ν° μ체λ₯Ό SLMμΌλ‘ ν μ§ Claudeμ κ°μ μμ λͺ¨λΈλ‘ ν μ§μ λλ€. κΈ°λ³Έμ μΌλ‘ κ²½λ λͺ¨λΈμ΄ λͺ¨λ κ²μ κ°λ νλ €κ³ μλν΄μΌ νμ§λ§, 볡μ‘μ±μ΄ νΉμ μμ€μ μ΄κ³Όνλ©΄ Claudeκ° μ€μΌμ€νΈλ μ΄μ μν μ λ§‘λ νμ΄λΈλ¦¬λ μ κ·Όλ²μ΄ ν©λ¦¬μ μ λλ€. μμ λ Όμν λ°μ κ°μ΄ μ΄λ "SLM κ°μ μ¬μ΄ νμ , Claude κ°μ μΌλ‘ μ΄λ €μ΄ μ‘°μ "μΌλ‘ μμ½ν μ μμ΅λλ€. μ΄ μμ λΉμ©κ³Ό μ±λ₯ κ°μ κ· νμ μΌλ‘ λ³Ό μ μμ΅λλ€.
κ²°κ³Όμ μΌλ‘ λ©ν° μμ΄μ νΈ μν€ν μ²λ μ¬λ¬ λͺ¨λΈμ μ§λ¨ μ§λ₯μ ν΅ν΄ λ¨μΌ LLM νκ³λ₯Ό 극볡νλ κ²½λ‘λ₯Ό μ 곡ν©λλ€. κΈ°μ νκ²½μμ κ΄λ²μν μ§μ νμμ΄λ 볡μ‘ν μμ μλνμ κ·Έλ¬ν ꡬ쑰λ₯Ό νμ©νλ©΄ AI μμ΄μ νΈκ° μμ μ λλλ μΈκ° νμ²λΌ λ³λ ¬μ μ΄κ³ νλ ₯μ μΈ λ¬Έμ ν΄κ²°μ μνν μ μμ΅λλ€.
2. Prompting Techniques for Tool Use
μ€νμμ€ SLMμ μμ΄μ νΈλ‘ νμ©ν λ ν둬ννΈ μ€κ³κ° μ±λ₯μ ν° μν₯μ λ―ΈμΉ©λλ€. νΉν SLMμ΄ μΈλΆ λꡬ(μ: κ²μ, κ³μ°, DB)μ μνΈμμ©ν μ μλλ‘ νλ λͺ μμ μμ° μμ λ₯Ό μ 곡νλ ν¨μ· ν둬ννΈ μ λ΅μ΄ ν¨κ³Όμ μ λλ€. λν λͺ¨λΈμ RLHF κ³Όμ μμ ν¨μ νΈμΆκ³Ό κ°μ λꡬ μ¬μ© μλ리μ€λ₯Ό λΆλΆμ μΌλ‘ νμ΅νμ§λ§, μν λͺ¨λΈμ κ·Έλ¬ν μ§μμ΄ λΆμ‘±νμ¬ λꡬ μ¬μ© κ΄νμ κ°λ₯΄μ³μΌ ν©λλ€.
Zero-shot: "λ€μ μ§λ¬Έμ λ΅νλ λ° νμν μ μ°¨λ₯Ό μκ°νκ³ νμμ κ²μ λꡬλ₯Ό μ¬μ©νμΈμ"μ κ°μ μ§μμ¬νλ§ μμ μμ΄ μ 곡ν©λλ€. μ΅μ LLMμ μ λ‘μ·μΌλ‘ μΌλΆ λꡬ μ¬μ© νλμ 보μ΄μ§λ§, μν λͺ¨λΈμ μΆλ‘ μ€λ₯λ νμ μ€μλ₯Ό νκΈ° μ½μ΅λλ€. μλͺ»λ λꡬ νΈμΆμ μ§μ μ μΌλ‘ μ€ν¨λ‘ μ΄μ΄μ§λ―λ‘ μ λ‘μ·μΌλ‘λ μμ μ μΈ λꡬ μ¬μ©μ κΈ°λνκΈ° μ΄λ ΅μ΅λλ€.
Few-shot Example Provision: κ³Όκ±° λνλ μλ리μ€λ₯Ό μμ λ‘ ν둬ννΈμ ν¬ν¨νμ¬ λꡬ μ¬μ©μ λͺ¨λ² μ¬λ‘λ₯Ό 보μ¬μ€λλ€. λͺ¨λΈμκ² λꡬ νΈμΆ νμκ³Ό 컨ν μ€νΈλ₯Ό μ§μ 보μ¬μ£Όλ©΄ μ μ¬ν λ―Έλ μν©μμ κ°μ ν¨ν΄μ λ°λ₯Ό νλ₯ μ΄ μ¦κ°ν©λλ€. LangChain ν μ€νμμλ ν¨μ· μμ λ₯Ό μΆκ°ν λ 볡μ‘ν λꡬ μ ν μ νλκ° ν¬κ² ν₯μλμλ€κ³ λ³΄κ³ νμ΅λλ€. νΉν λ©μμ§ νμμΌλ‘ 3κ° μμ λ₯Ό μ 곡ν λ Claude 3 λͺ¨λΈμ λꡬ μ ν μ±κ³΅λ₯ μ΄ μ λ‘μ· 16%μμ 52λ‘ κΈμ¦νμ΅λλ€.[6] μ§λ¬Έκ³Ό λμ μ μ¬μ±μ κ°μ§ 3κ° μμ λ₯Ό λμ μΌλ‘ μ ννλ κΈ°λ²μ΄ μ μ 3κ° μμ λ³΄λ€ λ ν¨κ³Όμ μ΄μκ³ , ν λ²μ λ§μ μμ λ³΄λ€ λν νμμ μ μ μμ κ° λ λμ μ±λ₯μ 보μμ΅λλ€. μ΄λ¬ν κ²°κ³Όλ μν SLMμμλ μ¬μ νλ ¨μ΄λ ν둬ννΈμ λλ©μΈλ³ λꡬ μ¬μ© μνμ ν¬ν¨νλ©΄ ν¨μ¬ λ μμ μ μΈ μ¬λ°λ₯Έ λꡬ νΈμΆμ΄ κ°λ₯ν¨μ μμ¬ν©λλ€.
ν¨μ· ν둬ννΈμ λ¨μ μ λͺ¨λΈμ 컨ν μ€νΈ κΈΈμ΄λ₯Ό λ§μ΄ μλͺ¨νλ€λ κ²μ λλ€. κ·Έλ¬λ 2025λ νμ¬ λ§μ μ€νμμ€ λͺ¨λΈμ΄ 32K μ΄μμ κΈ΄ 컨ν μ€νΈλ₯Ό μ§μνλ©°, 2-3κ° μμ λ₯Ό ν¬ν¨νλ κ²μ μΆ©λΆν μ€ν κ°λ₯νμ¬ νΈλ μ΄λμ€νκ° κ°μΉ μμ΅λλ€. λν νμΈνλμ ν΅ν΄ λꡬ μ¬μ© ν¨ν΄μ λͺ¨λΈμ λ΄μ¬ννλ©΄ λ§€λ² κΈ΄ μμ κ° νμνμ§ μμ΅λλ€. Anthropicκ³Ό OpenAI κ°μ μ£Όμ νμ¬λ€λ κ°λ°μμ ν둬ννΈ μμ μ μ€μ΄κΈ° μν΄ ν¨μ νΈμΆκ³Ό λꡬ μ¬μ© λ₯λ ₯μΌλ‘ λͺ¨λΈμ μ¬μ νμΈνλν©λλ€.
κΆκ·Ήμ μΌλ‘ μ λ‘μ· vs ν¨μ· μ λ΅ μ νμ λͺ¨λΈμ μ¬μ μ§μ μμ€κ³Ό 컨ν μ€νΈ κ°μ©μ±μ λ°λΌ λ¬λΌμ§λλ€. μ°λ¦¬ μν€ν μ²μμλ κ°λ₯ν λ μμ€ν ν둬ννΈλ λͺ¨λΈ νλμ ν΅ν΄ λꡬ μ¬μ© μμ λ₯Ό μ£Όμ νμ¬ SLMμ΄ μν©μ λ§κ² μ μ ν λꡬλ₯Ό μμ¨μ μΌλ‘ μ¬μ©ν μ μλλ‘ ν©λλ€. μ΄λ μμ΄μ νΈκ° μΆκ° μ¬μ©μ κ°μ μμ΄ νμν λꡬλ₯Ό μ ννλ μ¬λ°λ₯Έ νλ¨μ λ΄λ¦¬λ μ§μ ν μμ΄μ νΈ μλνμ λ κ°κΉμμ§λλ€.
Further Reading
References
Last updated
Was this helpful?