Part 2: Agentic Patterns & Prompting

Content Level: 200

Suggested Pre-Reading

TL;DR

SLM을 μ£Όμš” 처리 μ—μ΄μ „νŠΈλ‘œ ν™œμš©ν•˜κ³  μ‹ λ’°ν•  수 μ—†κ±°λ‚˜ λ³΅μž‘ν•œ μƒν™©μ—μ—μ„œ Claude와 같은 μƒμš© LLM둜 ν΄λ°±ν•˜λŠ” ν•˜μ΄λΈŒλ¦¬λ“œ νŒ¨ν„΄μž…λ‹ˆλ‹€. ClaudeλŠ” 쿼리 μž¬μž‘μ„±, κ³„νš, ν’ˆμ§ˆ 검증과 같은 메타 역할을 μ²˜λ¦¬ν•˜κ³ , λ©€ν‹° μ—μ΄μ „νŠΈ μ˜€μΌ€μŠ€νŠΈλ ˆμ΄μ…˜μ„ 톡해 병렬 μ²˜λ¦¬μ™€ μ „λ¬Έν™”λœ μž‘μ—… λΆ„λ°°λ₯Ό λ‹¬μ„±ν•©λ‹ˆλ‹€. SLM 도ꡬ μ‚¬μš©μ—λŠ” μ œλ‘œμƒ· ν”„λ‘¬ν”„νŒ…λ³΄λ‹€ 퓨샷 ν”„λ‘¬ν”„νŒ…μ΄ 더 νš¨κ³Όμ μž…λ‹ˆλ‹€.

1. Agentic Patterns


κ·Έλ¦Ό 1. μ˜€ν”ˆμ†ŒμŠ€ SLM 기반 ν•˜μ΄λΈŒλ¦¬λ“œ AI μ•„ν‚€ν…μ²˜μ˜ 핡심 λ©”μ»€λ‹ˆμ¦˜

이 λ‹€μ΄μ–΄κ·Έλž¨μ€ μ˜€ν”ˆμ†ŒμŠ€ SLM 기반 ν•˜μ΄λΈŒλ¦¬λ“œ μ—μ΄μ „νŠΈ AI μ•„ν‚€ν…μ²˜μ˜ 핡심 λ©”μ»€λ‹ˆμ¦˜μ„ λ³΄μ—¬μ€λ‹ˆλ‹€:

  • SLM μ—μ΄μ „νŠΈ: μ‚¬μš©μž 쿼리λ₯Ό μ²˜λ¦¬ν•˜λŠ” μ£Όμš” μ—μ΄μ „νŠΈ

  • 신뒰도 확인 (Confidence Check): SLM μ‘λ‹΅μ˜ 신뒰성을 κ²€μ¦ν•˜κ³  ν•„μš”μ‹œ 폴백을 트리거

  • LLM으둜 폴백: λ³΅μž‘ν•œ μΏΌλ¦¬λ‚˜ μ‹€νŒ¨λ₯Ό λŒ€ν˜• μ–Έμ–΄ λͺ¨λΈ Claude에 μœ„μž„

  • LLM: 쿼리 μž¬μž‘μ„±, μ»¨ν…μŠ€νŠΈ μš”μ•½, λΌμš°νŒ…/κ³„νš, 응닡 평가 λ“± λ‹€μ–‘ν•œ μž‘μ—… μˆ˜ν–‰

  • μ—μ΄μ „νŠΈ μ˜€μΌ€μŠ€νŠΈλ ˆμ΄μ…˜: μž‘μ—…μ„ 병렬 λ˜λŠ” 순차적으둜 μ²˜λ¦¬ν•˜λŠ” λ©€ν‹° μ—μ΄μ „νŠΈ ꡬ쑰

이λ₯Ό 톡해 SLM μ€‘μ‹¬μ˜ ν•˜μ΄λΈŒλ¦¬λ“œ μ•„ν‚€ν…μ²˜κ°€ λ‹€μ–‘ν•œ λ°©μ‹μœΌλ‘œ μ‹ λ’°μ„±κ³Ό ν™•μž₯성을 달성할 수 μžˆμŠ΅λ‹ˆλ‹€.

1.1. SLM-First Agent Execution

κΈ°μ—… μ±—λ΄‡μ΄λ‚˜ 지식 탐색 μ—μ΄μ „νŠΈλ₯Ό ꡬ좕할 λ•Œ μ˜€ν”ˆμ†ŒμŠ€ SLM을 μ£Όμš” λͺ¨λΈλ‘œ μ±„νƒν•˜λ©΄ μ§€μ—° μ‹œκ°„κ³Ό λΉ„μš©μ„ 극적으둜 쀄일 수 μžˆμŠ΅λ‹ˆλ‹€. μ†Œν˜• λͺ¨λΈμ€ νŒŒλΌλ―Έν„°κ°€ 적어 더 λΉ λ₯Έ μΆ”λ‘  속도λ₯Ό κ°€λŠ₯ν•˜κ²Œ ν•˜κ³ , 자체 ν˜ΈμŠ€νŒ… μ‹œ API 호좜 λΉ„μš©μ΄ λ°œμƒν•˜μ§€ μ•Šμ•„ λŒ€μš©λŸ‰ νŠΈλž˜ν”½ μ²˜λ¦¬μ— κ²½μ œμ μž…λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, ν’ˆμ§ˆ 높은 λ‚΄λΆ€ FAQ λ°μ΄ν„°λ‘œ 7B 규λͺ¨μ˜ LLaMA νŒ¨λ°€λ¦¬ λͺ¨λΈμ„ νŒŒμΈνŠœλ‹ν•˜λ©΄ μˆ˜μ²œμ–΅ 규λͺ¨ λͺ¨λΈκ³Ό 비ꡐ할 λ§Œν•œ 응닡 정확도λ₯Ό μ œκ³΅ν•˜λ©΄μ„œ 자체 μ„œλ²„μ—μ„œ μ•ˆμ •μ μΈ μ‹€μ‹œκ°„ 응닡을 전달할 수 μžˆμŠ΅λ‹ˆλ‹€. 연ꡬ에 λ”°λ₯΄λ©΄ νŠΉμ • μž‘μ—…μ— λŒ€ν•΄ 잘 νŒŒμΈνŠœλ‹λœ 10B 규λͺ¨ λͺ¨λΈμ΄ λ•Œλ•Œλ‘œ 훨씬 큰 GPT-3 λͺ¨λΈκ³Ό λ™λ“±ν•œ μ„±λŠ₯을 λ³΄μž…λ‹ˆλ‹€ – μ‹€ν—˜μ—μ„œλŠ” 1,400λ°° μž‘μ€ λͺ¨λΈμ΄ GPT-3와 μœ μ‚¬ν•œ κ²°κ³Όλ₯Ό λ‹¬μ„±ν•˜μ—¬ κ²½λŸ‰ μ „λ¬Έν™” λͺ¨λΈμ˜ νš¨μœ¨μ„±μ„ 증λͺ…ν–ˆμŠ΅λ‹ˆλ‹€.[2] λ”°λΌμ„œ ν•„μš”μ— 따라 μ—¬λŸ¬ μ†Œν˜• λͺ¨λΈμ„ 병렬/μ „μš© μ—­ν• λ‘œ λ°°ν¬ν•˜λŠ” 것이 단일 κ±°λŒ€ λͺ¨λΈμ„ κ³Όλ„ν•˜κ²Œ μ‚¬μš©ν•˜λŠ” 것보닀 λΉ„μš© 효율적일 수 μžˆμŠ΅λ‹ˆλ‹€.

SLM μš°μ„  μ „λž΅μ˜ μž₯점은 λ‹€μŒκ³Ό κ°™μŠ΅λ‹ˆλ‹€.

  • Low Cost and High Throughput: μ˜€ν”ˆ λͺ¨λΈμ€ API 수수료 없이 μš΄μ˜ν•  수 있고 μ—¬λŸ¬ μΈμŠ€ν„΄μŠ€λ₯Ό λ°°ν¬ν•˜μ—¬ μˆ˜ν‰ ν™•μž₯으둜 높은 QPS(μ΄ˆλ‹Ή 쿼리 수)λ₯Ό μ²˜λ¦¬ν•  수 μžˆμŠ΅λ‹ˆλ‹€. μ˜€ν”ˆμ†ŒμŠ€ SLM 자체 ν˜ΈμŠ€νŒ…μ€ ν΄λΌμš°λ“œ API μ‚¬μš© λŒ€λΉ„ μ΅œλŒ€ 5λ°° μ΄μƒμ˜ λΉ„μš© μ ˆκ°μ„ λ‹¬μ„±ν•œλ‹€κ³  λ³΄κ³ λ˜μ—ˆμŠ΅λ‹ˆλ‹€.[1]

  • Latency Stability: νμ‡„ν˜• APIλŠ” 호좜 쀑 μ§€μ—° μ‹œκ°„ λ³€λ™μ΄λ‚˜ μΌμ‹œμ  μ‹€νŒ¨λ₯Ό κ²½ν—˜ν•  수 μžˆμ§€λ§Œ, 자체 ν˜ΈμŠ€νŒ… SLM은 μ œμ–΄ κ°€λŠ₯ν•œ 인프라λ₯Ό 톡해 μΌκ΄€λœ 응닡 μ‹œκ°„μ„ 보μž₯ν•  수 μžˆμŠ΅λ‹ˆλ‹€. GPU/가속기 μ΅œμ ν™”λ‘œ μ§€μ—° μ‹œκ°„μ„ λ”μš± 쀄일 수 있고, μžλ™ μŠ€μΌ€μΌλ§μœΌλ‘œ λΆ€ν•˜ λŒ€μ‘μ΄ κ°€λŠ₯ν•©λ‹ˆλ‹€.

  • Data Privacy and Security: λͺ¨λΈμ΄ λ‚΄λΆ€ μ„œλ²„μ—μ„œ μš΄μ˜λ˜λ―€λ‘œ 고객/κΈ°μ—… 데이터λ₯Ό μ™ΈλΆ€λ‘œ 전솑할 ν•„μš”κ°€ μ—†μŠ΅λ‹ˆλ‹€. μ΄λŠ” 금육과 의료 같은 μ—„κ²©νžˆ κ·œμ œλ˜λŠ” μ‚°μ—…μ—μ„œ 맀우 μ€‘μš”ν•œ μž₯점으둜, μ˜¨ν”„λ ˆλ―ΈμŠ€ LLM이 λ―Όκ°ν•œ 정보 λ³΄ν˜Έμ™€ κ·œμ • μ€€μˆ˜ μš”κ΅¬μ‚¬ν•­μ„ λ§Œμ‘±μ‹œν‚¬ 수 μžˆμŠ΅λ‹ˆλ‹€.

  • Easy Model Customization: μ˜€ν”ˆ λͺ¨λΈμ€ κ°€μ€‘μΉ˜λ₯Ό νšλ“ν•˜κ³  자체 λ°μ΄ν„°λ‘œ νŒŒμΈνŠœλ‹ν•˜κ±°λ‚˜ μΆ”κ°€ μ œμ–΄λ₯Ό μ μš©ν•  수 μžˆμ–΄ 기업별 톀, 지식, κΈ°λŠ₯을 μ£Όμž…ν•  수 μžˆμŠ΅λ‹ˆλ‹€. λ°˜λŒ€λ‘œ API λͺ¨λΈμ€ λ‚΄λΆ€ μ‘°μ • 없이 ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§μ—λ§Œ μ˜μ‘΄ν•  수 μžˆμŠ΅λ‹ˆλ‹€. μ˜€ν”ˆ λͺ¨λΈμ˜ 투λͺ…성은 λ˜ν•œ μ˜ˆμΈ‘ν•  수 μ—†λŠ” 좜λ ₯을 λ””λ²„κΉ…ν•˜κ±°λ‚˜ 편ν–₯을 μˆ˜μ •ν•˜λŠ” 것을 더 μ‰½κ²Œ λ§Œλ“­λ‹ˆλ‹€.

λ¬Όλ‘  SLM이 항상 만λŠ₯은 μ•„λ‹ˆλ©°, μ§€λ‚˜μΉ˜κ²Œ μž‘μ€ λͺ¨λΈμ€ 질문의 λ‰˜μ•™μŠ€λ₯Ό λ†“μΉ˜κ±°λ‚˜ 도ꡬ μ‚¬μš© (tool usage)μ—μ„œ μ‹€μˆ˜λ₯Ό ν•  수 μžˆμŠ΅λ‹ˆλ‹€. λ˜ν•œ λ‚΄λΆ€ λ¬Έμ„œμ™€ 같은 맀우 κ΄‘λ²”μœ„ν•œ μ»¨ν…μŠ€νŠΈλ₯Ό μ²˜λ¦¬ν•˜κ±°λ‚˜ κ΄‘λ²”μœ„ν•œ 상식/좔둠이 ν•„μš”ν•œ λ¬Έμ œλŠ” μ—¬μ „νžˆ μ΅œμ‹  λŒ€ν˜• λͺ¨λΈμ΄ μœ λ¦¬ν•©λ‹ˆλ‹€.[3]

λ”°λΌμ„œ μ €λ‚œλ„ 및 반볡적 μž‘μ—…μ€ SLM으둜 λΉ λ₯΄κ²Œ μ²˜λ¦¬ν•˜κ³  λ³΅μž‘ν•œ λ¬Έμ œλŠ” μƒμœ„ λͺ¨λΈμ— μœ„μž„ν•˜λŠ” λ©”μ»€λ‹ˆμ¦˜μ΄ ν•„μš”ν•©λ‹ˆλ‹€. λ‹€μŒ μ„Ήμ…˜μ—μ„œλŠ” κ·ΈλŸ¬ν•œ 신뒰도 기반 폴백 (confidence-based fallback) μ „λž΅μ„ λ‹€λ£Ήλ‹ˆλ‹€.

1.2. Confidence-Based Fallback to Claude

SLM을 주둜 ν™œμš©ν•˜λ”λΌλ„ μ‹œμŠ€ν…œμ€ λΆˆν™•μ‹€ν•œ 상황을 μΈμ‹ν•˜κ³  μƒμœ„ λͺ¨λΈμ˜ 도움을 κ΅¬ν•˜μ—¬ 높은 신뒰성을 μœ μ§€ν•  수 μžˆμ–΄μ•Ό ν•©λ‹ˆλ‹€. 이 μ•„ν‚€ν…μ²˜μ—μ„œλŠ” SLM μ—μ΄μ „νŠΈκ°€ λ‹΅λ³€ 생성 쀑 μ‹€νŒ¨ μ‹ ν˜Έλ₯Ό κ°μ§€ν•˜λ©΄ Anthropic Claude와 같은 λŒ€ν˜• μ–Έμ–΄ λͺ¨λΈλ‘œ μš”μ²­μ„ μ—μŠ€μ»¬λ ˆμ΄μ…˜ν•©λ‹ˆλ‹€. μ‹€νŒ¨ μ‹ ν˜ΈλŠ” λ‹€μŒκ³Ό 같은 경우λ₯Ό 포함할 수 μžˆμŠ΅λ‹ˆλ‹€:

  • Tool Usage Failures: SLM이 ν˜ΈμΆœν•œ 도ꡬ가 였λ₯˜λ₯Ό μƒμ„±ν•˜κ±°λ‚˜ κ²°κ³Όλ₯Ό 해석할 수 μ—†λŠ” 경우(예: API νƒ€μž„μ•„μ›ƒ, μ½”λ“œ μ‹€ν–‰ 였λ₯˜, "νŒŒμΌμ„ 찾을 수 μ—†μŒ" λ“±).

  • Output Format/Grammar Errors: SLM이 μƒμ„±ν•œ μ½”λ“œλ‚˜ SQL 쿼리에 ꡬ문 였λ₯˜λ‚˜ 기타 λͺ…λ°±ν•œ μ‹€ν–‰ 였λ₯˜κ°€ μžˆλŠ” 경우.

  • User Feedback: μ‚¬μš©μžκ°€ "ν‹€λ Έλ‹€"λ‚˜ "λ‹€μ‹œ μ‹œλ„ν•΄"와 같은 μ‘λ‹΅μœΌλ‘œ 잘λͺ»λœ 닡변을 λ‚˜νƒ€λ‚΄λŠ” 경우. μ΄λŠ” λͺ¨λΈμ΄ μ»¨ν…μŠ€νŠΈλ₯Ό 잘λͺ» μ΄ν•΄ν–ˆκ±°λ‚˜ 정보λ₯Ό λ†“μ³€μŒμ„ μ‹œμ‚¬ν•˜μ—¬ μƒμœ„ λͺ¨λΈ κ°œμž…μ˜ μ‹ ν˜Έ 역할을 ν•©λ‹ˆλ‹€.

  • Ambiguous Queries/Ambiguity: 질문 μžμ²΄κ°€ λͺ¨ν˜Έν•˜κ±°λ‚˜ μ—¬λŸ¬ λ°©μ‹μœΌλ‘œ 해석될 수 μžˆλŠ” 경우. SLM이 질문 μ˜λ„μ— λŒ€ν•΄ ν˜Όλž€μŠ€λŸ½λ‹€κ³  νŒλ‹¨ν•˜λ©΄ Claudeμ—κ²Œ μž¬μ§ˆλ¬Έμ„ μš”μ²­ν•˜κ±°λ‚˜ Claudeκ°€ λͺ…ν™•ν™” μ§ˆλ¬Έμ„ μƒμ„±ν•˜μ—¬ μ‚¬μš©μžμ™€ μ˜λ„λ₯Ό μž¬ν™•μΈν•˜λ„λ‘ ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

  • Sensitive or High-Risk Responses: μ˜ν•™κ³Ό 법λ₯ μ²˜λŸΌ 잘λͺ»λœ 닡변이 큰 영ν–₯을 λ―ΈμΉ˜λŠ” λΆ„μ•Όλ‚˜ νšŒμ‚¬ 정책에 따라 λ―Όκ°ν•œ μ£Όμ œμ— λŒ€ν•œ 쿼리. 이런 경우 μ†Œν˜• λͺ¨λΈλ³΄λ‹€λŠ” 규제된 RLHF λͺ¨λΈμΈ Claudeκ°€ μ‘λ‹΅ν•˜λ„λ‘ ν•˜μ—¬ μœ„ν—˜μ„ μ€„μž…λ‹ˆλ‹€. λ˜ν•œ μ™ΈλΆ€ 지식 κ·Όκ±° μœ„ν—˜μ΄ λ†’κ³  ν™˜κ° κ°€λŠ₯성이 μžˆμ„ λ•Œ 정확성을 보μž₯ν•˜κΈ° μœ„ν•΄ μƒμœ„ λͺ¨λΈμ„ ν• λ‹Ήν•©λ‹ˆλ‹€.

폴백이 트리거되면 ClaudeλŠ” 상황에 μ ν•©ν•œ 지원 μž„λ¬΄λ₯Ό μˆ˜ν–‰ν•©λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, SLM μ½”λ“œ 생성이 반볡적으둜 μ‹€νŒ¨ν•˜λ©΄ Claudeκ°€ 직접 μ˜¬λ°”λ₯Έ μ½”λ“œ 예제λ₯Ό μ œκ³΅ν•  수 μžˆμŠ΅λ‹ˆλ‹€. 쿼리가 λͺ¨ν˜Έν•˜λ©΄ Claudeκ°€ λŒ€ν™” μ˜λ„λ₯Ό λͺ…ν™•νžˆ μž¬μ§„μˆ ν•˜κ±°λ‚˜ ν•„μš”ν•œ μΆ”κ°€ 정보λ₯Ό μš”μ²­ν•  수 μžˆμŠ΅λ‹ˆλ‹€. ClaudeλŠ” κ΄‘λ²”μœ„ν•œ 사전 지식과 κ³ κΈ‰ μΆ”λ‘  λŠ₯λ ₯을 λ³΄μœ ν•˜μ—¬ SLM이 ν•΄κ²°ν•  수 μ—†λŠ” 격차λ₯Ό λ©”μš°λŠ” μ•ˆμ „λ§ 역할을 ν•©λ‹ˆλ‹€.

폴백을 톡해 Claudeκ°€ μΌμ‹œμ μœΌλ‘œ 배치되고 λ¬Έμ œκ°€ μ•ˆμ •ν™”λœ ν›„ SLM으둜 μ œμ–΄κΆŒμ„ λ‹€μ‹œ μ΄μ „ν•˜λŠ” 것이 이 μ‹œμŠ€ν…œμ˜ νŠΉμ§•μž…λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, Goose ν”„λ ˆμž„μ›Œν¬μ˜ λ¦¬λ“œ/μ›Œμ»€ λͺ¨λ“œμ—μ„œ μ†Œν˜• λͺ¨λΈ(μ›Œμ»€)이 N번 연속 μ‹€νŒ¨ν•˜λ©΄ λŒ€ν˜• λͺ¨λΈ(λ¦¬λ“œ)이 μΌμ‹œμ μœΌλ‘œ κ°œμž…ν•œ λ‹€μŒ 상황 ν•΄κ²° ν›„ μ›Œμ»€μ—κ²Œ μž‘μ—…μ„ λ°˜ν™˜ν•©λ‹ˆλ‹€. λ§ˆμ°¬κ°€μ§€λ‘œ 우리 μ•„ν‚€ν…μ²˜μ—μ„œλ„ Claudeκ°€ λ‹΅λ³€ ν”„λ ˆμž„μ›Œν¬λ₯Ό κ΅¬μΆ•ν•˜κ±°λ‚˜ μ–΄λ €μš΄ 문제λ₯Ό ν•΄κ²°ν•œ ν›„ μƒμ„Έν•œ 응닡 κ΅¬μ„±μ΄λ‚˜ μΆ”κ°€ μ‚¬μš©μž λŒ€ν™”λŠ” SLM이 μž¬κ°œν•©λ‹ˆλ‹€.[4] μ΄λŠ” μ΅œμ†Œ λΉ„μš©μœΌλ‘œ μ΅œλŒ€ μ„±λŠ₯을 λ‹¬μ„±ν•©λ‹ˆλ‹€.

λ‹€λ₯Έ κ΄€μ μ—μ„œ ClaudeλŠ” ν’ˆμ§ˆ 보증(QA) 역할도 μˆ˜ν–‰ν•©λ‹ˆλ‹€. SLM μ΄ˆμ•ˆ 닡변이 μƒμ„±λ˜λ©΄ Claudeκ°€ 이λ₯Ό 평가/λΉ„νŒν•  수 μžˆμŠ΅λ‹ˆλ‹€(예: "이 닡변에 였λ₯˜λ‚˜ μœ„ν—˜ μš”μ†Œκ°€ μžˆμŠ΅λ‹ˆκΉŒ?"라고 묻기). Claude의 ν”Όλ“œλ°±μ€ SLM 자기 κ°œμ„ μ„ μœ„ν•œ ν”Όλ“œλ°±μœΌλ‘œ μ‚¬μš©λ©λ‹ˆλ‹€. 연ꡬ에 λ”°λ₯΄λ©΄ κ·ΈλŸ¬ν•œ 자기 λ°˜μ„± 루프λ₯Ό λ„μž…ν•˜λ©΄ λͺ¨λΈμ˜ 문제 ν•΄κ²° λŠ₯λ ₯이 ν–₯μƒλ©λ‹ˆλ‹€.[5] Anthropic의 λ©€ν‹° Claude μ—μ΄μ „νŠΈ μ‹€ν—˜μ—μ„œ λ³„λ„μ˜ Claude νŒμ‚¬ λͺ¨λΈμ΄ λ‹€λ₯Έ μ—μ΄μ „νŠΈμ˜ 결둠을 ν‰κ°€ν•˜μ—¬ μ •ν™•μ„±, 좜처 일치 등을 μ μˆ˜ν™”ν•˜κ³  λ¬Έμ œκ°€ μžˆμ„ λ•Œ μˆ˜μ •μ„ μš”κ΅¬ν•¨μœΌλ‘œμ¨ μ΅œμ’… μ„±λŠ₯을 ν–₯μƒμ‹œμΌ°μŠ΅λ‹ˆλ‹€. 우리 μ•„ν‚€ν…μ²˜μ—μ„œλ„ Claudeκ°€ SLM 응닡을 κ²€ν† ν•˜κ³  ν•„μš”μ‹œ μˆ˜μ •ν•˜μ—¬ SLM 단독보닀 더 μ•ˆμ •μ μ΄κ³  μ‹ λ’°ν•  수 μžˆλŠ” 응닡을 μƒμ„±ν•©λ‹ˆλ‹€.

μš”μ•½ν•˜λ©΄, SLM μš°μ„  μ‹œμŠ€ν…œ μœ„μ— "μ‹€νŒ¨ μ‹œ μƒμš© LLM으둜 폴백"μ΄λΌλŠ” 이쀑 μ•ˆμ „λ§μ„ 두어 μ‚¬μš©μž 쿼리가 아무리 λ³΅μž‘ν•˜κ±°λ‚˜ μ˜ˆμ™Έμ μ΄μ–΄λ„ ꢁ극적으둜 λŒ€ν˜• λͺ¨λΈ λŠ₯λ ₯을 톡해 μ™„λ£Œλ˜λ„λ‘ 보μž₯ν•©λ‹ˆλ‹€.

1.3. Claude-Assisted Query Rewriting, Summarization, and Meta-Reasoning

ν•˜μ΄λΈŒλ¦¬λ“œ μ•„ν‚€ν…μ²˜μ—μ„œ μƒμš© LLM은 μ–΄λ €μš΄ μ§ˆλ¬Έμ— λŒ€ν•œ λ‹΅λ³€ λŒ€μ²΄λ§Œ ν•˜λŠ” 것이 μ•„λ‹ˆλΌ 쿼리 해석뢀터 λ‹΅λ³€ κ²€μ¦κΉŒμ§€ λ‹€μ–‘ν•œ 메타 κΈ°λŠ₯을 μˆ˜ν–‰ν•©λ‹ˆλ‹€. μ£Όμš” ν™œμš© νŒ¨ν„΄μ€ λ‹€μŒκ³Ό κ°™μŠ΅λ‹ˆλ‹€:

  • Query Rewriting: μ‚¬μš©μž μž…λ ₯이 λͺ¨ν˜Έν•˜κ±°λ‚˜ μž₯ν™©ν•  λ•Œ Claudeκ°€ 이λ₯Ό λͺ…ν™•ν•˜κ³  λͺ¨λΈ μΉœν™”μ μΈ λ²„μ „μœΌλ‘œ λ³€ν™˜ν•©λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, ClaudeλŠ” λͺ¨ν˜Έν•œ μ§ˆλ¬Έμ„ λ‚΄λΆ€μ μœΌλ‘œ μ—¬λŸ¬ ν•΄μ„μœΌλ‘œ μ˜μ—­ν•œ λ‹€μŒ κ°€μž₯ μ μ ˆν•œ 해석을 선택할 수 μžˆμŠ΅λ‹ˆλ‹€. λ˜λŠ” μ‚¬μš©μžμ˜ κΈ΄ μ„œμˆ ν˜• μ§ˆλ¬Έμ„ μš”μ•½ν•˜μ—¬ SLM이 μ²˜λ¦¬ν•˜κΈ° μ‰½κ²Œ λ§Œλ“€ 수 μžˆμŠ΅λ‹ˆλ‹€. μ΄λŠ” SLM이 μ˜λ„ 인식 였λ₯˜ 없이 핡심 μ§ˆλ¬Έμ— 집쀑할 수 μžˆλ„λ‘ λ„μ™€μ€λ‹ˆλ‹€. Claude의 μš°μˆ˜ν•œ μ–Έμ–΄ 이해λ ₯이 λΌμš°ν„°μ²˜λŸΌ ν™œμš©λ©λ‹ˆλ‹€.

  • Context Summarization: μ‚¬μš©μž λŒ€ν™” μ»¨ν…μŠ€νŠΈλ‚˜ 검색을 톡해 κ²€μƒ‰λœ λ¬Έμ„œκ°€ 맀우 κ΄‘λ²”μœ„ν•  λ•Œ Claudeκ°€ κ΄€λ ¨ 정보λ₯Ό μš”μ•½/μ •λ¦¬ν•˜μ—¬ SLM에 μ œκ³΅ν•©λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, μ‚¬μš©μžκ°€ μ—¬λŸ¬ λ¬Έμ„œλ₯Ό μ—…λ‘œλ“œν•˜κ³  μ§ˆλ¬Έν•  λ•Œ Claudeκ°€ 각 λ¬Έμ„œλ₯Ό μš”μ•½ν•˜κ±°λ‚˜ 쿼리와 κ΄€λ ¨λœ λΆ€λΆ„λ§Œ μΆ”μΆœν•˜μ—¬ SLM에 μ „λ‹¬ν•©λ‹ˆλ‹€. 이λ₯Ό 톡해 μ œν•œλœ μ»¨ν…μŠ€νŠΈ μœˆλ„μš°λ₯Ό κ°€μ§„ μ†Œν˜• λͺ¨λΈμ΄ κΈ΄ μ»¨ν…μŠ€νŠΈμ˜ λ³Έμ§ˆμ„ λ°˜μ˜ν•œ 닡변을 생성할 수 μžˆμŠ΅λ‹ˆλ‹€. Claude 4 Sonnet λͺ¨λΈμ€ 1M 토큰을 μ²˜λ¦¬ν•  수 μžˆμœΌλ―€λ‘œ Claudeκ°€ λ¨Όμ € κΈ°μ—… λ°μ΄ν„°λ² μ΄μŠ€λ‚˜ λ³΄κ³ μ„œμ˜ λ°©λŒ€ν•œ 정보λ₯Ό μ••μΆ•ν•˜μ—¬ SLM이 ν™œμš©ν•˜λ„λ‘ ν•˜λŠ” ꡬ쑰가 κ°€λŠ₯ν•©λ‹ˆλ‹€. μ΄λŠ” RAG νŒŒμ΄ν”„λΌμΈμ—μ„œ 자주 μ‚¬μš©λ˜λŠ” νŒ¨ν„΄μœΌλ‘œ, λŒ€ν˜• λͺ¨λΈμ΄ κΈ΄ ν…μŠ€νŠΈ μš”μ•½κΈ° 역할을 ν•©λ‹ˆλ‹€.

  • Dynamic Routing and Planning: μ•žμ„œ μ„€λͺ…ν•œ 바와 같이 ClaudeλŠ” 쿼리에 따라 ν•„μš”ν•œ μ ˆμ°¨μ™€ 도ꡬλ₯Ό κ²°μ •ν•˜κ³  κ³„νšμ„ μˆ˜λ¦½ν•  수 μžˆμŠ΅λ‹ˆλ‹€. μ†Œν˜• λͺ¨λΈμ— λΉ„ν•΄ ClaudeλŠ” 논리적 κ³„νšμ— λ›°μ–΄λ‚˜λ©° λ³΅μž‘ν•œ 문제λ₯Ό 적절히 λΆ„ν•΄ν•©λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, "우리 νšŒμ‚¬ μ œν’ˆ A에 λŒ€ν•œ μ‹œμž₯ λ°˜μ‘κ³Ό κ²½μŸμ‚¬ 동ν–₯을 μ•Œλ €μ£Όμ„Έμš”"와 같은 λ³΅μž‘ν•œ μš”μ²­μ΄ λ„μ°©ν•˜λ©΄ Claudeκ°€ 이λ₯Ό "1) μ œν’ˆ A에 λŒ€ν•œ μ†Œμ…œ λ―Έλ””μ–΄ 감정 μˆ˜μ§‘, 2) κ²½μŸμ‚¬ μ‹ μ œν’ˆ λ°œν‘œ 쑰사, 3) 두 정보λ₯Ό ν†΅ν•©ν•˜μ—¬ μΈμ‚¬μ΄νŠΈ λ„μΆœ"κ³Ό 같은 λ‹¨κ³„λ‘œ λ‚˜λˆŒ 수 μžˆμŠ΅λ‹ˆλ‹€. 그런 λ‹€μŒ 각 단계에 μ μ ˆν•œ μ „λ¬Έ μ—μ΄μ „νŠΈ/도ꡬλ₯Ό ν• λ‹Ήν•˜λŠ” λΌμš°νŒ…μ„ μˆ˜ν–‰ν•©λ‹ˆλ‹€. μ—¬κΈ°μ„œ ClaudeλŠ” λͺ¨λ“  μž‘μ—…μ„ 직접 μˆ˜ν–‰ν•˜κΈ°λ³΄λ‹€λŠ” μ§€νœ˜μž 역할을 ν•˜λ©°, SLM ν•˜μœ„ μ—μ΄μ „νŠΈκ°€ μ‹€ν–‰ν•  μ§€μ‹œμ‚¬ν•­(ν”„λ‘¬ν”„νŠΈ)을 μž‘μ„±ν•©λ‹ˆλ‹€. λ¦¬λ“œ Claudeκ°€ κ³„νšμ„ μˆ˜λ¦½ν•˜κ³  μ§‘μ€‘λœ λͺ©ν‘œλ₯Ό κ°€μ§„ ν•˜μœ„ μ—μ΄μ „νŠΈλ₯Ό μ†Œν™˜ν•˜μ—¬ 병렬 탐색을 μˆ˜ν–‰ν•œ Anthropic 사둀와 μœ μ‚¬ν•©λ‹ˆλ‹€. Claude의 메타 이해와 μ œμ–΄ λŠ₯λ ₯은 효과적인 λ©€ν‹° μ—μ΄μ „νŠΈ ν˜‘μ—…μ„ κ°€λŠ₯ν•˜κ²Œ ν•©λ‹ˆλ‹€.

  • Reflection and Critique: ClaudeλŠ” SLMμ΄λ‚˜ λ‹€λ₯Έ μ—μ΄μ „νŠΈμ˜ 쀑간 좜λ ₯μ΄λ‚˜ μ΅œμ’… 닡변에 λŒ€ν•œ λΉ„ν‰κ°€λ‘œ μž‘λ™ν•©λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, Claudeμ—κ²Œ "μœ„ λ‹΅λ³€μ˜ 약점은 λ¬΄μ—‡μž…λ‹ˆκΉŒ?" λ˜λŠ” "μΆ”κ°€ 검증이 ν•„μš”ν•œ 뢀뢄은 μ–΄λ””μž…λ‹ˆκΉŒ?"라고 λ¬»λŠ” 것은 λ‹΅λ³€μ—μ„œ λΆ€μ •ν™•ν•˜κ±°λ‚˜ λ…Όλ¦¬μ μœΌλ‘œ λΆˆμΆ©λΆ„ν•œ 뢀뢄을 μ‹λ³„ν•˜λŠ” 데 도움이 λ©λ‹ˆλ‹€. Claude의 ν”Όλ“œλ°±μ€ SLM이 닡변을 κ°œμ„ ν•˜κ±°λ‚˜ μΆ”κ°€ 쑰치λ₯Ό μ·¨ν•˜λŠ” 트리거둜 μ‚¬μš©λ©λ‹ˆλ‹€.

μš”μ•½ν•˜λ©΄, ClaudeλŠ” λ‹¨μˆœν•œ 응닡 μƒμ„±κΈ°λ³΄λ‹€λŠ” 더 높은 μˆ˜μ€€μ—μ„œ μ§€λŠ₯적으둜 μƒκ°ν•˜λŠ” μ‘°μ–Έμž 역할을 ν•©λ‹ˆλ‹€. Claude의 μ΄λŸ¬ν•œ 비생성적 ν™œμš©μ€ μ†Œν˜• λͺ¨λΈ 쀑심 μ‹œμŠ€ν…œμ—μ„œ 쀑앙 μ•ˆμ „ λ©”μ»€λ‹ˆμ¦˜μ΄μž 생산성 ν–₯상 μš”μ†Œκ°€ λ©λ‹ˆλ‹€. Claudeλ₯Ό μ „λŠ₯ν•œ 문제 ν•΄κ²°μ‚¬λ‘œ μœ„μΉ˜μ‹œν‚€κΈ°λ³΄λ‹€λŠ” κ³„νš/λΉ„νŒ μ „λ¬Έκ°€ AI둜 μœ„μΉ˜μ‹œν‚€λŠ” 것이 전체 μ‹œμŠ€ν…œ νš¨μœ¨μ„±μ„ ν–₯μƒμ‹œν‚΅λ‹ˆλ‹€.

1.4. Multi-Agent Orchestration Patterns

단일 μ—μ΄μ „νŠΈκ°€ λ³΅μž‘ν•œ 문제 해결에 ν•œκ³„κ°€ μžˆμ„ λ•Œ, μ—¬λŸ¬ LLM μ—μ΄μ „νŠΈμ˜ ν˜‘μ—…μ„ 톡해 μ„±λŠ₯을 κ·ΉλŒ€ν™”ν•˜λŠ” λ©€ν‹° μ—μ΄μ „νŠΈ μ•„ν‚€ν…μ²˜κ°€ 빛을 λ°œν•©λ‹ˆλ‹€. μ£Όμš” νŒ¨ν„΄μ€ λ‹€μŒκ³Ό κ°™μŠ΅λ‹ˆλ‹€:

  • μ˜€μΌ€μŠ€νŠΈλ ˆμ΄ν„°-μ›Œμ»€ νŒ¨ν„΄ (Orchestrator-Worker Pattern): 쀑앙 μ‘°μ •μž(μ˜€μΌ€μŠ€νŠΈλ ˆμ΄ν„°) μ—μ΄μ „νŠΈκ°€ μ‘΄μž¬ν•˜κ³  μ—¬λŸ¬ μ›Œμ»€ μ—μ΄μ „νŠΈκ°€ μ‹€μ œ μž‘μ—…μ„ μˆ˜ν–‰ν•˜λŠ” κ΅¬μ‘°μž…λ‹ˆλ‹€. 일반적으둜 μ˜€μΌ€μŠ€νŠΈλ ˆμ΄ν„°λŠ” κ³ μˆ˜μ€€ κ³„νšκ³Ό 톡합 역할을 μ²˜λ¦¬ν•˜κ³ (우리의 경우 이 역할은 SLMμ΄λ‚˜ ν•„μš”μ‹œ Claudeκ°€ 처리), μ›Œμ»€λŠ” κ°œλ³„ μž‘μ—…μ— μ΅œμ ν™”λœ SLM μΈμŠ€ν„΄μŠ€μž…λ‹ˆλ‹€. μ˜€μΌ€μŠ€νŠΈλ ˆμ΄ν„°λŠ” μ‚¬μš©μž 쿼리λ₯Ό λ°›μ•„ μž‘μ—…μ„ λ‚˜λˆ„κ³  각각을 μ–΄λ–€ μ›Œμ»€/도ꡬ에 ν• λ‹Ήν• μ§€ κ²°μ •ν•©λ‹ˆλ‹€. μ›Œμ»€λŠ” ν• λ‹Ήλœ ν•˜μœ„ μž‘μ—…(예: νŠΉμ • 질문 검색, λ°μ΄ν„°λ² μ΄μŠ€ 쿼리, ν…μŠ€νŠΈ μš”μ•½)을 μˆ˜ν–‰ν•œ λ‹€μŒ κ²°κ³Όλ₯Ό μ˜€μΌ€μŠ€νŠΈλ ˆμ΄ν„°μ—κ²Œ λ°˜ν™˜ν•©λ‹ˆλ‹€. λ§ˆμ§€λ§‰μœΌλ‘œ μ˜€μΌ€μŠ€νŠΈλ ˆμ΄ν„°κ°€ 이λ₯Ό μ’…ν•©ν•˜μ—¬ μ‚¬μš©μžμ—κ²Œ μ‘λ‹΅ν•©λ‹ˆλ‹€. 이 νŒ¨ν„΄μ€ 각 λͺ¨λΈμ„ κ°€μž₯ 잘 ν™œμš©ν•  수 μžˆλŠ” 뢀뢄에 λ°°μΉ˜ν•˜μ—¬ 전체 νš¨μœ¨μ„±μ„ ν–₯μƒμ‹œν‚΅λ‹ˆλ‹€.

  • 병렬 ν•˜μœ„ μž‘μ—… 및 토큰 μš©λŸ‰ ν™•μž₯ (Parallel Sub-tasks and Token Capacity Expansion): λ©€ν‹° μ—μ΄μ „νŠΈμ˜ μ£Όμš” μž₯점 쀑 ν•˜λ‚˜λŠ” 병렬 싀행을 ν†΅ν•œ μ‹œκ°„ 단좕과 μ»¨ν…μŠ€νŠΈ μš©λŸ‰ μ¦κ°€μž…λ‹ˆλ‹€. μ„œλ‘œ λ‹€λ₯Έ μ—μ΄μ „νŠΈκ°€ λ™μ‹œμ— μ—¬λŸ¬ 정보 μ†ŒμŠ€λ₯Ό νƒμƒ‰ν•˜λ©΄ 순차 μ²˜λ¦¬λ³΄λ‹€ 훨씬 λΉ λ₯΄κ²Œ 더 κ΄‘λ²”μœ„ν•œ 사싀을 μˆ˜μ§‘ν•  수 μžˆμŠ΅λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, Anthropic μ‹€ν—˜μ—μ„œ 단일 Claudeκ°€ 30단계와 10뢄이 κ±Έλ¦° μ›Ή 연ꡬλ₯Ό 10개의 μ†Œκ·œλͺ¨ Claude μ—μ΄μ „νŠΈκ°€ λ³‘λ ¬λ‘œ μž‘μ—…ν•˜μ—¬ 훨씬 짧은 μ‹œκ°„μ— μ™„λ£Œν–ˆμŠ΅λ‹ˆλ‹€. λ˜ν•œ 각 μ—μ΄μ „νŠΈκ°€ λ³„λ„μ˜ μ»¨ν…μŠ€νŠΈ μœˆλ„μš°λ₯Ό μ‚¬μš©ν•˜λ―€λ‘œ λ¦¬λ“œ + N개 ν•˜μœ„ μ—μ΄μ „νŠΈκ°€ ν˜‘μ—…ν•˜λ©΄ 본질적으둜 N배의 토큰 μ»¨ν…μŠ€νŠΈ ν™œμš© 효과λ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€. μ΄λŠ” λ°©λŒ€ν•œ 검색 곡간을 λ‹€λ£¨κ±°λ‚˜ ν•œ λͺ¨λΈμ˜ μ»¨ν…μŠ€νŠΈ ν•œκ³„λ₯Ό λ„˜λŠ” 정보λ₯Ό μ²˜λ¦¬ν•  λ•Œ 특히 μœ μš©ν•©λ‹ˆλ‹€. Anthropic은 κ·ΈλŸ¬ν•œ 병렬 토큰 μ‚¬μš©μ΄ μ„±λŠ₯ ν–₯μƒμ˜ 80%λ₯Ό μ„€λͺ…ν•˜λ©°, μ‹€μ œ λ‚΄λΆ€ μž‘μ—…μ—μ„œ 단일 λͺ¨λΈλ³΄λ‹€ 90.2% 높은 μ„±λŠ₯을 λ‹¬μ„±ν–ˆλ‹€κ³  λ³΄κ³ ν–ˆμŠ΅λ‹ˆλ‹€.

  • 순차 μž‘μ—… μ‹œν€€μ‹± 및 λ©”λͺ¨λ¦¬ ν•Έλ“œμ˜€ν”„ (Serial Task Sequencing and Memory Handoff): 일뢀 μ‹œλ‚˜λ¦¬μ˜€μ—μ„œλŠ” 병렬보닀 순차적 μ—μ΄μ „νŠΈ 체인이 더 μ μ ˆν•©λ‹ˆλ‹€. μ—¬κΈ°μ„œ μ—μ΄μ „νŠΈ A의 좜λ ₯이 μ—μ΄μ „νŠΈ B의 μž…λ ₯이 되고, B의 좜λ ₯이 C둜 κ°€λŠ” νŒŒμ΄ν”„λΌμΈμ„ ν˜•μ„±ν•©λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, 고객 μ§ˆλ¬Έμ— λ‹΅ν•˜κΈ° 전에 μ—μ΄μ „νŠΈ1이 μ‚¬μš©μž μ˜λ„λ₯Ό λΆ„λ₯˜ν•˜κ³ , μ—μ΄μ „νŠΈ2κ°€ κ΄€λ ¨ λ‚΄λΆ€ 데이터λ₯Ό μΏΌλ¦¬ν•œ λ‹€μŒ, μ—μ΄μ „νŠΈ3이 μ΅œμ’… 닡변을 μƒμ„±ν•©λ‹ˆλ‹€. 각 λ‹¨κ³„μ—λŠ” μ „λ¬Έν™”λœ μ—μ΄μ „νŠΈκ°€ 있으며, 이전 λ‹¨κ³„μ˜ λ©”λͺ¨λ¦¬(λŒ€ν™” μ»¨ν…μŠ€νŠΈλ‚˜ κ²°κ³Ό)κ°€ λ‹€μŒ μ—μ΄μ „νŠΈμ—κ²Œ μ „λ‹¬λ©λ‹ˆλ‹€. 쀑앙 μ˜€μΌ€μŠ€νŠΈλ ˆμ΄ν„°λŠ” 각 쀑간 κ²°κ³Όλ₯Ό μ €μž₯/κ΄€λ¦¬ν•˜κ³  κ·ΈλŸ¬ν•œ λ©”λͺ¨λ¦¬ 전솑을 μœ„ν•΄ λ‹€μŒ μ—μ΄μ „νŠΈ ν”„λ‘¬ν”„νŠΈμ— ν•„μš”ν•œ λΆ€λΆ„λ§Œ ν¬ν•¨ν•©λ‹ˆλ‹€. λ©€ν‹°ν„΄ λŒ€ν™”μ—μ„œλŠ” λŒ€ν™” 기둝이 곡유 λ©”λͺ¨λ¦¬μ— μ €μž₯λ˜μ–΄ μž₯κΈ° μ»¨ν…μŠ€νŠΈ μœ μ§€λ₯Ό κ°€λŠ₯ν•˜κ²Œ ν•©λ‹ˆλ‹€. μ˜€μΌ€μŠ€νŠΈλ ˆμ΄ν„°λŠ” μ‹€νŒ¨ μ‹œ 체크포인트둜 λ‘€λ°±ν•˜κ±°λ‚˜ μ—μ΄μ „νŠΈλ₯Ό κ΅μ²΄ν•˜μ—¬ 전체 ν”„λ‘œμ„ΈμŠ€ 쀑단을 λ°©μ§€ν•˜λŠ” μ›Œν¬ν”Œλ‘œμš° μ œμ–΄λ₯Ό μ²˜λ¦¬ν•©λ‹ˆλ‹€.

  • μ „λ¬Έκ°€ μ—μ΄μ „νŠΈ 및 도ꡬ μ‚¬μš© (Expert Agents and Tool Usage): 각 μ—μ΄μ „νŠΈλŠ” νŠΉμ • λΆ„μ•Όλ‚˜ 도ꡬ μ‚¬μš©μ— μ΅œμ ν™”λ˜μ–΄ μ „λ¬Έκ°€ 그룹처럼 μž‘λ™ν•  수 μžˆμŠ΅λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, ν•œ SLM은 μžμ—°μ–΄ μš”μ•½μ— νŠΉν™”λ˜κ³  λ‹€λ₯Έ ν•˜λ‚˜λŠ” μ—­ν•  할당을 μœ„ν•œ ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§μ΄λ‚˜ νŒŒμΈνŠœλ‹μ„ 톡해 SQL 쿼리 생성에 λ›°μ–΄λ‚©λ‹ˆλ‹€. μ‚¬μš©μž 질문이 λ³΅μž‘ν•  λ•Œ μ˜€μΌ€μŠ€νŠΈλ ˆμ΄ν„°λŠ” "이 뢀뢄은 λ°μ΄ν„°λ² μ΄μŠ€ 쿼리가 ν•„μš”ν•˜λ―€λ‘œ SQL μ—μ΄μ „νŠΈμ—κ²Œ, μ € 뢀뢄은 λ³΄κ³ μ„œ μš”μ•½μ΄ ν•„μš”ν•˜λ―€λ‘œ μš”μ•½ μ—μ΄μ „νŠΈμ—κ²Œ"와 같이 적절히 μž‘μ—…μ„ λΆ„λ°°ν•©λ‹ˆλ‹€. 이λ₯Ό 톡해 각 μ—μ΄μ „νŠΈκ°€ μžμ‹ μ˜ 강점 μ˜μ—­μ—μ„œλ§Œ μž‘μ—…ν•˜μ—¬ νš¨μœ¨μ„±κ³Ό 정확성을 ν–₯μƒμ‹œν‚΅λ‹ˆλ‹€. 이 κ΅¬μ‘°λŠ” 인간 쑰직 ν˜‘μ—…κ³Ό μœ μ‚¬ν•˜λ©°, ꢁ극적으둜 AI μ—μ΄μ „νŠΈκ°€ νŒ€μœΌλ‘œ μž‘μ—…ν•˜λŠ” 효과λ₯Ό λ§Œλ“­λ‹ˆλ‹€.

SLM을 μ€‘μ‹¬μœΌλ‘œ ν•œ κ·ΈλŸ¬ν•œ λ©€ν‹° μ—μ΄μ „νŠΈ μ˜€μΌ€μŠ€νŠΈλ ˆμ΄μ…˜μ„ κ΅¬ν˜„ν•  λ•Œ μ£Όμš” 고렀사항은 μ˜€μΌ€μŠ€νŠΈλ ˆμ΄ν„° 자체λ₯Ό SLM으둜 ν• μ§€ Claude와 같은 μƒμœ„ λͺ¨λΈλ‘œ ν• μ§€μž…λ‹ˆλ‹€. 기본적으둜 κ²½λŸ‰ λͺ¨λΈμ΄ λͺ¨λ“  것을 κ°λ…ν•˜λ €κ³  μ‹œλ„ν•΄μ•Ό ν•˜μ§€λ§Œ, λ³΅μž‘μ„±μ΄ νŠΉμ • μˆ˜μ€€μ„ μ΄ˆκ³Όν•˜λ©΄ Claudeκ°€ μ˜€μΌ€μŠ€νŠΈλ ˆμ΄μ…˜ 역할을 λ§‘λŠ” ν•˜μ΄λΈŒλ¦¬λ“œ 접근법이 ν•©λ¦¬μ μž…λ‹ˆλ‹€. μ•žμ„œ λ…Όμ˜ν•œ 바와 같이 μ΄λŠ” "SLM κ°„μ˜ μ‰¬μš΄ ν˜‘μ—…, Claude κ°œμž…μœΌλ‘œ μ–΄λ €μš΄ μ‘°μ •"으둜 μš”μ•½ν•  수 μžˆμŠ΅λ‹ˆλ‹€. 이 μ—­μ‹œ λΉ„μš©κ³Ό μ„±λŠ₯ κ°„μ˜ κ· ν˜•μ μœΌλ‘œ λ³Ό 수 μžˆμŠ΅λ‹ˆλ‹€.

결과적으둜 λ©€ν‹° μ—μ΄μ „νŠΈ μ•„ν‚€ν…μ²˜λŠ” μ—¬λŸ¬ λͺ¨λΈμ˜ 집단 μ§€λŠ₯을 톡해 단일 LLM ν•œκ³„λ₯Ό κ·Ήλ³΅ν•˜λŠ” 경둜λ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€. κΈ°μ—… ν™˜κ²½μ—μ„œ κ΄‘λ²”μœ„ν•œ 지식 νƒμƒ‰μ΄λ‚˜ λ³΅μž‘ν•œ μž‘μ—… μžλ™ν™”μ— κ·ΈλŸ¬ν•œ ꡬ쑰λ₯Ό ν™œμš©ν•˜λ©΄ AI μ—μ΄μ „νŠΈκ°€ μž‘μ—…μ„ λ‚˜λˆ„λŠ” 인간 νŒ€μ²˜λŸΌ 병렬적이고 탄λ ₯적인 문제 해결을 μˆ˜ν–‰ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

2. Prompting Techniques for Tool Use


μ˜€ν”ˆμ†ŒμŠ€ SLM을 μ—μ΄μ „νŠΈλ‘œ ν™œμš©ν•  λ•Œ ν”„λ‘¬ν”„νŠΈ 섀계가 μ„±λŠ₯에 큰 영ν–₯을 λ―ΈμΉ©λ‹ˆλ‹€. 특히 SLM이 μ™ΈλΆ€ 도ꡬ(예: 검색, 계산, DB)와 μƒν˜Έμž‘μš©ν•  수 μžˆλ„λ‘ ν•˜λŠ” λͺ…μ‹œμ  μ‹œμ—° 예제λ₯Ό μ œκ³΅ν•˜λŠ” 퓨샷 ν”„λ‘¬ν”„νŠΈ μ „λž΅μ΄ νš¨κ³Όμ μž…λ‹ˆλ‹€. λŒ€ν˜• λͺ¨λΈμ€ RLHF κ³Όμ •μ—μ„œ ν•¨μˆ˜ 호좜과 같은 도ꡬ μ‚¬μš© μ‹œλ‚˜λ¦¬μ˜€λ₯Ό λΆ€λΆ„μ μœΌλ‘œ ν•™μŠ΅ν•˜μ§€λ§Œ, μ†Œν˜• λͺ¨λΈμ€ κ·ΈλŸ¬ν•œ 지식이 λΆ€μ‘±ν•˜μ—¬ 도ꡬ μ‚¬μš© 관행을 κ°€λ₯΄μ³μ•Ό ν•©λ‹ˆλ‹€.

  • Zero-shot: "λ‹€μŒ μ§ˆλ¬Έμ— λ‹΅ν•˜λŠ” 데 ν•„μš”ν•œ 절차λ₯Ό μƒκ°ν•˜κ³  ν•„μš”μ‹œ 검색 도ꡬλ₯Ό μ‚¬μš©ν•˜μ„Έμš”"와 같은 μ§€μ‹œμ‚¬ν•­λ§Œ 예제 없이 μ œκ³΅ν•©λ‹ˆλ‹€. μ΅œμ‹  LLM은 μ œλ‘œμƒ·μœΌλ‘œ 일뢀 도ꡬ μ‚¬μš© 행동을 λ³΄μ΄μ§€λ§Œ, μ†Œν˜• λͺ¨λΈμ€ μΆ”λ‘  였λ₯˜λ‚˜ ν˜•μ‹ μ‹€μˆ˜λ₯Ό ν•˜κΈ° μ‰½μŠ΅λ‹ˆλ‹€. 잘λͺ»λœ 도ꡬ ν˜ΈμΆœμ€ μ§μ ‘μ μœΌλ‘œ μ‹€νŒ¨λ‘œ μ΄μ–΄μ§€λ―€λ‘œ μ œλ‘œμƒ·μœΌλ‘œλŠ” μ•ˆμ •μ μΈ 도ꡬ μ‚¬μš©μ„ κΈ°λŒ€ν•˜κΈ° μ–΄λ ΅μŠ΅λ‹ˆλ‹€.

  • Few-shot Example Provision: κ³Όκ±° λŒ€ν™”λ‚˜ μ‹œλ‚˜λ¦¬μ˜€λ₯Ό 예제둜 ν”„λ‘¬ν”„νŠΈμ— ν¬ν•¨ν•˜μ—¬ 도ꡬ μ‚¬μš©μ˜ λͺ¨λ²” 사둀λ₯Ό λ³΄μ—¬μ€λ‹ˆλ‹€. λͺ¨λΈμ—κ²Œ 도ꡬ 호좜 ν˜•μ‹κ³Ό μ»¨ν…μŠ€νŠΈλ₯Ό 직접 보여주면 μœ μ‚¬ν•œ 미래 μƒν™©μ—μ„œ 같은 νŒ¨ν„΄μ„ λ”°λ₯Ό ν™•λ₯ μ΄ μ¦κ°€ν•©λ‹ˆλ‹€. LangChain νŒ€ μ‹€ν—˜μ—μ„œλ„ 퓨샷 예제λ₯Ό μΆ”κ°€ν•  λ•Œ λ³΅μž‘ν•œ 도ꡬ 선택 정확도가 크게 ν–₯μƒλ˜μ—ˆλ‹€κ³  λ³΄κ³ ν–ˆμŠ΅λ‹ˆλ‹€. 특히 λ©”μ‹œμ§€ ν˜•μ‹μœΌλ‘œ 3개 예제λ₯Ό μ œκ³΅ν•  λ•Œ Claude 3 λͺ¨λΈμ˜ 도ꡬ 선택 성곡λ₯ μ΄ μ œλ‘œμƒ· 16%μ—μ„œ 52둜 κΈ‰μ¦ν–ˆμŠ΅λ‹ˆλ‹€.[6] 질문과 높은 μœ μ‚¬μ„±μ„ κ°€μ§„ 3개 예제λ₯Ό λ™μ μœΌλ‘œ μ„ νƒν•˜λŠ” 기법이 정적 3개 μ˜ˆμ œλ³΄λ‹€ 더 νš¨κ³Όμ μ΄μ—ˆκ³ , ν•œ λ²ˆμ— λ§Žμ€ μ˜ˆμ œλ³΄λ‹€ λŒ€ν™” ν˜•μ‹μ˜ 적은 μ˜ˆμ œκ°€ 더 λ‚˜μ€ μ„±λŠ₯을 λ³΄μ˜€μŠ΅λ‹ˆλ‹€. μ΄λŸ¬ν•œ κ²°κ³ΌλŠ” μ†Œν˜• SLMμ—μ„œλ„ 사전 ν›ˆλ ¨μ΄λ‚˜ ν”„λ‘¬ν”„νŠΈμ— 도메인별 도ꡬ μ‚¬μš© μƒ˜ν”Œμ„ ν¬ν•¨ν•˜λ©΄ 훨씬 더 μ•ˆμ •μ μΈ μ˜¬λ°”λ₯Έ 도ꡬ 호좜이 κ°€λŠ₯함을 μ‹œμ‚¬ν•©λ‹ˆλ‹€.

퓨샷 ν”„λ‘¬ν”„νŠΈμ˜ 단점은 λͺ¨λΈμ˜ μ»¨ν…μŠ€νŠΈ 길이λ₯Ό 많이 μ†Œλͺ¨ν•œλ‹€λŠ” κ²ƒμž…λ‹ˆλ‹€. κ·ΈλŸ¬λ‚˜ 2025λ…„ ν˜„μž¬ λ§Žμ€ μ˜€ν”ˆμ†ŒμŠ€ λͺ¨λΈμ΄ 32K μ΄μƒμ˜ κΈ΄ μ»¨ν…μŠ€νŠΈλ₯Ό μ§€μ›ν•˜λ©°, 2-3개 예제λ₯Ό ν¬ν•¨ν•˜λŠ” 것은 μΆ©λΆ„νžˆ μ‹€ν˜„ κ°€λŠ₯ν•˜μ—¬ νŠΈλ ˆμ΄λ“œμ˜€ν”„κ°€ κ°€μΉ˜ μžˆμŠ΅λ‹ˆλ‹€. λ˜ν•œ νŒŒμΈνŠœλ‹μ„ 톡해 도ꡬ μ‚¬μš© νŒ¨ν„΄μ„ λͺ¨λΈμ— λ‚΄μž¬ν™”ν•˜λ©΄ 맀번 κΈ΄ μ˜ˆμ œκ°€ ν•„μš”ν•˜μ§€ μ•ŠμŠ΅λ‹ˆλ‹€. Anthropicκ³Ό OpenAI 같은 μ£Όμš” νšŒμ‚¬λ“€λ„ 개발자의 ν”„λ‘¬ν”„νŠΈ μž‘μ—…μ„ 쀄이기 μœ„ν•΄ ν•¨μˆ˜ 호좜과 도ꡬ μ‚¬μš© λŠ₯λ ₯으둜 λͺ¨λΈμ„ 사전 νŒŒμΈνŠœλ‹ν•©λ‹ˆλ‹€.

ꢁ극적으둜 μ œλ‘œμƒ· vs 퓨샷 μ „λž΅ 선택은 λͺ¨λΈμ˜ 사전 지식 μˆ˜μ€€κ³Ό μ»¨ν…μŠ€νŠΈ κ°€μš©μ„±μ— 따라 λ‹¬λΌμ§‘λ‹ˆλ‹€. 우리 μ•„ν‚€ν…μ²˜μ—μ„œλŠ” κ°€λŠ₯ν•  λ•Œ μ‹œμŠ€ν…œ ν”„λ‘¬ν”„νŠΈλ‚˜ λͺ¨λΈ νŠœλ‹μ„ 톡해 도ꡬ μ‚¬μš© 예제λ₯Ό μ£Όμž…ν•˜μ—¬ SLM이 상황에 맞게 μ μ ˆν•œ 도ꡬλ₯Ό 자율적으둜 μ‚¬μš©ν•  수 μžˆλ„λ‘ ν•©λ‹ˆλ‹€. μ΄λŠ” μ—μ΄μ „νŠΈκ°€ μΆ”κ°€ μ‚¬μš©μž κ°œμž… 없이 ν•„μš”ν•œ 도ꡬλ₯Ό μ„ νƒν•˜λŠ” μ˜¬λ°”λ₯Έ νŒλ‹¨μ„ λ‚΄λ¦¬λŠ” μ§„μ •ν•œ μ—μ΄μ „νŠΈ μžλ™ν™”μ— 더 κ°€κΉŒμ›Œμ§‘λ‹ˆλ‹€.

Further Reading

References

Last updated

Was this helpful?