Part 3: Tool Integration & Fine-Tuning

Content Level: 200

Suggested Pre-Reading

TL;DR

์ด ํŒจํ„ด์€ SLM์„ RAG/VectorDB, SQL ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค, ๋‚ด๋ถ€ API, ๊ณ„์‚ฐ/์ฝ”๋“œ ์‹คํ–‰ ๋„๊ตฌ์™€ ํ†ตํ•ฉํ•˜์—ฌ ์‹ค์šฉ์ ์ธ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค. ๊ธฐ์—… ํ™˜๊ฒฝ์— ์ตœ์ ํ™”ํ•˜๊ธฐ ์œ„ํ•œ ํŒŒ์ธํŠœ๋‹ ์ „๋žต์—๋Š” ๋Œ€ํ™” ์Šคํƒ€์ผ ์กฐ์ •, ๋„๊ตฌ ์ธํ„ฐํŽ˜์ด์Šค ํ•™์Šต, ๋„๋ฉ”์ธ๋ณ„ ์ง€์‹ ์ฃผ์ž…, ์‚ฌ๊ณ  ์—ฐ์‡„ ํ›ˆ๋ จ์ด ํฌํ•จ๋ฉ๋‹ˆ๋‹ค. LoRA์™€ ๊ฐ™์€ ๊ฒฝ๋Ÿ‰ ๊ธฐ๋ฒ•์œผ๋กœ ํšจ์œจ์ ์ธ ์ปค์Šคํ„ฐ๋งˆ์ด์ง•์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.

1. Tool Integration Patterns with SLMs


๊ธฐ์—… ์ง€์‹ ํƒ์ƒ‰๊ณผ ์ž‘์—… ์ž๋™ํ™”์— LLM์„ ํ™œ์šฉํ•˜๋ ค๋ฉด ์™ธ๋ถ€ ์ง€์‹ ์†Œ์Šค์™€ ์†Œํ”„ํŠธ์›จ์–ด ๋„๊ตฌ๋ฅผ LLM ์—์ด์ „ํŠธ์™€ ๊ธด๋ฐ€ํ•˜๊ฒŒ ์—ฐ๊ฒฐํ•˜๋Š” ๊ฒƒ์ด ํ•„์ˆ˜์ ์ž…๋‹ˆ๋‹ค. ์ด ์•„ํ‚คํ…์ฒ˜๋Š” SLM ์—์ด์ „ํŠธ๊ฐ€ ๋‹ค์–‘ํ•œ ํ”Œ๋Ÿฌ๊ทธ์ธ/๋„๊ตฌ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ํ•œ๊ณ„๋ฅผ ๋ณด์™„ํ•˜๋„๋ก ์„ค๊ณ„ํ•ฉ๋‹ˆ๋‹ค. ๋Œ€ํ‘œ์ ์ธ ํ†ตํ•ฉ ํŒจํ„ด์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค:

  • Search/RAG Integration: RAG๋Š” LLM์— ์ตœ์‹ ์˜ ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ์ •๋ณด๋ฅผ ๊ณต๊ธ‰ํ•˜๋Š” ํ‘œ์ค€ ๊ธฐ๋ฒ•์ž…๋‹ˆ๋‹ค. SLM ์—์ด์ „ํŠธ๋Š” ๋‚ด๋ถ€ ๋ฌธ์„œ ๊ฒ€์ƒ‰ ์—”์ง„์ด๋‚˜ ๋ฒกํ„ฐ DB์™€ ์—ฐ๊ฒฐํ•˜์—ฌ ์‚ฌ์šฉ์ž ์งˆ๋ฌธ๊ณผ ์ผ์น˜ํ•˜๋Š” ๋ฌธ์„œ๋ฅผ ๊ฒ€์ƒ‰ํ•˜๊ณ  ํ•ด๋‹น ๋‚ด์šฉ์„ ์‚ฌ์šฉํ•˜์—ฌ ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, "์˜ฌํ•ด 2๋ถ„๊ธฐ ๋งค์ถœ ๋™ํ–ฅ์€ ์–ด๋–ป์Šต๋‹ˆ๊นŒ?"์™€ ๊ฐ™์€ ์งˆ๋ฌธ์ด ๋„์ฐฉํ•˜๋ฉด ์—์ด์ „ํŠธ๋Š” ๋‚ด๋ถ€ ๋ณด๊ณ ์„œ DB๋ฅผ ์ฟผ๋ฆฌํ•˜์—ฌ ๊ด€๋ จ ๋‹จ๋ฝ์„ ๊ฒ€์ƒ‰ํ•˜๊ณ  ์ด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. ๊ฒ€์ƒ‰๋œ ๋ฌธ์„œ๋Š” ๋‹ต๋ณ€๊ณผ ํ•จ๊ป˜ ์ถœ์ฒ˜๋กœ ์ œ์‹œ๋˜์–ด ์ฆ๊ฑฐ ๊ธฐ๋ฐ˜ ์‘๋‹ต์„ ๋ณด์žฅํ•ฉ๋‹ˆ๋‹ค. RAG๋ฅผ ํ†ตํ•ด SLM์€ ์ž‘์€ ํŒŒ๋ผ๋ฏธํ„ฐ๋กœ ๋ฐฉ๋Œ€ํ•œ ์ง€์‹ ๋ฒ ์ด์Šค์— ์ ‘๊ทผํ•  ์ˆ˜ ์žˆ์–ด ์‚ฌ์‹ค์„ฑ์—์„œ ์žฅ์ ์„ ์–ป๊ณ  ์ง€์†์ ์œผ๋กœ ์—…๋ฐ์ดํŠธ๋˜๋Š” ์ •๋ณด๋ฅผ ๋ฐ˜์˜ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ž˜๋ชป๋œ ๋ฌธ์„œ๋ฅผ ๊ฒ€์ƒ‰ํ•˜๊ฑฐ๋‚˜ ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ๋ฅผ ๋ฌด์‹œํ•˜๋ฉด ํ˜ผ๋ž€์„ ์•ผ๊ธฐํ•  ์ˆ˜ ์žˆ์œผ๋ฏ€๋กœ, ์•ž์„œ ๋…ผ์˜ํ•œ RAG ์ตœ์ ํ™” ํŒŒ์ธํŠœ๋‹์€ SLM์ด ์ฃผ์–ด์ง„ ์ปจํ…์ŠคํŠธ๋ฅผ ์ตœ๋Œ€ํ•œ ํ™œ์šฉํ•˜๊ณ  ๋ชจ๋ธ ์ž์ฒด ์ง€์‹๋ณด๋‹ค ์ฃผ์ž…๋œ ์ง€์‹์— ์˜์กดํ•˜๋„๋ก ํ›ˆ๋ จํ•ฉ๋‹ˆ๋‹ค.

  • Table/SQL Agents: ๋‚ด๋ถ€ ๋ฐ์ดํ„ฐ๊ฐ€ ๊ตฌ์กฐํ™”๋œ DB๋‚˜ ์Šคํ”„๋ ˆ๋“œ์‹œํŠธ์— ์กด์žฌํ•  ๋•Œ ์—์ด์ „ํŠธ๋Š” TextToSQL ๋ณ€ํ™˜์„ ์ˆ˜ํ–‰ํ•˜๊ณ  DB์—์„œ ์ฟผ๋ฆฌ๋ฅผ ์‹คํ–‰ํ•œ ๋‹ค์Œ ๊ฒฐ๊ณผ์— ๋Œ€ํ•œ ์ž์—ฐ์–ด ์„ค๋ช…์„ ์‚ฌ์šฉ์ž์—๊ฒŒ ์ œ๊ณตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌํ•œ LLM SQL ์—์ด์ „ํŠธ๋Š” ๋น„๊ธฐ์ˆ  ์‚ฌ์šฉ์ž๊ฐ€ ์งˆ๋ฌธ๋งŒ์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ์ฟผ๋ฆฌํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•˜์—ฌ ์ƒ์‚ฐ์„ฑ์„ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค. ๋งŽ์€ ๋น„์ฆˆ๋‹ˆ์Šค ์ธํ…”๋ฆฌ์ „์Šค(BI) ์‹œ๋‚˜๋ฆฌ์˜ค๊ฐ€ ์‹ค์ œ๋กœ TextToSQL ์—์ด์ „ํŠธ๋ฅผ ํ™œ์šฉํ•˜๋ฉฐ, ๊ทธ๋Ÿฌํ•œ ๋ชฉ์ ์œผ๋กœ SLM์„ ํŒŒ์ธํŠœ๋‹ํ•˜๊ฑฐ๋‚˜ ํ’๋ถ€ํ•œ ํ”„๋กฌํ”„ํŠธ ์˜ˆ์ œ๋ฅผ ์ œ๊ณตํ•˜์—ฌ ์ •ํ™•๋„๋ฅผ ํ–ฅ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ SQL ์—์ด์ „ํŠธ๋ฅผ ์‚ฌ์šฉํ•  ๋•Œ๋Š” ์ž˜๋ชป๋œ ์ฟผ๋ฆฌ๊ฐ€ ๋ฐ์ดํ„ฐ ํ’ˆ์งˆ์— ์˜ํ–ฅ์„ ์ฃผ์ง€ ์•Š๋„๋ก ์ฝ๊ธฐ ์ „์šฉ ๊ถŒํ•œ์„ ์‚ฌ์šฉํ•˜๊ฑฐ๋‚˜ Claude์™€ ๊ฐ™์€ ์ƒ์œ„ ๋ชจ๋ธ์ด ์ฟผ๋ฆฌ ๊ฒฐ๊ณผ๋ฅผ ๊ฒ€์ฆํ•˜๋Š” ๋‹จ๊ณ„๋ฅผ ํฌํ•จํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

  • Internal API Integration: LLM์€ ๋‚ด๋ถ€ ์›น API๋‚˜ ์ž๋™ํ™” ์Šคํฌ๋ฆฝํŠธ์— ์—ฐ๊ฒฐํ•˜์—ฌ ๊ธฐ์—…๋ณ„ ๊ธฐ๋Šฅ(์˜ˆ: ์ผ์ • ์ƒ์„ฑ, ํ‹ฐ์ผ“ ๋ฐœํ–‰, ์ด๋ฉ”์ผ ๋ฐœ์†ก)์„ ์ง์ ‘ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๊ณ ๊ฐ ์ฑ—๋ด‡์ด ์‚ฌ์šฉ์ž ์š”์ฒญ์— ๋”ฐ๋ผ "์ฃผ๋ฌธ ๋ฐฐ์†ก ์ฃผ์†Œ ๋ณ€๊ฒฝ"์„ ํ•ด์•ผ ํ•œ๋‹ค๋ฉด LLM์ด ๋‚ด๋ถ€ ๋ฌผ๋ฅ˜ ์‹œ์Šคํ…œ API๋ฅผ ํ˜ธ์ถœํ•˜๋Š” ๋ช…๋ น์„ ์ƒ์„ฑํ•˜๊ณ  ๊ฒฐ๊ณผ๋ฅผ ๋Œ€ํ™”์— ๋ฐ˜์˜ํ•ฉ๋‹ˆ๋‹ค. ์—์ด์ „ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ(์˜ˆ: Strands, LangGraph, CrewAI, AutoGen)๋Š” LLM์ด ์ •์˜๋œ JSON ํ˜•์‹์œผ๋กœ ํ•จ์ˆ˜๋ฅผ ํ˜ธ์ถœํ•˜๊ณ  ์‘๋‹ต์„ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, SLM์ด SendEmail(to:"example@co.com", subject:"...", body:"...")์™€ ๊ฐ™์€ ํ•จ์ˆ˜๋ฅผ ์ƒ์„ฑํ•˜๋ฉด ์‹œ์Šคํ…œ์ด ์‹ค์ œ ์ด๋ฉ”์ผ์„ ๋ฐœ์†กํ•œ ๋‹ค์Œ ๋ชจ๋ธ์—๊ฒŒ ๊ฒฐ๊ณผ๋ฅผ ์•Œ๋ฆฝ๋‹ˆ๋‹ค("์„ฑ๊ณต"). ๊ทธ๋Ÿฌํ•œ ๋‚ด๋ถ€ API ํ†ตํ•ฉ์„ ํ†ตํ•ด LLM ์—์ด์ „ํŠธ๋Š” ๋‹จ์ˆœํ•œ ๋‹ต๋ณ€์„ ๋„˜์–ด ์‹ค์šฉ์ ์ธ ์ž‘์—… ์‹คํ–‰ ๋Šฅ๋ ฅ์„ ์–ป์Šต๋‹ˆ๋‹ค. ์ด๋Š” ํŠนํžˆ ๋ฐ˜๋ณต์ ์ธ ์ž‘์—…(ํ‹ฐ์ผ“ ์ฒ˜๋ฆฌ, ์–‘์‹ ์™„์„ฑ) ์ž๋™ํ™”๋‚˜ LLM์„ ์—ฌ๋Ÿฌ ์‹œ์Šคํ…œ ๊ฐ„์˜ ์˜ค์ผ€์ŠคํŠธ๋ ˆ์ด์…˜ ํ—ˆ๋ธŒ๋กœ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค.

  • Calculation/Code Execution: LLM์ด ์‰ฝ๊ฒŒ ์˜ค๋ฅ˜๋ฅผ ๋ฒ”ํ•˜๋Š” ์ˆ˜ํ•™์  ๊ณ„์‚ฐ์ด๋‚˜ ์ฝ”๋”ฉ๊ณผ ๊ฐ™์€ ์ž‘์—…์—๋Š” ์™ธ๋ถ€ ๊ณ„์‚ฐ๊ธฐ๋‚˜ Python ์‹คํ–‰๊ธฐ ๋„๊ตฌ๋ฅผ ์—ฐ๊ฒฐํ•˜์—ฌ ํ•ด๊ฒฐํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, "52์˜ ์ œ๊ณฑ๊ทผ์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?"์™€ ๊ฐ™์€ ์งˆ๋ฌธ์— ๋Œ€ํ•ด ์—์ด์ „ํŠธ๋Š” Calculator.calculate("sqrt(52)")๋ฅผ ํ˜ธ์ถœํ•˜๊ณ  ๊ฒฐ๊ณผ๋กœ ์‘๋‹ตํ•ฉ๋‹ˆ๋‹ค. ์ฝ”๋”ฉ ์ง€์› ์—์ด์ „ํŠธ์˜ ๊ฒฝ์šฐ ๋ชจ๋ธ์ด ์ž‘์„ฑํ•œ ์ฝ”๋“œ ์Šค๋‹ˆํŽซ์„ ์ฆ‰์‹œ ์‹คํ–‰ํ•˜์—ฌ ์˜ค๋ฅ˜ ๋ฉ”์‹œ์ง€๋ฅผ ๋ฐ›์•„ ์ˆ˜์ •ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌํ•œ ์ž๋™ ํ”ผ๋“œ๋ฐฑ ๋ฃจํ”„๋Š” ํŠนํžˆ ์†Œํ˜• ๋ชจ๋ธ์˜ ์ฝ”๋”ฉ ์˜ค๋ฅ˜๋ฅผ ์ค„์ด๋Š” ๋ฐ ํšจ๊ณผ์ ์ž…๋‹ˆ๋‹ค.

์œ„ ํŒจํ„ด๋“ค์˜ ํ†ตํ•ฉ์„ ํ†ตํ•ด SLM ์—์ด์ „ํŠธ๋Š” ํ’๋ถ€ํ•œ ๋„๊ตฌ ์ƒํƒœ๊ณ„ ๋‚ด์—์„œ ๋‹จ์ˆœํ•œ ์–ธ์–ด ์‘๋‹ต์„ ๋„˜์–ด ํ–‰๋™ํ•˜๋Š” AI๊ฐ€ ๋ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๋…๋ฆฝํ˜• LLM์˜ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•˜๊ณ  ๊ธฐ์—… ์›Œํฌํ”Œ๋กœ์šฐ์—์„œ ์‹ค์ œ ํ™œ์šฉํ•˜๊ธฐ ์œ„ํ•œ ํ•„์ˆ˜ ์กฐ๊ฑด์ž…๋‹ˆ๋‹ค. ์ค‘์š”ํ•œ ๊ณ ๋ ค์‚ฌํ•ญ์œผ๋กœ๋Š” ๋ชจ๋ธ์ด ๋„๊ตฌ ์ •์˜์™€ ์‚ฌ์šฉ๋ฒ•์„ ์ •ํ™•ํžˆ ์ดํ•ดํ•˜๋„๋ก ๋ณด์žฅํ•˜๊ณ  ์˜ค์šฉ์— ๋Œ€ํ•œ ์•ˆ์ „์žฅ์น˜๋ฅผ ๊ตฌ์ถ•ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๋„๊ตฌ ์‚ฌ์šฉ ์ „ํ›„์— Claude๊ฐ€ "์ด ํ˜ธ์ถœ์ด ์ ์ ˆํ•ฉ๋‹ˆ๊นŒ?"๋ฅผ ํŒ๋‹จํ•˜๊ฑฐ๋‚˜ ๋„๊ตฌ ๊ฒฐ๊ณผ ์‹ ๋ขฐ์„ฑ์„ ํ‰๊ฐ€ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋˜ํ•œ ๊ฐ ํ†ตํ•ฉ ์ง€์ ์—์„œ ๋กœ๊ทธ๋ฅผ ์œ ์ง€ํ•˜์—ฌ ๋ชจ๋ธ ํ–‰๋™์„ ๋ชจ๋‹ˆํ„ฐ๋งํ•˜๊ณ  ํ•„์š”์‹œ ์ธ๊ฐ„ ๊ฒ€ํ† ๋ฅผ ๋ฐ›๋Š” Human-in-the-loop ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ๊ณ ๋ คํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

2. Fine-Tuning Strategies for Enterprise SLMs


ํŒŒ์ธํŠœ๋‹ ๊ธฐ๋ฒ•์€ ๊ธฐ์—… ํ™˜๊ฒฝ์— ๋งž๊ฒŒ ์˜คํ”ˆ์†Œ์Šค SLM์„ ์ตœ์ ํ™”ํ•˜๋Š” ๋ฐ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ํŒŒ์ธํŠœ๋‹์„ ํ†ตํ•ด ๋ชจ๋ธ์€ ์ผ๋ฐ˜์ ์ธ ๋ฌธ์žฅ ์ƒ์„ฑ๊ธฐ์—์„œ ๊ธฐ์—… ๋„๋ฉ”์ธ ์ „๋ฌธ๊ฐ€๋‚˜ ๋„๊ตฌ ํ™œ์šฉ์— ์ˆ™๋ จ๋œ ์–ด์‹œ์Šคํ„ดํŠธ๋กœ ์ง„ํ™”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋‹ค์Œ๊ณผ ๊ฐ™์€ ํŒŒ์ธํŠœ๋‹ ์ „๋žต์„ ์ ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค:

  • Conversation Grounding and Style Tuning: ๋ชจ๋ธ์„ ๊ธฐ์—… ์ง€์‹๊ณผ ๋Œ€ํ™” ์Šคํƒ€์ผ์— ๋งž์ถ”๊ธฐ ์œ„ํ•ด ๋‚ด๋ถ€ FAQ ๋ฐ์ดํ„ฐ, ๋Œ€ํ™” ๋กœ๊ทธ, ๊ธฐ์ˆ  ๋ฌธ์„œ Q&A ๋“ฑ์„ ์‚ฌ์šฉํ•˜์—ฌ ์ง€๋„ ํ•™์Šต์„ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๋ชจ๋ธ์ด ์ •ํ™•ํ•œ ์ฆ๊ฑฐ๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๋‹ต๋ณ€ํ•˜๊ณ  ํšŒ์‚ฌ ํ†ค๊ณผ ๋งค๋„ˆ๋ฅผ ์Šต๋“ํ•˜๋„๋ก ์•ˆ๋‚ดํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๊ธˆ์œต ๋„๋ฉ”์ธ์—์„œ๋Š” "~๋กœ ์˜ˆ์ƒ๋ฉ๋‹ˆ๋‹ค..."์™€ ๊ฐ™์€ ์‹ ์ค‘ํ•œ ํ‘œํ˜„์„ ์‚ฌ์šฉํ•˜๋„๋ก ํŠœ๋‹ํ•˜๊ณ , ์˜๋ฃŒ ๋„๋ฉ”์ธ์—์„œ๋Š” ์„ฑ๊ธ‰ํ•œ ๊ฒฐ๋ก  ์—†์ด ์ถœ์ฒ˜๋ฅผ ์–ธ๊ธ‰ํ•˜๋Š” ์กฐ์–ธ์„ ์ œ๊ณตํ•˜๋„๋ก ํ›ˆ๋ จํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ ํŒŒ์ธํŠœ๋‹์—๋Š” ๊ทœ์ • ์ค€์ˆ˜๋ฅผ ์œ„ํ•œ ๋ถ€์ ์ ˆํ•œ ์‘๋‹ต ์‚ฌ๋ก€๋ฅผ ํฌํ•จํ•˜์—ฌ ์š•์„ค ํ•„ํ„ฐ์™€ ํ•จ๊ป˜ ์•ˆ์ „ํ•œ ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

  • Tool Interface Fine-Tuning: ํ”„๋กฌํ”„ํŒ… ๊ธฐ๋ฒ•์—์„œ ๋…ผ์˜ํ•œ ๋ฐ”์™€ ๊ฐ™์ด ๋ชจ๋ธ์„ ํŠน์ • API๋‚˜ ํ•จ์ˆ˜ ํ˜ธ์ถœ ํ˜•์‹์„ ์ •ํ™•ํžˆ ๋”ฐ๋ฅด๋„๋ก ํŒŒ์ธํŠœ๋‹ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๋‚ด๋ถ€ CRM ์‹œ์Šคํ…œ API ์‚ฌ์–‘์— ๋งž๋Š” JSON ํ˜•์‹์œผ๋กœ "๊ณ ๊ฐ ์ƒ์„ฑ" ์š”์ฒญ์„ ์ž‘์„ฑํ•˜๋Š” ๋ฒ•์„ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ CreateCustomer{"name": ..., "email": ...}์™€ ๊ฐ™์€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๋Œ€ํ™” ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•˜์—ฌ ๋ชจ๋ธ ํ›ˆ๋ จ์— ์‚ฌ์šฉํ•˜๋ฉด ์‹ค์ œ ์šด์˜ ์ค‘ ์ œ๋กœ์ƒท ํ•จ์ˆ˜ ํ˜ธ์ถœ ํ™•๋ฅ ์ด ํฌ๊ฒŒ ์ฆ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.[2] LLM์€ ํ•จ์ˆ˜ ํ˜ธ์ถœ ์‹œํ€€์Šค๋ฅผ ์‚ฌ์ „ ํ•™์Šตํ–ˆ์œผ๋ฏ€๋กœ ๊ฐœ๋ฐœ์ž๋Š” ์‹œ์Šคํ…œ ๋ฉ”์‹œ์ง€์— ํ•จ์ˆ˜ ์ด๋ฆ„๊ณผ JSON ์‚ฌ์–‘๋งŒ ์ œ๊ณตํ•˜๋ฉด ๋ชจ๋ธ์ด ์ ์ ˆํžˆ ์ฑ„์šฐ๊ณ  ํ•จ์ˆ˜๋ฅผ ํ˜ธ์ถœํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์šฐ๋ฆฌ์˜ ๊ฒฝ์šฐ์—๋„ ์ค‘์š”ํ•œ ๋‚ด๋ถ€ ์ž‘์—…(์˜ˆ: ๋ณด๊ณ ์„œ ์ž‘์„ฑ ํ˜•์‹, ์›Œํฌํ”Œ๋กœ์šฐ ์ž๋™ํ™” ์ ˆ์ฐจ)์„ ํ“จ์ƒท ์˜ˆ์ œ๊ฐ€ ์•„๋‹Œ ๋ชจ๋ธ ๊ฐ€์ค‘์น˜์— ์ฃผ์ž…ํ•˜๋ฉด ๋Ÿฐํƒ€์ž„ ํ”„๋กฌํ”„ํŠธ๋ฅผ ์ ˆ์•ฝํ•˜๊ณ  ์•ˆ์ •์„ฑ์„ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค.

  • Knowledge Domain Fine-Tuning: ๊ธฐ์—… ๋ถ„์•ผ ์ „๋ฌธํ™” ๋ชจ๋ธ์„ ๋งŒ๋“ค๊ธฐ ์œ„ํ•ด ๊ด€๋ จ ๋„๋ฉ”์ธ ์ฝ”ํผ์Šค๋กœ ์ถ”๊ฐ€ ํ›ˆ๋ จ์„ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค. ๋ฒ•๋ฌด๋ฒ•์ธ์€ ํŒ๋ก€๋ฒ• ํ…์ŠคํŠธ๋ฅผ, ๋ฐ”์ด์˜ค ํšŒ์‚ฌ๋Š” ๋…ผ๋ฌธ์„ ์‚ฌ์šฉํ•˜์—ฌ ํŒŒ์ธํŠœ๋‹ํ•˜์—ฌ ๋ชจ๋ธ์ด ํ•ด๋‹น ๋ถ„์•ผ์˜ ์ „๋ฌธ ์šฉ์–ด์™€ ๊ฐœ๋…์„ ์ดํ•ดํ•˜๋„๋ก ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ์‰ฌ์šด ์ปค์Šคํ„ฐ๋งˆ์ด์ง•์ด๋ผ๋Š” OSS SLM ์žฅ์ ์„ ํ™œ์šฉํ•˜๋Š” ๋Œ€ํ‘œ์ ์ธ ์˜ˆ์ž…๋‹ˆ๋‹ค. ํŒŒ์ธํŠœ๋‹์„ ํ†ตํ•ด ๋ชจ๋ธ์ด ๋ถ„์•ผ ์ปจํ…์ŠคํŠธ์— ์ ์ ˆํžˆ ์ถ”๋ก ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•˜์—ฌ ์‚ฌ์šฉ์ž ํ”„๋กฌํ”„ํŠธ๋งŒ์œผ๋กœ๋Š” ์–ป๊ธฐ ์–ด๋ ค์šด ๋†’์€ ์ •ํ™•๋„์™€ ์‹ ๋ขฐ์„ฑ์„ ๋‹ฌ์„ฑํ•ฉ๋‹ˆ๋‹ค.

  • Chain-of-Thought and Multi-Step Learning: ๋ณต์žกํ•œ ์ถ”๋ก ์ด๋‚˜ ๋ฉ€ํ‹ฐ ์—์ด์ „ํŠธ ํ˜‘์—… ๊ณ„ํš์„ ํ–ฅ์ƒ์‹œํ‚ค๊ธฐ ์œ„ํ•ด ๋ฌธ์ œ ํ•ด๊ฒฐ ๊ณผ์ •์„ ์„ค๋ช…ํ•˜๋Š” ๋ฐ์ดํ„ฐ๋กœ ํŒŒ์ธํŠœ๋‹ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์ˆ˜ํ•™ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐ ๊ณผ์ •๊ณผ ํ•จ๊ป˜ ํ•™์Šตํ•˜๊ฑฐ๋‚˜ "์ด๋ ‡๊ฒŒ ์ƒ๊ฐํ•œ ๋‹ค์Œ ์ € ๋„๊ตฌ๋ฅผ ์‚ฌ์šฉํ•˜์„ธ์š”"์™€ ๊ฐ™์€ ์‚ฌ๊ณ  ์—ฐ์‡„ ๊ธฐ๋ก์œผ๋กœ ํ›ˆ๋ จํ•˜๋ฉด ๋ชจ๋ธ์ด ๋ฌธ์ œ์— ์ ‘๊ทผํ•˜๋ฉด์„œ ์ค‘๊ฐ„ ์ƒ๊ฐ์„ ํ‘œํ˜„ํ•˜๋Š” ๊ฒฝํ–ฅ์ด ์ฆ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๋‹ค๋‹จ๊ณ„ ์ž‘์—…์—์„œ ์—์ด์ „ํŠธ์˜ ์ž๊ธฐ ๊ณ„ํš๊ณผ ์กฐ์ • ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๊ทธ๋Ÿฌํ•œ ๋ฐ์ดํ„ฐ ์ค€๋น„๋Š” ์–ด๋ ค์šฐ๋ฏ€๋กœ ๊ณต๊ฐœ์ ์œผ๋กœ ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•œ CoT ๋ฐ์ดํ„ฐ์…‹์ด๋‚˜ Human-in-the-loop ์ƒํ˜ธ์ž‘์šฉ ๋กœ๊ทธ๋ฅผ ์ผ๋ฐ˜์ ์œผ๋กœ ํ™œ์šฉํ•ฉ๋‹ˆ๋‹ค.

ํŒŒ์ธํŠœ๋‹์€ ๊ฐ•๋ ฅํ•˜์ง€๋งŒ ๋ชจ๋“  ๊ฒฝ์šฐ์— ๋งŒ๋Šฅ ์—ด์‡ ๋Š” ์•„๋‹™๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ ์ค€๋น„์™€ ๋น„์šฉ์ด ํ•„์š”ํ•˜๋ฉฐ ๊ณผ์ ํ•ฉ์ด๋‚˜ ๋‚ด๋ถ€ ๊ธฐ๋ฐ€ ์ •๋ณด ์œ ์ถœ ์œ„ํ—˜์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ์†Œํ˜• ๋ชจ๋ธ์˜ ์žฅ์ ์„ ๊ทน๋Œ€ํ™”ํ•˜๊ธฐ ์œ„ํ•ด ํ•„์ˆ˜์ ์ธ ๋ถ€๋ถ„๋งŒ ์ •๋ฐ€ํ•˜๊ฒŒ ํŠœ๋‹ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. LoRA์™€ ๊ฐ™์€ ๊ฒฝ๋Ÿ‰ ํŒŒ์ธํŠœ๋‹ ๊ธฐ์ˆ ๋กœ ์ตœ์†Œํ•œ์˜ ๋ฆฌ์†Œ์Šค๋กœ ํšจ๊ณผ๋ฅผ ๋‹ฌ์„ฑํ•  ์ˆ˜ ์žˆ์–ด ๊ธฐ์—…์ด ํŒŒ์ผ ์ˆ˜์ค€ ๊ธฐ๋ฐ€์„ฑ์„ ์œ ์ง€ํ•˜๋ฉด์„œ ๋ชจ๋ธ์„ ํŠœ๋‹ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

References

Last updated

Was this helpful?