GenAI System Checklist

0. ๊ณ ๊ฐ ์—ญ๋Ÿ‰ ํ™•์ธ


0.1 ํ˜„์žฌ ์ธ๋ ฅ ํ’€ ํ˜„ํ™ฉ

ํ˜„์žฌ ํ”„๋กœ์ ํŠธ์— ํˆฌ์ž… ๊ฐ€๋Šฅํ•œ ํŒ€ ๊ตฌ์„ฑ์›๊ณผ ๊ฒฝํ—˜ ์ˆ˜์ค€์„ ์ƒ์„ธํžˆ ๊ธฐ์žฌํ•ด ์ฃผ์„ธ์š”.

  • ๋ฐ์ดํ„ฐ ๊ณผํ•™์ž ๋ฐ ๋ฐ์ดํ„ฐ ๋ถ„์„๊ฐ€

    • ์ด ์ธ์›: ๋ช… (์‹œ๋‹ˆ์–ด ๋ช…, ๋ฏธ๋“ค ๋ช…, ์ฃผ๋‹ˆ์–ด ๋ช…)

    • ์ฃผ์š” ๊ฒฝํ—˜ ์˜์—ญ: ํ†ต๊ณ„ ๋ถ„์„, ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ๋ง, ๋ฐ์ดํ„ฐ ์‹œ๊ฐํ™”, A/B ํ…Œ์ŠคํŒ…

    • ๋„๋ฉ”์ธ ์ „๋ฌธ์„ฑ: ๊ธˆ์œต, ์˜๋ฃŒ, ์ œ์กฐ, ๋ฆฌํ…Œ์ผ ๋“ฑ ํŠน์ • ์‚ฐ์—… ๊ฒฝํ—˜ ์—ฌ๋ถ€

    • ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•œ ๋„๊ตฌ: Python/R, Jupyter, Pandas, Scikit-learn, TensorFlow/PyTorch

    • GenAI ํ”„๋กœ์ ํŠธ ๊ฒฝํ—˜: ์žˆ์Œ/์—†์Œ, ๊ฒฝํ—˜ ๊ธฐ๊ฐ„ ๋ฐ ํ”„๋กœ์ ํŠธ ๊ทœ๋ชจ

  • ๋ฐ์ดํ„ฐ ์—”์ง€๋‹ˆ์–ด

    • ์ด ์ธ์›: ๋ช… (์‹œ๋‹ˆ์–ด ๋ช…, ๋ฏธ๋“ค ๋ช…, ์ฃผ๋‹ˆ์–ด ๋ช…)

    • ์ฃผ์š” ๊ฒฝํ—˜ ์˜์—ญ: ETL/ELT ํŒŒ์ดํ”„๋ผ์ธ, ๋ฐ์ดํ„ฐ ์›จ์–ดํ•˜์šฐ์Šค, ์‹ค์‹œ๊ฐ„ ์ŠคํŠธ๋ฆฌ๋ฐ

    • ํด๋ผ์šฐ๋“œ ๊ฒฝํ—˜: AWS, GCP, Azure ์ค‘ ์ฃผ๋ ฅ ํ”Œ๋žซํผ๊ณผ ๊ฒฝํ—˜ ์—ฐ์ˆ˜

    • ๊ธฐ์ˆ  ์Šคํƒ: Spark, Kafka, Airflow, dbt, Snowflake, Redshift ๋“ฑ

    • ๋Œ€์šฉ๋Ÿ‰ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ ๊ฒฝํ—˜: ์ผ์ผ ์ฒ˜๋ฆฌ๋Ÿ‰, ์ตœ๋Œ€ ๋ฐ์ดํ„ฐ ๊ทœ๋ชจ

  • AI/ML ์—”์ง€๋‹ˆ์–ด

    • ์ด ์ธ์›: ๋ช… (์‹œ๋‹ˆ์–ด ๋ช…, ๋ฏธ๋“ค ๋ช…, ์ฃผ๋‹ˆ์–ด ๋ช…)

    • ์ฃผ์š” ๊ฒฝํ—˜ ์˜์—ญ: ๋ชจ๋ธ ๋ฐฐํฌ, MLOps, ๋ชจ๋ธ ์ตœ์ ํ™”, A/B ํ…Œ์ŠคํŒ…

    • ๋ฐฐํฌ ๊ฒฝํ—˜: ์˜จํ”„๋ ˆ๋ฏธ์Šค, ํด๋ผ์šฐ๋“œ, ์—ฃ์ง€ ๋ฐฐํฌ ๊ฒฝํ—˜

    • ๊ธฐ์ˆ  ์Šคํƒ: Docker, Kubernetes, MLflow, Kubeflow, SageMaker

    • ๋ชจ๋ธ ์„œ๋น™ ๊ฒฝํ—˜: REST API, ๋ฐฐ์น˜ ์ถ”๋ก , ์‹ค์‹œ๊ฐ„ ์ถ”๋ก , ๋ชจ๋ธ ๋ชจ๋‹ˆํ„ฐ๋ง

  • ์†Œํ”„ํŠธ์›จ์–ด ์—”์ง€๋‹ˆ์–ด (๋ฐฑ์—”๋“œ/ํ”„๋ก ํŠธ์—”๋“œ)

    • ์ด ์ธ์›: ๋ช… (์‹œ๋‹ˆ์–ด ๋ช…, ๋ฏธ๋“ค ๋ช…, ์ฃผ๋‹ˆ์–ด ๋ช…)

    • ๋ฐฑ์—”๋“œ ๊ธฐ์ˆ : Python, Java, Node.js, Go ๋“ฑ ์ฃผ๋ ฅ ์–ธ์–ด

    • ํ”„๋ก ํŠธ์—”๋“œ ๊ธฐ์ˆ : React, Vue, Angular ๋“ฑ ํ”„๋ ˆ์ž„์›Œํฌ ๊ฒฝํ—˜

    • API ๊ฐœ๋ฐœ ๊ฒฝํ—˜: RESTful API, GraphQL, ๋งˆ์ดํฌ๋กœ์„œ๋น„์Šค ์•„ํ‚คํ…์ฒ˜

    • ํด๋ผ์šฐ๋“œ ๋„ค์ดํ‹ฐ๋ธŒ ๊ฐœ๋ฐœ: ์„œ๋ฒ„๋ฆฌ์Šค, ์ปจํ…Œ์ด๋„ˆ, CI/CD ๊ฒฝํ—˜

  • ์ธํ”„๋ผ ์—”์ง€๋‹ˆ์–ด / DevOps

    • ์ด ์ธ์›: ๋ช… (์‹œ๋‹ˆ์–ด ๋ช…, ๋ฏธ๋“ค ๋ช…, ์ฃผ๋‹ˆ์–ด ๋ช…)

    • ํด๋ผ์šฐ๋“œ ์ธํ”„๋ผ: AWS, GCP, Azure ์ค‘ ์ฃผ๋ ฅ ํ”Œ๋žซํผ ๊ฒฝํ—˜ ํ˜„ํ™ฉ

    • IaC ๊ฒฝํ—˜: Terraform, CloudFormation, CDK ์‚ฌ์šฉ ๊ฒฝํ—˜

    • ์ปจํ…Œ์ด๋„ˆ ์˜ค์ผ€์ŠคํŠธ๋ ˆ์ด์…˜: Docker, Kubernetes, EKS/GKE ์šด์˜ ๊ฒฝํ—˜

    • ๋ชจ๋‹ˆํ„ฐ๋ง ๋ฐ ๋กœ๊น…: Prometheus, Grafana, ELK Stack, CloudWatch ๊ฒฝํ—˜

  • ํ”„๋กœ์ ํŠธ ๋งค๋‹ˆ์ € / ํ…Œํฌ ๋ฆฌ๋“œ

    • ์ด ์ธ์›: ๋ช… (PM ๋ช…, ํ…Œํฌ ๋ฆฌ๋“œ ๋ช…, C-level ๋ช…)

    • AI/ML ํ”„๋กœ์ ํŠธ ๊ด€๋ฆฌ ๊ฒฝํ—˜: ํ”„๋กœ์ ํŠธ ์ˆ˜, ํ‰๊ท  ๊ทœ๋ชจ, ์„ฑ๊ณต ์‚ฌ๋ก€

    • ์• ์ž์ผ/์Šคํฌ๋Ÿผ ๊ฒฝํ—˜: ๋ฐฉ๋ฒ•๋ก  ์ ์šฉ ๊ฒฝํ—˜, ์ธ์ฆ ๋ณด์œ  ์—ฌ๋ถ€

    • ๊ธฐ์ˆ ์  ์˜์‚ฌ๊ฒฐ์ • ๊ถŒํ•œ: ์•„ํ‚คํ…์ฒ˜ ๊ฒฐ์ •, ๊ธฐ์ˆ  ์Šคํƒ ์„ ํƒ ๊ถŒํ•œ ๋ฒ”์œ„

    • ์˜ˆ์‚ฐ ๊ด€๋ฆฌ ๊ฒฝํ—˜: ํด๋ผ์šฐ๋“œ ๋น„์šฉ ์ตœ์ ํ™”, ROI ์ธก์ • ๊ฒฝํ—˜

0.2 AWS ์„œ๋น„์Šค ๋ฐ GenAI ์ˆ™๋ จ๋„

  • ์ „์ฒด ํŒ€์˜ AWS ๊ฒฝํ—˜ ์ˆ˜์ค€

    • ์ดˆ๊ธ‰: AWS ๊ธฐ๋ณธ ์„œ๋น„์Šค ์‚ฌ์šฉ, ์ฝ˜์†” ๊ธฐ๋ฐ˜ ์ž‘์—… ์œ„์ฃผ

    • ์ค‘๊ธ‰: ๋‹ค์–‘ํ•œ AWS ์„œ๋น„์Šค ํ™œ์šฉ, CLI/SDK ์‚ฌ์šฉ, ๊ธฐ๋ณธ์ ์ธ ์•„ํ‚คํ…์ฒ˜ ์„ค๊ณ„

    • ๊ณ ๊ธ‰: ๋ณต์žกํ•œ ์•„ํ‚คํ…์ฒ˜ ์„ค๊ณ„, ๋น„์šฉ ์ตœ์ ํ™”, ๋ณด์•ˆ ๋ชจ๋ฒ” ์‚ฌ๋ก€ ์ ์šฉ

  • AI/ML ๊ด€๋ จ AWS ์„œ๋น„์Šค ๊ฒฝํ—˜ (SageMaker, Bedrock, OpenSearch ๋“ฑ)

  • ์ธํ”„๋ผ ๊ด€๋ จ AWS ์„œ๋น„์Šค ๊ฒฝํ—˜ (EC2/ECS/EKS, S3/EFS/FSx, VPC, IAM, CloudWatch/CloudTrail)

  • GenAI Application์— ๋Œ€ํ•œ ์„ ์ˆ˜ ์ง€์‹ ์ˆ˜์ค€?

    • ํ”„๋กœ์ ํŠธ ๊ฒฝํ—˜: ์™„๋ฃŒํ•œ GenAI ํ”„๋กœ์ ํŠธ ์ˆ˜, ๊ทœ๋ชจ, ๋„๋ฉ”์ธ

    • ์ฑ—๋ด‡, RAG ์‹œ์Šคํ…œ, ์ฝ”๋“œ ์ƒ์„ฑ, ๋ฌธ์„œ ์š”์•ฝ ๋“ฑ์˜ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ ๊ฒฝํ—˜

    • ์‹œ์Šคํ…œ ๋ฉ”์‹œ์ง€, few-shot learning, chain-of-thought ๋“ฑ์˜ ํ”„๋กฌํ”„ํŠธ ์„ค๊ณ„ ๋ฐ ์ตœ์ ํ™” ๊ฒฝํ—˜

    • ์‚ฌ์šฉ์ž ์ธํ„ฐํŽ˜์ด์Šค: ์›น ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜, API, ๋ชจ๋ฐ”์ผ ์•ฑ ๊ฐœ๋ฐœ ๊ฒฝํ—˜

    • ํ”„๋กœ๋•์…˜ ๋ฐฐํฌ ๊ฒฝํ—˜: ์‹ค์ œ ์‚ฌ์šฉ์ž ๋Œ€์ƒ ์„œ๋น„์Šค ์šด์˜ ๊ฒฝํ—˜

    • ์„ฑ๋Šฅ ์ตœ์ ํ™” ๊ฒฝํ—˜: ํ† ํฐ ์‚ฌ์šฉ๋Ÿ‰ ์ตœ์ ํ™”, ์‘๋‹ต ํ’ˆ์งˆ ๊ฐœ์„ 

    • ์•ˆ์ „์„ฑ ๋ฐ ํŽธํ–ฅ์„ฑ: ์œ ํ•ด ์ฝ˜ํ…์ธ  ํ•„ํ„ฐ๋ง, ํŽธํ–ฅ์„ฑ ์™„ํ™” ๊ธฐ๋ฒ•

  • ML/GenAI Foundation model์— ๋Œ€ํ•œ ์„ ์ˆ˜ ์ง€์‹ ์ˆ˜์ค€?

    • ๋ชจ๋ธ ํฌ๊ธฐ๋ณ„ ํŠน์„ฑ: 7B, 13B, 70B ๋“ฑ ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜์— ๋”ฐ๋ฅธ ์„ฑ๋Šฅ/๋น„์šฉ ํŠธ๋ ˆ์ด๋“œ์˜คํ”„

    • ๋ชจ๋ธ ํŒจ๋ฐ€๋ฆฌ: GPT, Claude, Llama, PaLM ๋“ฑ ์ฃผ์š” ๋ชจ๋ธ๋“ค์˜ ํŠน์ง•๊ณผ ์ฐจ์ด์ 

    • ๋ผ์ด์„ ์Šค ๋ฐ ์‚ฌ์šฉ ์ œ์•ฝ: ์ƒ์—…์  ์‚ฌ์šฉ ๊ฐ€๋Šฅ ์—ฌ๋ถ€, ๋ฐ์ดํ„ฐ ํ”„๋ผ์ด๋ฒ„์‹œ ์ •์ฑ…

    • ํŒŒ์ธํŠœ๋‹: Full fine-tuning, LoRA, QLoRA ๋“ฑ ๊ธฐ๋ฒ•๋ณ„ ๊ฒฝํ—˜

    • ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ (BGE-M3, E5 ๋“ฑ) ํŒŒ์ธํŠœ๋‹ ๊ฒฝํ—˜

    • ๋ชจ๋ธ ํ‰๊ฐ€: BLEU, ROUGE, ์ธ๊ฐ„ ํ‰๊ฐ€ ๋“ฑ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•๋ก  ์ ์šฉ

    • Llama, Mistral, Phi ๋“ฑ ์˜คํ”ˆ์†Œ์Šค ๋ชจ๋ธ์˜ ์ž์ฒด ํ˜ธ์ŠคํŒ… ๊ฒฝํ—˜

  • PoC or ํ”„๋กœํ† ํƒ€์ž… ํƒ€์ž„๋ผ์ธ์€? ํ”„๋กœ๋•์…˜ ๋Ÿฐ์นญ ๊ณ„ํš/ํƒ€์ž„๋ผ์ธ์ด ์žˆ๋Š”์ง€?

1. Agent Framework ์งˆ๋ฌธ


1.1 Framework ๋ฐ ์•„ํ‚คํ…์ฒ˜

  • ํ˜„์žฌ ์‚ฌ์šฉ ์ค‘์ธ Agent Framework๋Š”? (LangGraph, Strands, AutoGen, CrewAI)

    • ๊ธฐ์กด ์‹œ์Šคํ…œ๊ณผ์˜ ํ˜ธํ™˜์„ฑ ๊ณ ๋ ค์‚ฌํ•ญ์ด ์žˆ๋‚˜์š”?

    • ํ”„๋ ˆ์ž„์›Œํฌ ๋งˆ์ด๊ทธ๋ ˆ์ด์…˜ ๊ณ„ํš์ด ์žˆ๋‹ค๋ฉด ์–ด๋–ค ๊ฒƒ์ธ๊ฐ€์š”?

  • ํ˜„์žฌ ์‚ฌ์šฉ ์ค‘์ด๊ฑฐ๋‚˜ ๊ฒ€ํ† ํ•  Agent ์•„ํ‚คํ…์ฒ˜ ํŒจํ„ด์€? (์˜ˆ: Single Agent, Multi-Agent, Hierarchical, Swarm ๋“ฑ)

  • Agent ๊ฐ„ ํ†ต์‹  ํ”„๋กœํ† ์ฝœ์€ ์–ด๋–ป๊ฒŒ ๊ตฌ์„ฑํ•  ์˜ˆ์ •์ธ๊ฐ€์š”? (Message Passing, Shared Memory, Event-driven, REST API)

  • Agent ์ƒํƒœ ๊ด€๋ฆฌ ๋ฐฉ์‹์€ ์–ด๋–ป๊ฒŒ ํ•  ์˜ˆ์ •์ธ๊ฐ€์š”? (Stateless, Session-based, Persistent State)

1.2 ๋ฉ”๋ชจ๋ฆฌ ๋ฐ ์ปจํ…์ŠคํŠธ ๊ด€๋ฆฌ

  • ๋Œ€ํ™” ํžˆ์Šคํ† ๋ฆฌ ์ €์žฅ ๋ฐฉ์‹์€? (In-memory, Redis, DynamoDB, RDS) ํžˆ์Šคํ† ๋ฆฌ ๋ณด๊ด€ ๊ธฐ๊ฐ„์€? (์˜ˆ: 1์ผ, 1์ฃผ, 1๊ฐœ์›”, ์˜๊ตฌ)

  • ์žฅ๊ธฐ ๋ฉ”๋ชจ๋ฆฌ ๊ตฌํ˜„ ๋ฐฉ๋ฒ•์€? (Vector DB, Graph DB, Knowledge Graph)

  • ๋ฉ”๋ชจ๋ฆฌ ์šฉ๋Ÿ‰ ์ œํ•œ ๋ฐ ์˜ค๋ž˜๋œ ์ •๋ณด ์‚ญ์ œ ์ •์ฑ…์€?

  • ์ปจํ…์ŠคํŠธ ์œˆ๋„์šฐ ๊ด€๋ฆฌ ์ „๋žต์€? (Sliding Window; ์ตœ๊ทผ N๊ฐœ ๋ฉ”์„ธ์ง€๋งŒ ์œ ์ง€, Summarization, Compression) ์ปจํ…์ŠคํŠธ ๊ธธ์ด ์ œํ•œ์€? (4K, 8K, 32K ๋“ฑ)

  • ์‚ฌ์šฉ์ž๋ณ„ ๊ฐœ์ธํ™” ๋ฐ์ดํ„ฐ ์ €์žฅ ์œ„์น˜๋Š”? (๋กœ์ปฌ DB, ํด๋ผ์šฐ๋“œ ์Šคํ† ๋ฆฌ์ง€, ์•”ํ˜ธํ™” ํ•„์š” ์—ฌ๋ถ€)

1.3 Tool Integration ๋ฐ Function Calling

  • ์—ฐ๋™ํ•  ์™ธ๋ถ€ API ๋ชฉ๋ก์€? (๊ฐœ์ˆ˜, ์ธ์ฆ ๋ฐฉ์‹ - Auth 2.0/JWT/API Key ๋“ฑ, Rate Limit - ์˜ˆ: 5 calls/minute)

  • Function Calling ๊ตฌํ˜„ ๋ฐฉ์‹์€? (OpenAI Function, Anthropic Tools, Custom Parser)

  • Tool ์‹คํ–‰ ๊ฒฐ๊ณผ ๊ฒ€์ฆ ๋ฐฉ๋ฒ•์€? (Schema Validation, Output Parsing, Error Handling)

  • Tool ์‹คํ–‰ ๊ถŒํ•œ์€ ์–ด๋–ป๊ฒŒ ๊ด€๋ฆฌํ•  ์˜ˆ์ •์ธ๊ฐ€์š”?

    • Role-based: ์‚ฌ์šฉ์ž ์—ญํ• ์— ๋”ฐ๋ฅธ ๊ถŒํ•œ (์˜ˆ: ๊ด€๋ฆฌ์ž, ์ผ๋ฐ˜ ์‚ฌ์šฉ์ž)

    • User-based: ๊ฐœ๋ณ„ ์‚ฌ์šฉ์ž๋ณ„ ๊ถŒํ•œ ์„ค์ •

    • Context-based: ์ƒํ™ฉ์— ๋”ฐ๋ฅธ ๋™์  ๊ถŒํ•œ (์˜ˆ: ์—…๋ฌด ์‹œ๊ฐ„, ์œ„์น˜)

2. RAG ์‹œ์Šคํ…œ ์งˆ๋ฌธ


2.1 ๋ฐ์ดํ„ฐ ์†Œ์Šค ๋ฐ ์ „์ฒ˜๋ฆฌ

  • ์ง€์‹ ์†Œ์Šค ๋ฐ์ดํ„ฐ ๋ณผ๋ฅจ์€? (๋ฌธ์„œ ์ˆ˜, ์ด ์šฉ๋Ÿ‰, ์ผ์ผ ์ฆ๊ฐ€๋Ÿ‰)

    • ๋ฌธ์„œ ์ˆ˜: 1์ฒœ๊ฐœ ๋ฏธ๋งŒ, 1์ฒœ-1๋งŒ๊ฐœ, 1๋งŒ-10๋งŒ๊ฐœ, 10๋งŒ๊ฐœ ์ด์ƒ

    • ์ด ์šฉ๋Ÿ‰: 1GB ๋ฏธ๋งŒ, 1-10GB, 10-100GB, 100GB ์ด์ƒ

    • ์ผ์ผ ์ฆ๊ฐ€๋Ÿ‰: ์ •์ , 1-10๊ฐœ, 10-100๊ฐœ, 100๊ฐœ ์ด์ƒ ๋ฌธ์„œ

    • ๋ฌธ์„œ ํ‰๊ท  ํฌ๊ธฐ: 1ํŽ˜์ด์ง€, 10ํŽ˜์ด์ง€, 100ํŽ˜์ด์ง€ ์ด์ƒ

    • ๋ฐ์ดํ„ฐ ์ฆ๊ฐ€ ํŒจํ„ด: ์„ ํ˜•, ์ง€์ˆ˜์ , ๊ณ„์ ˆ์  ๋ณ€๋™

  • ๋ฌธ์„œ ํ˜•์‹๋ณ„ ๋ถ„ํฌ๋Š”? (PDF %, Word %, HTML %, ๊ตฌ์กฐํ™” ๋ฐ์ดํ„ฐ %, ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ, ๊ฐ ํ˜•์‹๋ณ„ ํ’ˆ์งˆ ์ด์Šˆ ์žˆ๋Š”์ง€?)

  • ๋ฌธ์„œ ์–ธ์–ด ๋ถ„ํฌ๋Š”? (ํ•œ๊ธ€ %, ์˜์–ด %, ๊ธฐํƒ€ ์–ธ์–ด %)

    • ํ•œ๊ธ€: ๋น„์œจ๊ณผ ๋„๋ฉ”์ธ ํŠนํ™” ์šฉ์–ด ํฌํ•จ ์—ฌ๋ถ€

    • ์˜์–ด: ๊ธฐ์ˆ  ๋ฌธ์„œ, ํ•™์ˆ  ๋…ผ๋ฌธ, ๋น„์ฆˆ๋‹ˆ์Šค ๋ฌธ์„œ ๋“ฑ

    • ๊ธฐํƒ€ ์–ธ์–ด: ์ค‘๊ตญ์–ด, ์ผ๋ณธ์–ด ๋“ฑ ์ฒ˜๋ฆฌ ํ•„์š”์„ฑ

    • ์–ธ์–ด๋ณ„ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ ์„ฑ๋Šฅ ์ฐจ์ด ๊ณ ๋ ค์‚ฌํ•ญ

  • ๋ฌธ์„œ ์—…๋ฐ์ดํŠธ ์ฃผ๊ธฐ๋Š”? (์‹ค์‹œ๊ฐ„, ์ผ๋ฐฐ์น˜, ์ฃผ๋ฐฐ์น˜, ์›”๋ฐฐ์น˜)

  • OCR ์ฒ˜๋ฆฌ๊ฐ€ ํ•„์š”ํ•œ ๋ฌธ์„œ ๋น„์œจ์€?

    • OCR ์ฒ˜๋ฆฌ ๋Œ€์ƒ: ์Šค์บ”๋œ PDF, ์ด๋ฏธ์ง€ ๋‚ด ํ…์ŠคํŠธ

    • OCR ์ •ํ™•๋„ ์š”๊ตฌ์‚ฌํ•ญ: 95% ์ด์ƒ, ๋„๋ฉ”์ธ ํŠนํ™” ์šฉ์–ด ์ธ์‹

    • ํ…Œ์ด๋ธ” ์ถ”์ถœ: ๋ณต์žกํ•œ ํ‘œ ๊ตฌ์กฐ, ๋ณ‘ํ•ฉ๋œ ์…€ ์ฒ˜๋ฆฌ

    • ์ด๋ฏธ์ง€/์ฐจํŠธ: ์บก์…˜, ์„ค๋ช… ํ…์ŠคํŠธ ์ถ”์ถœ

  • ํ…Œ์ด๋ธ”, ์ด๋ฏธ์ง€, ์ฐจํŠธ ์ถ”์ถœ ํ•„์š” ์—ฌ๋ถ€๋Š”?

2.2 ์ฒญํ‚น ๋ฐ ์ž„๋ฒ ๋”ฉ ์ „๋žต

  • ์ฒญํ‚น ๋ฐฉ์‹์€? (Fixed Size, Semantic, Recursive, Document Structure-based)

  • ์ฒญํฌ ํฌ๊ธฐ๋Š”? (ํ† ํฐ ์ˆ˜, ๋ฌธ์ž ์ˆ˜ - ํ•œ๊ธ€ ๊ธฐ์ค€ 500์ž/1000์ž/2000์ž, ๋ฌธ์žฅ ์ˆ˜ - 3~5๋ฌธ์žฅ/5~10๋ฌธ์žฅ ๋‹จ์œ„)

  • ์ฒญํฌ ์˜ค๋ฒ„๋žฉ ๋น„์œจ์€? (0%, 10%, 20%, 50%)

  • ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ ์„ ํƒ ๊ธฐ์ค€์€? (๋‹ค๊ตญ์–ด ์ง€์›, ๋„๋ฉ”์ธ ํŠนํ™”, ์„ฑ๋Šฅ, ๋น„์šฉ)

  • ์ž„๋ฒ ๋”ฉ ์ฐจ์› ์ˆ˜๋Š”? (384, 768, 1024, 1536)

  • ์ž„๋ฒ ๋”ฉ ์—…๋ฐ์ดํŠธ ์ „๋žต์€?

    • ์ „์ฒด ์žฌ์ƒ์„ฑ: ๋ชจ๋“  ๋ฌธ์„œ ์žฌ์ž„๋ฒ ๋”ฉ, ์ผ๊ด€์„ฑ ๋ณด์žฅ, ๋†’์€ ๋น„์šฉ

    • ์ฆ๋ถ„ ์—…๋ฐ์ดํŠธ: ๋ณ€๊ฒฝ๋œ ๋ฌธ์„œ๋งŒ ์—…๋ฐ์ดํŠธ, ํšจ์œจ์ , ์ผ๊ด€์„ฑ ์ด์Šˆ

    • ๋ฒ„์ „ ๊ด€๋ฆฌ: ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ ๋ณ€๊ฒฝ ์‹œ ๋งˆ์ด๊ทธ๋ ˆ์ด์…˜ ์ „๋žต

    • A/B ํ…Œ์ŠคํŒ…: ์ƒˆ๋กœ์šด ์ž„๋ฒ ๋”ฉ๊ณผ ๊ธฐ์กด ์ž„๋ฒ ๋”ฉ ์„ฑ๋Šฅ ๋น„๊ต

    • ๋กค๋ฐฑ ๊ณ„ํš: ์—…๋ฐ์ดํŠธ ์‹คํŒจ ์‹œ ์ด์ „ ๋ฒ„์ „ ๋ณต๊ตฌ ๋ฐฉ์•ˆ

2.3 ๋ฒกํ„ฐ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ๋ฐ ๊ฒ€์ƒ‰

  • Vector DB ์„ ํƒ ๊ธฐ์ค€์€? (์„ฑ๋Šฅ, ํ™•์žฅ์„ฑ, ๋น„์šฉ, ๊ด€๋ฆฌ ํŽธ์˜์„ฑ)

  • ์ธ๋ฑ์Šค ํƒ€์ž…?

    • HNSW: ๋†’์€ ์ •ํ™•๋„, ๋น ๋ฅธ ๊ฒ€์ƒ‰, ๋ฉ”๋ชจ๋ฆฌ ์ง‘์•ฝ์ 

    • IVF: ๋ฉ”๋ชจ๋ฆฌ ํšจ์œจ์ , ํด๋Ÿฌ์Šคํ„ฐ๋ง ๊ธฐ๋ฐ˜, ์ •ํ™•๋„ ํŠธ๋ ˆ์ด๋“œ์˜คํ”„

    • LSH: ๊ทผ์‚ฌ ๊ฒ€์ƒ‰, ๋น ๋ฅธ ์†๋„, ๋‚ฎ์€ ์ •ํ™•๋„

    • Annoy: ๋””์Šคํฌ ๊ธฐ๋ฐ˜, ๋ฉ”๋ชจ๋ฆฌ ํšจ์œจ์ , ์ •์  ์ธ๋ฑ์Šค

    • ์ธ๋ฑ์Šค ๊ตฌ์ถ• ์‹œ๊ฐ„๊ณผ ์—…๋ฐ์ดํŠธ ๋น„์šฉ ๊ณ ๋ ค์‚ฌํ•ญ์€?

  • ๊ฒ€์ƒ‰ ์ •ํ™•๋„ vs ์†๋„ ํŠธ๋ ˆ์ด๋“œ์˜คํ”„ ์„ค์ •์€?

    • ์ •ํ™•๋„ ๋ชฉํ‘œ ์˜ˆ์‹œ: Recall@10 > 90%

    • ์‘๋‹ต ์‹œ๊ฐ„ ๋ชฉํ‘œ ์˜ˆ์‹œ: P95 < 50ms, P99 < 100ms

    • ๊ฒ€์ƒ‰ ํŒŒ๋ผ๋ฏธํ„ฐ ํŠœ๋‹ ์˜ˆ์‹œ: ef_search, nprobe ๋“ฑ

  • ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ๊ฒ€์ƒ‰ ๊ตฌํ˜„ ์—ฌ๋ถ€๋Š”? (Dense + Sparse, Keyword + Semantic)

  • ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ ๋ฆฌ๋žญํ‚น๊ณผ ํ›„์ฒ˜๋ฆฌ๋Š”?

    • Cross-encoder: ์ฟผ๋ฆฌ-๋ฌธ์„œ ์Œ ์ง์ ‘ ์ ์ˆ˜ํ™”, ๋†’์€ ์ •ํ™•๋„, ๋А๋ฆฐ ์†๋„

    • LLM-based: LLM์„ ํ™œ์šฉํ•œ ๊ด€๋ จ์„ฑ ์ ์ˆ˜ํ™”

    • Rule-based: ๋„๋ฉ”์ธ ๊ทœ์น™ ๊ธฐ๋ฐ˜ ์ ์ˆ˜ ์กฐ์ •

    • ๋‹ค์–‘์„ฑ ํ™•๋ณด: ์œ ์‚ฌํ•œ ๊ฒฐ๊ณผ ์ œ๊ฑฐ, ๋‹ค์–‘ํ•œ ๊ด€์  ์ œ๊ณต

    • ๊ฐœ์ธํ™”: ์‚ฌ์šฉ์ž ํžˆ์Šคํ† ๋ฆฌ ๊ธฐ๋ฐ˜ ๊ฒฐ๊ณผ ์กฐ์ •

  • ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ ๊ฐœ์ˆ˜๋Š”? (์•„๋ž˜๋Š” ์˜ˆ์‹œ์ž…๋‹ˆ๋‹ค)

    • Top-K ๊ฐ’: ๊ธฐ๋ณธ 5๊ฐœ, ์ตœ๋Œ€ 20๊ฐœ

    • ๋™์  ์กฐ์ •: ์ฟผ๋ฆฌ ๋ณต์žก๋„์— ๋”ฐ๋ฅธ ๊ฒฐ๊ณผ ์ˆ˜ ์กฐ์ •

    • ์‹ ๋ขฐ๋„ ์ž„๊ณ„๊ฐ’: ๋‚ฎ์€ ์ ์ˆ˜ ๊ฒฐ๊ณผ ํ•„ํ„ฐ๋ง

    • ์ปจํ…์ŠคํŠธ ๊ธธ์ด ์ œํ•œ: LLM ์ž…๋ ฅ ํ† ํฐ ์ œํ•œ ๊ณ ๋ ค

    • ์‚ฌ์šฉ์ž ํ”ผ๋“œ๋ฐฑ ๊ธฐ๋ฐ˜ ์ตœ์ ํ™” ๋ฐฉ์•ˆ์€?

2.4 ์ƒ์„ฑ ๋ฐ ํ›„์ฒ˜๋ฆฌ

  • LLM ๋ชจ๋ธ ์„ ํƒ ๊ธฐ์ค€์€? (์„ฑ๋Šฅ, ๋น„์šฉ, ์ง€์—ฐ์‹œ๊ฐ„, ๋‹ค๊ตญ์–ด ์ง€์›)

  • ํ”„๋กฌํ”„ํŠธ ํ…œํ”Œ๋ฆฟ ๊ด€๋ฆฌ ๋ฐฉ๋ฒ•์€? (๋ฒ„์ „ ๊ด€๋ฆฌ, A/B ํ…Œ์ŠคํŒ…, ๋™์  ์ƒ์„ฑ)

  • ์ปจํ…์ŠคํŠธ ๊ธธ์ด ์ œํ•œ ์ฒ˜๋ฆฌ ๋ฐฉ๋ฒ•์€? (Truncation, Summarization, Chunking)

  • ๋‹ต๋ณ€ ํ’ˆ์งˆ ๊ฒ€์ฆ ๋ฐฉ๋ฒ•์€? (Confidence Score, Fact-checking, Human Review)

  • ํ• ๋ฃจ์‹œ๋„ค์ด์…˜ ๋ฐฉ์ง€ ์ „๋žต์€? (Grounding, Citation, Confidence Threshold)

2.5 ํ‰๊ฐ€ ๋ฐ ๋ชจ๋‹ˆํ„ฐ๋ง

  • ํ‰๊ฐ€ ๋ฐ์ดํ„ฐ์…‹ ๊ตฌ์ถ• ํ˜„ํ™ฉ์€? (ํฌ๊ธฐ, ํ’ˆ์งˆ, ๋„๋ฉ”์ธ ์ปค๋ฒ„๋ฆฌ์ง€)

  • ์ž๋™ ํ‰๊ฐ€ ๋ฉ”ํŠธ๋ฆญ์€? (BLEU, ROUGE, BERTScore, Faithfulness, Answer Relevancy)

  • ์ธ๊ฐ„ ํ‰๊ฐ€ ํ”„๋กœ์„ธ์Šค๋Š”? (ํ‰๊ฐ€์ž ์ˆ˜, ํ‰๊ฐ€ ๊ธฐ์ค€, ์ฃผ๊ธฐ)

  • ์„ฑ๋Šฅ ๋ชจ๋‹ˆํ„ฐ๋ง ๋Œ€์‹œ๋ณด๋“œ ๊ตฌ์ถ• ์—ฌ๋ถ€๋Š”?

  • A/B ํ…Œ์ŠคํŒ… ์ธํ”„๋ผ ๊ตฌ์ถ• ์—ฌ๋ถ€๋Š”?

3. AI Infrastructure ์งˆ๋ฌธ


3.1 ์ปดํ“จํŒ… ๋ฆฌ์†Œ์Šค

  • GPU ์ธ์Šคํ„ด์Šค ํƒ€์ž… ์„ ํ˜ธ๋„๋Š”? (์˜ˆ: p3, p4, g4, g5, inf1, inf2)

  • GPU ๋ฉ”๋ชจ๋ฆฌ ์š”๊ตฌ์‚ฌํ•ญ์€? (์˜ˆ: 16GB, 32GB, 40GB, 80GB) ๊ทธ ์ด์œ ๋Š”? (์–ด๋–ค ๋ชจ๋ธ์„ ์„œ๋น™ํ•˜๋Š”์ง€?)

  • CPU ์ฝ”์–ด ์ˆ˜ ๋ฐ ๋ฉ”๋ชจ๋ฆฌ ์š”๊ตฌ์‚ฌํ•ญ์€? ๊ทธ ์ด์œ ๋Š”?

  • ์Šคํ† ๋ฆฌ์ง€ ํƒ€์ž… ๋ฐ ์šฉ๋Ÿ‰์€? (EBS gp3, io2, EFS, FSx)

  • ๋„คํŠธ์›Œํฌ ๋Œ€์—ญํญ ์š”๊ตฌ์‚ฌํ•ญ์€? (1Gbps, 10Gbps, 25Gbps)

3.2 ํ™•์žฅ์„ฑ ๋ฐ ๊ฐ€์šฉ์„ฑ

  • ์˜คํ† ์Šค์ผ€์ผ๋ง ๋ฉ”ํŠธ๋ฆญ์€? (CPU, GPU ์‚ฌ์šฉ๋ฅ , ํ ๊ธธ์ด, ์‘๋‹ต์‹œ๊ฐ„)

  • ์ตœ์†Œ/์ตœ๋Œ€ ์ธ์Šคํ„ด์Šค ์ˆ˜๋Š”?

  • ๋‹ค์ค‘ AZ ๋ฐฐํฌ ํ•„์š” ์—ฌ๋ถ€๋Š”?

3.3 ๋ฐ์ดํ„ฐ ํŒŒ์ดํ”„๋ผ์ธ

  • ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ๋ฐฉ์‹์€? (์˜ˆ: Batch, Streaming, API, File Upload)

  • ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ ์—”์ง„์€? (์˜ˆ: Spark, Flink, Kinesis, Lambda)

  • ๋ฐ์ดํ„ฐ ํ’ˆ์งˆ ๊ฒ€์ฆ ํ”„๋กœ์„ธ์Šค๋Š”?

  • ๋ฐ์ดํ„ฐ ๋ฒ„์ „ ๊ด€๋ฆฌ ๋ฐฉ๋ฒ•์€?

  • ๋ฐ์ดํ„ฐ ๋ฐฑ์—… ๋ฐ ์•„์นด์ด๋น™ ์ „๋žต์€?

3.4 MLOps ๋ฐ DevOps

  • CI/CD ํŒŒ์ดํ”„๋ผ์ธ ๋„๊ตฌ๋Š”? (์˜ˆ: Jenkins, GitLab CI, GitHub Actions, CodePipeline)

  • ๋ชจ๋ธ ๋ ˆ์ง€์ŠคํŠธ๋ฆฌ ์‚ฌ์šฉ ์—ฌ๋ถ€๋Š”? ๊ธฐ์กด ์†”๋ฃจ์…˜์„ ๊ฑท์–ด๋‚ด๊ณ  ์‹ ๊ทœ ๊ฒ€ํ† ํ•ด์•ผ ํ•˜๋Š”์ง€? (์˜ˆ: MLflow, SageMaker Model Registry, ์ž์ฒด ๊ตฌ์ถ•)

  • ์‹คํ—˜ ์ถ”์  ๋„๊ตฌ๋Š”? ๊ธฐ์กด ์†”๋ฃจ์…˜์„ ๊ฑท์–ด๋‚ด๊ณ  ์‹ ๊ทœ ๊ฒ€ํ† ํ•ด์•ผ ํ•˜๋Š”์ง€? (MLflow, Weights & Biases, Neptune, SageMaker Experiments)

  • ๋ชจ๋ธ ๋ฐฐํฌ ์ „๋žต์€? (Blue-Green, Canary, Rolling, Shadow)

  • ์ธํ”„๋ผ ์ฝ”๋“œ ๊ด€๋ฆฌ ๋ฐฉ๋ฒ•์€? ๊ธฐ์กด ์†”๋ฃจ์…˜์„ ๊ฑท์–ด๋‚ด๊ณ  ์‹ ๊ทœ ๊ฒ€ํ† ํ•ด์•ผ ํ•˜๋Š”์ง€? (Terraform, CloudFormation, CDK)

4. Model Serving ์ƒ์„ธ ์งˆ๋ฌธ


4.1 ์„ฑ๋Šฅ ์š”๊ตฌ์‚ฌํ•ญ

  • ๋ชฉํ‘œ ์„ฑ๋Šฅ ์ง€ํ‘œ์™€ ์ธก์ • ๋ฐฉ๋ฒ•์€?

    • TTFT (Time to First Token): ์ฒซ ํ† ํฐ๊นŒ์ง€ ์ง€์—ฐ์‹œ๊ฐ„ < 2์ดˆ

    • E2E Latency: ์ „์ฒด ์‘๋‹ต ์™„๋ฃŒ๊นŒ์ง€ < 10์ดˆ

    • Inter-token Latency: ํ† ํฐ ๊ฐ„ ์ง€์—ฐ์‹œ๊ฐ„ < 50ms

    • TPS (Tokens Per Second): ์ดˆ๋‹น ํ† ํฐ ์ƒ์„ฑ ์†๋„ > 50 TPS

    • ์ธก์ • ๋„๊ตฌ: ์ปค์Šคํ…€ ๋ฒค์น˜๋งˆํฌ, ํ”„๋กœ๋•์…˜ ๋ชจ๋‹ˆํ„ฐ๋ง

    • SLA ์ •์˜: 99.9% ์š”์ฒญ์ด ๋ชฉํ‘œ ์ง€์—ฐ์‹œ๊ฐ„ ๋‚ด ์ฒ˜๋ฆฌ

  • ๋™์‹œ ์—ฐ๊ฒฐ ์ˆ˜ ์ œํ•œ์€?

    • ์˜ˆ์ƒ ๋™์‹œ ์‚ฌ์šฉ์ž: 100๋ช…, 1000๋ช…, 10000๋ช…

    • ๋™์‹œ ์—ฐ๊ฒฐ ์ œํ•œ: ์ปค๋„ฅ์…˜ ํ’€ ํฌ๊ธฐ, ๋ฉ”๋ชจ๋ฆฌ ์ œ์•ฝ

    • ํ์ž‰ ์ „๋žต: FIFO, ์šฐ์„ ์ˆœ์œ„ ๊ธฐ๋ฐ˜, ๊ณต์ •์„ฑ ๋ณด์žฅ

    • ๋ฐฑํ”„๋ ˆ์…” ์ฒ˜๋ฆฌ: ๊ณผ๋ถ€ํ•˜ ์‹œ ์š”์ฒญ ๊ฑฐ๋ถ€ vs ๋Œ€๊ธฐ

    • ๋กœ๋“œ ๋ฐธ๋Ÿฐ์‹ฑ: ๋ผ์šด๋“œ ๋กœ๋นˆ, ์ตœ์†Œ ์—ฐ๊ฒฐ, ๊ฐ€์ค‘์น˜ ๊ธฐ๋ฐ˜

  • ํ”ผํฌ ์‹œ๊ฐ„๋Œ€ ํŠธ๋ž˜ํ”ฝ ํŒจํ„ด๊ณผ ๋Œ€์‘ ๋ฐฉ์•ˆ์€?

    • ์˜ˆ์ƒ ํ”ผํฌ ๋ฐฐ์ˆ˜: ํ‰๊ท  ๋Œ€๋น„ 2๋ฐฐ, 5๋ฐฐ, 10๋ฐฐ

    • ํ”ผํฌ ๋Œ€์‘: ์˜คํ† ์Šค์ผ€์ผ๋ง, ์บ์‹ฑ, ํŠธ๋ž˜ํ”ฝ ์ œํ•œ

4.2 ๋ชจ๋ธ ์ตœ์ ํ™”

  • ๋ชจ๋ธ ์–‘์žํ™” ์ ์šฉ ์—ฌ๋ถ€๋Š”? (INT8, FP16, INT4)

  • ๋ชจ๋ธ ์••์ถ• ๊ธฐ๋ฒ• ์‚ฌ์šฉ ์—ฌ๋ถ€๋Š”? (Pruning, Distillation)

  • ๋ฐฐ์น˜ ์ฒ˜๋ฆฌ ์„ค์ •์€? (Dynamic Batching, Batch Size)

  • ์บ์‹ฑ ๋ ˆ์ด์–ด ๊ตฌ์„ฑ์€? (Mem0,Redis, Memcached, Application-level)

  • GPU ๋ฉ”๋ชจ๋ฆฌ ์ตœ์ ํ™” ๊ธฐ๋ฒ•์€? (Model Sharding, Pipeline Parallelism)

4.3 API ์„ค๊ณ„ ๋ฐ ๊ด€๋ฆฌ

  • API ๋ฒ„์ „ ๊ด€๋ฆฌ ์ „๋žต์€?

  • Rate Limiting ์ •์ฑ…์€? (per user, per API key, global)

  • API ๋ฌธ์„œํ™” ๋„๊ตฌ๋Š”? (Swagger, Postman, ์ž์ฒด ๊ตฌ์ถ•)

  • API ๋ชจ๋‹ˆํ„ฐ๋ง ๋„๊ตฌ๋Š”? (CloudWatch, Datadog)

  • ์—๋Ÿฌ ์ฒ˜๋ฆฌ ๋ฐ ์žฌ์‹œ๋„ ์ •์ฑ…์€?

  • ๋ณด์•ˆ๊ณผ ๋„คํŠธ์›Œํฌ ์•„ํ‚คํ…์ฒ˜๋Š”? (์•„๋ž˜๋Š” ์˜ˆ์‹œ์ž…๋‹ˆ๋‹ค.)

    • VPC ๋ฐฐํฌ: ํ”„๋ผ์ด๋น— ์„œ๋ธŒ๋„ท, ๋ณด์•ˆ ๊ทธ๋ฃน

    • API Gateway: ์ธ์ฆ, ๊ถŒํ•œ ๋ถ€์—ฌ, ํŠธ๋ž˜ํ”ฝ ๊ด€๋ฆฌ

    • ๋กœ๋“œ ๋ฐธ๋Ÿฐ์„œ: ALB, NLB, ํ—ฌ์Šค ์ฒดํฌ

    • ์™ธ๋ถ€ API vs ๋‚ด๋ถ€ ๋ฐฐํฌ: ๋ณด์•ˆ vs ํŽธ์˜์„ฑ ํŠธ๋ ˆ์ด๋“œ์˜คํ”„

    • ๋ฐ์ดํ„ฐ ์•”ํ˜ธํ™”: ์ „์†ก ์ค‘, ์ €์žฅ ์‹œ

    • ์ ‘๊ทผ ์ œ์–ด: IAM, RBAC, API ํ‚ค ๊ด€๋ฆฌ

5. Model & Data ์งˆ๋ฌธ


5.1 ๋ฐ์ดํ„ฐ ํ’ˆ์งˆ ๋ฐ ๊ฑฐ๋ฒ„๋„Œ์Šค

  • ๋ฐ์ดํ„ฐ ํ’ˆ์งˆ ๋ฉ”ํŠธ๋ฆญ์€? (์™„์ „์„ฑ, ์ •ํ™•์„ฑ, ์ผ๊ด€์„ฑ, ์ ์‹œ์„ฑ)

  • ๋ฐ์ดํ„ฐ ๋ผ๋ฒจ๋ง ํ”„๋กœ์„ธ์Šค๋Š”? (์ž๋™, ๋ฐ˜์ž๋™, ์ˆ˜๋™)

  • ๋ฐ์ดํ„ฐ ํŽธํ–ฅ์„ฑ ๊ฒ€์ฆ ๋ฐฉ๋ฒ•์€?

  • ๋ฐ์ดํ„ฐ ๊ณ„๋ณด ์ถ”์  ์‹œ์Šคํ…œ ๊ตฌ์ถ• ์—ฌ๋ถ€๋Š”?

  • ๊ฐœ์ธ์ •๋ณด ๋งˆ์Šคํ‚น/์ต๋ช…ํ™” ํ”„๋กœ์„ธ์Šค๋Š”?

5.2 ๋ชจ๋ธ ์„ ํƒ ๋ฐ ์ปค์Šคํ„ฐ๋งˆ์ด์ง•

  • Foundation Model ํ›„๋ณด๊ตฐ์€? (๊ตฌ์ฒด์  ๋ชจ๋ธ๋ช…๊ณผ ๋ฒ„์ „)

  • ๋ชจ๋ธ ํฌ๊ธฐ๋ณ„ ์„ฑ๋Šฅ/๋น„์šฉ ๋ถ„์„ ์™„๋ฃŒ ์—ฌ๋ถ€๋Š”?

  • ํŒŒ์ธํŠœ๋‹ ๋ฐ์ดํ„ฐ์…‹ ํฌ๊ธฐ๋Š”? (์ƒ˜ํ”Œ ์ˆ˜, ํ’ˆ์งˆ ์ ์ˆ˜)

  • ํŒŒ์ธํŠœ๋‹ ๋ฐฉ๋ฒ• ์„ ํƒ ๊ธฐ์ค€์€? (์„ฑ๋Šฅ ํ–ฅ์ƒ, ๋น„์šฉ, ์‹œ๊ฐ„)

5.3 Fine-tuning ์ƒ์„ธ ์งˆ๋ฌธ

  • ํŒŒ์ธํŠœ๋‹ ๋ชฉ์ ์€?

    • Task-specific: ํŠน์ • ์ž‘์—… ์„ฑ๋Šฅ ํ–ฅ์ƒ

    • Domain adaptation: ๋„๋ฉ”์ธ ์ง€์‹ ํ›ˆ๋ จ

    • Instruction following: ์ง€์‹œ ์‚ฌํ•ญ ์ดํ•ด ๊ฐœ์„ 

    • Safety alignment: ์•ˆ์ „ํ•˜๊ณ  ์œ ์šฉํ•œ ์‘๋‹ต

  • ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ๋ฐฉ๋ฒ•? (์˜ˆ: ๋‚ด๋ถ€ ๋ฐ์ดํ„ฐ, ํฌ๋ผ์šฐ๋“œ์†Œ์‹ฑ, ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ)

  • ๋ฐ์ดํ„ฐ ํ’ˆ์งˆ ๊ฒ€์ฆ ๋ฐฉ๋ฒ•์ด ์žˆ๋‹ค๋ฉด? (์˜ˆ: ์ „๋ฌธ๊ฐ€ ๊ฒ€ํ† , ๋‹ค์ค‘ ๊ฒ€์ฆ)

  • ํŒŒ์ธํŠœ๋‹ ๋ฐฉ์‹์€? (Full Fine-tuning, LoRA, QLoRA, AdaLoRA, Prefix Tuning, P-Tuning v2)

  • LoRA ์„ค์ •๊ฐ’์€? (rank, alpha, dropout, target modules)

  • ํŒŒ์ธํŠœ๋‹ ๋ฐ์ดํ„ฐ ํ˜•ํƒœ๋Š”? (Instruction-Response, Question-Answer, Completion, Chat format)

  • ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ ํŒŒ์ดํ”„๋ผ์ธ์€? (Tokenization, Formatting, Filtering, Augmentation)

  • ๋ถ„์‚ฐ ํ›ˆ๋ จ ์„ค์ •์€? (Data parallel, Model parallel, Pipeline parallel)

  • ๋ฉ”๋ชจ๋ฆฌ ์ตœ์ ํ™” ๊ธฐ๋ฒ•์€? (Gradient checkpointing, Mixed precision, DeepSpeed ZeRO)

  • ํŒŒ์ธํŠœ๋‹ ํ‰๊ฐ€ ๋ฉ”ํŠธ๋ฆญ์€? (Perplexity, BLEU, ROUGE, Task-specific metrics)

5.4 Continual Pre-training ์ƒ์„ธ ์งˆ๋ฌธ

  • Continual pre-training ๋ชฉ์ ์€? (Domain adaptation, Knowledge update, Vocabulary expansion)

  • ์ถ”๊ฐ€ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ ์†Œ์Šค๋Š”? (๋„๋ฉ”์ธ ํŠนํ™” ์ฝ”ํผ์Šค, ์ตœ์‹  ๋ฐ์ดํ„ฐ, ๋‹ค๊ตญ์–ด ๋ฐ์ดํ„ฐ)

  • ๋ฐ์ดํ„ฐ ํ’ˆ์งˆ ๊ฒ€์ฆ ํ”„๋กœ์„ธ์Šค๋Š”? (์ค‘๋ณต ์ œ๊ฑฐ, ํ’ˆ์งˆ ํ•„ํ„ฐ๋ง, ๋…์„ฑ ๊ฒ€์‚ฌ)

  • ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ ํŒŒ์ดํ”„๋ผ์ธ์€? (Cleaning, Deduplication, Format standardization)

  • ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ ํฌ๊ธฐ๋Š”? (ํ† ํฐ ์ˆ˜, ๋ฌธ์„œ ์ˆ˜, ์ด ์šฉ๋Ÿ‰)

5.5 ๋ชจ๋ธ ํ›ˆ๋ จ ์ธํ”„๋ผ

  • ํ›ˆ๋ จ์šฉ GPU ํด๋Ÿฌ์Šคํ„ฐ ๊ตฌ์„ฑ์€? (๋…ธ๋“œ ์ˆ˜, GPU ํƒ€์ž…, ๋ฉ”๋ชจ๋ฆฌ ์šฉ๋Ÿ‰)

  • ๋ถ„์‚ฐ ํ›ˆ๋ จ ํ”„๋ ˆ์ž„์›Œํฌ๋Š”? (PyTorch DDP, FSP, Megatron-LM, DeepSpeed, FairScale)

  • ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ ์ €์žฅ์†Œ๋Š”? (S3, EFS, FSx, ๋กœ์ปฌ SSD)

  • ๋ฐ์ดํ„ฐ ๋กœ๋”ฉ ์ตœ์ ํ™”๋Š”? (Multi-processing, Prefetching, Caching)

  • ํ›ˆ๋ จ ๋ชจ๋‹ˆํ„ฐ๋ง ๋„๊ตฌ๋Š”? (์˜ˆ: TensorBoard, Weights & Biases, MLflow)

  • ์‹คํ—˜ ๊ด€๋ฆฌ ์‹œ์Šคํ…œ์€? (ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ ์ถ”์ , ๋ชจ๋ธ ๋ฒ„์ „ ๊ด€๋ฆฌ)

  • ํ›ˆ๋ จ ์ค‘ ์žฅ์•  ๋ณต๊ตฌ ๋ฐฉ์•ˆ์€? (์ž๋™ ์žฌ์‹œ์ž‘, ์ฒดํฌํฌ์ธํŠธ ๋ณต๊ตฌ)

  • ๋ฆฌ์†Œ์Šค ์‚ฌ์šฉ๋Ÿ‰ ๋ชจ๋‹ˆํ„ฐ๋ง์€? (GPU ์‚ฌ์šฉ๋ฅ , ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰, ๋„คํŠธ์›Œํฌ I/O)

  • ํ›ˆ๋ จ ๋น„์šฉ ์ถ”์  ๋ฐ ์ตœ์ ํ™”๋Š”?

  • ํ›ˆ๋ จ ์™„๋ฃŒ ํ›„ ๋ชจ๋ธ ๋ฐฐํฌ ํŒŒ์ดํ”„๋ผ์ธ์€?

5.6 ๋ชจ๋ธ ํ‰๊ฐ€ ๋ฐ ๊ฒ€์ฆ

  • ๋ฒค์น˜๋งˆํฌ ๋ฐ์ดํ„ฐ์…‹์€? (๊ณต๊ฐœ ๋ฐ์ดํ„ฐ์…‹, ์ž์ฒด ๊ตฌ์ถ•)

  • ๊ต์ฐจ ๊ฒ€์ฆ ์ „๋žต์€? (K-fold, Time-series split)

  • ๋ชจ๋ธ ์„ฑ๋Šฅ ์ €ํ•˜ ๊ฐ์ง€ ๋ฐฉ๋ฒ•์€?

6. Budget & Timeline ์ƒ์„ธ ์งˆ๋ฌธ


6.1 ๋น„์šฉ ๊ตฌ์กฐ

  • ๊ฐœ๋ฐœ ๋‹จ๊ณ„๋ณ„ ์˜ˆ์‚ฐ ๋ฐฐ๋ถ„์€? (์•„๋ž˜๋Š” ์˜ˆ์‹œ์ž…๋‹ˆ๋‹ค.)

    • PoC (10%): ๊ธฐ์ˆ  ๊ฒ€์ฆ, ํ”„๋กœํ† ํƒ€์ž… ๊ฐœ๋ฐœ

    • ๊ฐœ๋ฐœ (40%): ๋ณธ๊ฒฉ์  ์‹œ์Šคํ…œ ๊ตฌ์ถ•

    • ํ…Œ์ŠคํŠธ (10%): ํ’ˆ์งˆ ๋ณด์ฆ, ์„ฑ๋Šฅ ์ตœ์ ํ™”

    • ๋ฐฐํฌ (40%): ํ”„๋กœ๋•์…˜ ํ™˜๊ฒฝ ๊ตฌ์ถ•, ์šด์˜ ์ค€๋น„

    • ์˜ˆ์‚ฐ ์ดˆ๊ณผ ์‹œ ์šฐ์„ ์ˆœ์œ„: ํ•ต์‹ฌ ๊ธฐ๋Šฅ ์šฐ์„ , ๋ถ€๊ฐ€ ๊ธฐ๋Šฅ ์—ฐ๊ธฐ

    • ์˜ˆ๋น„ ์˜ˆ์‚ฐ: ์ „์ฒด ์˜ˆ์‚ฐ์˜ 10-20%

  • ์ธํ”„๋ผ ๋น„์šฉ ๊ตฌ์„ฑ ์š”์†Œ๋Š”? (์•„๋ž˜๋Š” ์˜ˆ์‹œ์ž…๋‹ˆ๋‹ค.)

    • ์ปดํ“จํŒ… (60%): GPU ์ธ์Šคํ„ด์Šค, CPU ์ธ์Šคํ„ด์Šค

    • ์Šคํ† ๋ฆฌ์ง€ (20%): ๋ชจ๋ธ ์ €์žฅ, ๋ฐ์ดํ„ฐ ์ €์žฅ

    • ๋„คํŠธ์›Œํฌ (10%): ๋ฐ์ดํ„ฐ ์ „์†ก, CDN

    • ๋ผ์ด์„ ์Šค (10%): ์†Œํ”„ํŠธ์›จ์–ด, API ์‚ฌ์šฉ๋ฃŒ

    • ๋น„์šฉ ๋ชจ๋‹ˆํ„ฐ๋ง: ์ผ์ผ ๋ฆฌํฌํŠธ, ์˜ˆ์‚ฐ ์•Œ๋ฆผ

  • ์šด์˜ ๋น„์šฉ ์˜ˆ์ƒ ๋ฒ”์œ„๋Š”? (์›”๊ฐ„, ์—ฐ๊ฐ„)

  • ๋น„์šฉ ์ตœ์ ํ™” ๋ชฉํ‘œ๋Š”? (% ์ ˆ๊ฐ ๋ชฉํ‘œ)

  • ์˜ˆ์‚ฐ ์ดˆ๊ณผ ์‹œ ๋Œ€์‘ ๋ฐฉ์•ˆ์€?

6.2 ์ผ์ • ๊ด€๋ฆฌ

  • ํ”„๋กœ์ ํŠธ ๋‹จ๊ณ„๋ณ„ ์ผ์ •์€? (์•„๋ž˜๋Š” ์˜ˆ์‹œ์ž…๋‹ˆ๋‹ค.)

    • ๊ธฐํš (4์ฃผ): ์š”๊ตฌ์‚ฌํ•ญ ์ •์˜, ์•„ํ‚คํ…์ฒ˜ ์„ค๊ณ„

    • ๊ฐœ๋ฐœ (12์ฃผ): ํ•ต์‹ฌ ๊ธฐ๋Šฅ ๊ตฌํ˜„, ํ†ตํ•ฉ ํ…Œ์ŠคํŠธ

    • ํ…Œ์ŠคํŠธ (4์ฃผ): ์„ฑ๋Šฅ ํ…Œ์ŠคํŠธ, ์‚ฌ์šฉ์ž ํ…Œ์ŠคํŠธ

    • ๋ฐฐํฌ (2์ฃผ): ํ”„๋กœ๋•์…˜ ๋ฐฐํฌ, ๋ชจ๋‹ˆํ„ฐ๋ง ์„ค์ •

    • ์ฃผ์š” ๋งˆ์ผ์Šคํ†ค: MVP ์™„์„ฑ, ๋ฒ ํƒ€ ํ…Œ์ŠคํŠธ, ์ •์‹ ์ถœ์‹œ

    • ์˜์กด์„ฑ: ์™ธ๋ถ€ API ์—ฐ๋™, ๋ฐ์ดํ„ฐ ์ค€๋น„, ์ธํ”„๋ผ ๊ตฌ์ถ•

  • ๋ฆฌ์Šคํฌ ์š”์ธ ๋ฐ ์™„์ถฉ ์‹œ๊ฐ„์€?

    • ๊ธฐ์ˆ ์  ๋ฆฌ์Šคํฌ: ๋ชจ๋ธ ์„ฑ๋Šฅ ๋ถ€์กฑ, ํ™•์žฅ์„ฑ ์ด์Šˆ

    • ์ผ์ • ๋ฆฌ์Šคํฌ: ๊ฐœ๋ฐœ ์ง€์—ฐ, ํ…Œ์ŠคํŠธ ๊ธฐ๊ฐ„ ๋ถ€์กฑ

    • ๋ฆฌ์†Œ์Šค ๋ฆฌ์Šคํฌ: ์ธ๋ ฅ ๋ถ€์กฑ, GPU ๊ฐ€์šฉ์„ฑ

    • ์™„์ถฉ ์‹œ๊ฐ„: ๊ฐ ๋‹จ๊ณ„๋ณ„ 20% ์—ฌ์œ  ์‹œ๊ฐ„

    • ๋Œ€์‘ ๋ฐฉ์•ˆ: ๋Œ€์•ˆ ๊ธฐ์ˆ , ์™ธ๋ถ€ ์ง€์›, ๋ฒ”์œ„ ์กฐ์ •

    • ์ •๊ธฐ ๋ฆฌ๋ทฐ: ์ฃผ๊ฐ„ ์ง„ํ–‰ ์ƒํ™ฉ ์ ๊ฒ€

  • ์ธ๋ ฅ/์žฅ๋น„ ๋ฆฌ์†Œ์Šค ํˆฌ์ž… ๊ณ„ํš์€?

6.3 ROI ๋ฐ ์„ฑ๊ณผ ์ธก์ •

  • ๋น„์ฆˆ๋‹ˆ์Šค ๊ฐ€์น˜ ์ธก์ • ์ง€ํ‘œ๋Š”? (์•„๋ž˜๋Š” ์˜ˆ์‹œ์ž…๋‹ˆ๋‹ค.)

    • ๋งค์ถœ ์ฆ๋Œ€: ์‹ ๊ทœ ๊ณ ๊ฐ ํš๋“, ๊ธฐ์กด ๊ณ ๊ฐ ๋งŒ์กฑ๋„ ์ฆ๊ฐ€

    • ๋น„์šฉ ์ ˆ๊ฐ: ์ธ๋ ฅ ๋น„์šฉ ์ ˆ๊ฐ, ํ”„๋กœ์„ธ์Šค ํšจ์œจํ™”

    • ํšจ์œจ์„ฑ ํ–ฅ์ƒ: ์ž‘์—… ์‹œ๊ฐ„ 50% ๋‹จ์ถ•, ์ •ํ™•๋„ 10% ๊ฐœ์„ 

    • ์‚ฌ์šฉ์ž ๋งŒ์กฑ๋„ 10% ์ฆ๊ฐ€

    • ์ •๋Ÿ‰์  ๋ชฉํ‘œ: ๋งค์ถœ 20% ์ฆ๊ฐ€, ๋น„์šฉ 30% ์ ˆ๊ฐ

    • ์ธก์ • ์ฃผ๊ธฐ: ์›”๊ฐ„ ๋ฆฌํฌํŠธ, ๋ถ„๊ธฐ๋ณ„ ์ข…ํ•ฉ ํ‰๊ฐ€

  • ์„ฑ๊ณต ๊ธฐ์ค€ ์ •์˜๋Š”? (์•„๋ž˜๋Š” ์˜ˆ์‹œ์ž…๋‹ˆ๋‹ค.)

    • ๊ธฐ์ˆ ์  ์„ฑ๊ณต: ๋ชฉํ‘œ ์„ฑ๋Šฅ ๋‹ฌ์„ฑ, ์•ˆ์ •์  ์šด์˜

    • ๋น„์ฆˆ๋‹ˆ์Šค ์„ฑ๊ณต: ROI 200% ์ด์ƒ, ์‚ฌ์šฉ์ž ๋งŒ์กฑ๋„ 4.5/5

    • ์žฅ๊ธฐ์  ๊ฐ€์น˜: ๊ฒฝ์Ÿ ์šฐ์œ„, ์‹œ์žฅ ์ ์œ ์œจ ํ™•๋Œ€

Last updated