Ctrlk

MoE (Mixture-of-Experts)

MoE Overview MoE 모델 비교 및 주요 기법 정리 분산 훈련 기초 개념 전문가 병렬화 (Expert Parallelism)[Optional] NVSHMEM (NVIDIA Shared Memory)분산 훈련에서의 AWS 네트워킹: EFA (Elastic Fabric Adapter)AWS에서 MoE 모델을 효율적으로 훈련하기 분산 훈련 전략 ML 엔지니어와 인프라 엔지니어 간 분산 훈련 협업 가이드 및 체크리스트 추론 최적화 개요 (Prefill과 Decoding에 따른 주요 기법 정리)SageMaker Large Model Inference (LMI)를 활용한 모델 서빙 및 최적화 가이드

Previous[Use-case w/ Hands-on] 실제 데이터로부터 합성 QnA 생성하기 NextMoE Overview