[MlOps] Airflow 학습 DAG부터 Ray Serve 추론, Minikube까지

DevOps

[MlOps] Airflow 학습 DAG부터 Ray Serve 추론, Minikube까지

Sophie소피 2025. 10. 26. 18:38

학습 DAG 만들기

Airflow와 MLflow가 준비됐다면 이제 학습 Pipeline을 하나 만들어보겠습니다.
이 DAG은 Airflow가 실행하는 단일 Python Task로,
MLflow에 학습 Log를 남기고 임의의 정확도를 기록합니다.

~/hybrid-mlops-demo/airflow/dags/train_pipeline.py

cat > ~/hybrid-mlops-demo/airflow/dags/train_pipeline.py <<'PY'
from airflow import DAG
from airflow.operators.python import PythonOperator
from datetime import datetime
import mlflow, os, time, random

def train_model():
    mlflow.set_tracking_uri("http://host.docker.internal:5000")
    mlflow.set_experiment("hybrid-demo")
    with mlflow.start_run(run_name="mock-train"):
        time.sleep(1)
        acc = round(0.90 + random.random()*0.05, 4)
        mlflow.log_param("epochs", 3)
        mlflow.log_metric("accuracy", acc)
        mlflow.log_artifact(__file__)

with DAG(
    "train_pipeline",
    start_date=datetime(2025,1,1),
    schedule_interval=None,
    catchup=False,
    tags=["demo","mlflow"],
) as dag:
    PythonOperator(task_id="train", python_callable=train_model)
PY

실행 방법

Airflow Web UI 접속 http://localhost:8080 (ID/PW : airflow / airflow)

train_pipeline DAG 활성화 → Trigger 클릭

“클라우드 추론” 시뮬레이터 — Ray Serve

이번에는 추론 API Server를 흉내 내볼 차례입니다.
GPU가 없어도 동작되고 나중에 AWS EKS 나 Kubeflow 에 배포될 Ray Serve Model Server의 원형이 될 예정입니다.

cat > ~/hybrid-mlops-demo/ray_inference/serve_app.py <<'PY'
from ray import serve
from fastapi import FastAPI
import time

app = FastAPI()
serve.start(detached=True)

@serve.deployment(route_prefix="/inference")
@serve.ingress(app)
class InferenceService:
    def __init__(self):
        # 여기서 실제론 모델 로드. 데모에선 0.3초 지연으로 대체
        time.sleep(0.3)

    @app.post("/")
    def infer(self, payload: dict):
        time.sleep(0.5)  # 추론 지연 시뮬
        return {"prediction": "vehicle", "confidence": 0.973}

InferenceService.deploy()
PY

실행:

pip install --user "ray[serve]" fastapi uvicorn
python ~/hybrid-mlops-demo/ray_inference/serve_app.py
# 새 터미널에서 호출 테스트
curl -s -X POST http://127.0.0.1:8000/inference -H 'Content-Type: application/json' -d '{"image":"frame001.jpg"}' | jq .

실행 및 테스트

필요한 패키지 설치

pip install --user "ray[serve]" fastapi uvicorn

서버 실행

python ~/hybrid-mlops-demo/ray_inference/serve_app.py

새 터미널에서 테스트 요청

curl -s -X POST <http://127.0.0.1:8000/inference> \\
  -H 'Content-Type: application/json' \\
  -d '{"image":"frame001.jpg"}' | jq .

결과 예시

{
  "prediction": "vehicle",
  "confidence": 0.973
}

이 서버는 로컬에서도 GPU 없이 동작하며,

차후 EKS나 Ray Cluster에 올릴 때 바로 재사용할 예정입니다.

Minikube 유틸(Optional)

클러스터 시작/중지 스크립트

Local Kubernetes Cluster를 쉽게 켜고 끄기 위한 Script를 만듭니다,

~/hybrid-mlops-demo/infra/minikube/start_minikube.sh

cat > ~/hybrid-mlops-demo/infra/minikube/start_minikube.sh <<'SH'
#!/usr/bin/env bash
set -euo pipefail
minikube start --driver=docker --cpus=4 --memory=6144
kubectl get nodes
SH
chmod +x ~/hybrid-mlops-demo/infra/minikube/start_minikube.sh

사용법

~/hybrid-mlops-demo/infra/minikube/start_minikube.sh

정리 !

Airflow DAG	학습 Pipeline 실행	Airflow UI → Trigger
MLflow	학습 결과 Tracking	http://localhost:5000
Ray Serve	추론 API Simulation	python serve_app.py → curl 요청
Minikube	Local K8s Cluster	start_minikube.sh

다음 단계

이제 로컬에서 학습 → 추적 → 추론 의 전체 플로우가 완성되었습니다.
다음 편에서는 이 파이프라인을 Argo CD + EKS 환경으로 확장하여
클라우드 네이티브 MLOps로 전환하는 과정을 다뤄보겠습니다.

https://github.com/daeun-ops/hybrid-mlops-demo

저작자표시 비영리 변경금지 (새창열림)

'DevOps' 카테고리의 다른 글

[MLOps]Ray Serve GPU 자동 감지 + Dockerize + Compose (0)	2025.10.27
[MlOps]Observability 맛보기: FastAPI·Ray Log를 Local에서 살펴보기 (0)	2025.10.26
[MlOps] Local MLOps 실습 환경 구축 (Airflow + MLflow) (0)	2025.10.26
[MLOps] RunPod 사용하여 A-LLMRec 모델 훈련 및 Inference 테스트 + colab pro+ 비용 및 성능 분석 (2)	2024.11.26
[Helm] Helm Chart 생성하기 1편 (0)	2024.01.24

현재글[MlOps] Airflow 학습 DAG부터 Ray Serve 추론, Minikube까지

Dnt be a coder. be a problem solver!

IT, 소프트웨어엔지니어, 백엔드개발자, AWS, 일상, 글, 코딩, 프로그래밍, DevOps, kubernetes, 서이추, 개발일지, SQL, 백엔드, 개발, 자바, 쿠버네티스, 스타트업, 개발자, 데이터베이스,

Today :
Yesterday :

일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

로직에서 시작해서 로직으로 끝나는