종속되지 않는 요소 종속되는 요소 종속되는 요소: 표준 존재여부
클라우드밴더 MLOps PaaS x 클라우드의 MLOps 워크플로에 종속됨 표준 없음
서드파티 MLOps PaaS HW / OS / 컨테이너 런타임 서드파티 MLOps 워크플로에 종속됨 표준 없음
from scratch HW / OS / 컨테이너 런타임 / 워크플로 오픈소스에 종속됨 표준 없음

어떤 MLOps 솔루션을 사용하든 해당 솔루션에 종속될 수밖에 없다(from1). 예를 들어, AWS Sagemaker 을 사용하면 가상 머신 EC2뿐 아니라 AWS의 다양한 인프라들에 종속된다(참고1,참고2:마키나락스 허영신 이사님의 이야기).

대형 클라우드 밴더의 제품이 아니라 스타트업의 All-in-One MLOps PaaS 제품들을 사용해도 종속되는 것은 마찬가지이다. 이들 제품은 보통 HW, OS 등 인프라 호환성을 보장하기 때문에 모든 클라우드의 컴퓨팅 자원에 올려 사용할 수 있다는 장점(참고1)이 있지만 엔지니어 입장에서는 해당 PaaS에 종속된다는 점에서 크게 다르지 않다.

이러한 현상이 발생하는 이유는 컴퓨팅 자원(x86 CPU, aarch CPU, NVIDIA GPU), 운영체제(Unix)(from7), 컨테이너(OCI,CRI)(from6)에는 표준이 있지만 MLOps에는 표준이 없기 때문이다. 표준이 있다면 이식성(from5,6:웹브라우저,컨테이너의 사례)이 생기지만 모델 관리, 실험 관리, 피처 관리 등 MLOps 를 구성하는 다양한 요소들(from8,9,10)에는 표준이 없다.

표준의 존재 관점으로 볼 때 직접 구축을 한다고 하더라도 MLOps의 요소들을 구현하기 위해 다양한 오픈소스들을 끌어 사용하게 될 것이다. 하지만 이들도 표준이 없는 상태에서 만들어진 오픈 소스라는 점은 달라지지 않는다.

즉, 이러나저러나 어차피 MLOps 시스템의 이식성은 구리다. 솔루션들은 어느 부분까지 추상화(from2)해서 다룰 수 있는지의 차이만 있을 뿐이다. 비즈니스 요건을 만족시킬 수 있는 최소 하한을 올바르게 알고 어느 수준까지 종속될 것인지를 고르는 것이 중요하다. 비즈니스 요건을 모두 만족시킬 수 있는 도구들을 알고, 노력과 비용을 따져 보며 종속의 정도를 결정지을 필요가 있다(from3).


Databricks 와 같은 비클라우드벤더의 mlops 제품들과 클라우드 벤더들의 mlops 제품들에는 어떤 차이가 있을까?

sagemaker 비용이 비싸다고는 들었지만, 요금 명세를 읽어봐도 동일한 작업을 하는 경우에 비해 얼마나 비싼 것인지 감을 잡기가 어려웠습니다. 혹시 어떤 기준으로 비용을 어림해 보셨나요?


parse me : 언젠가 이 글에 쓰이면 좋을 것 같은 재료들.

  1. None

from : 과거의 어떤 생각이 이 생각을 만들었는가?

  1. 9_2. title: 추상이란 복잡도와 오해가능성 사이의 트레이드오프가 있는 도구이다.
  2. ba2.2.2. title: MLOps의 메인 목표는 이미 존재하는 솔루션들로 비즈니스 이익을 극대화할 수 있도록 돕는 것이다. MLOps를 수행함이란 클라우드가 덜 제공하는 기능을 다시 만들거나 잘 연결하는 일이 아니다.
  3. [bb7.1.1.2_1.2__2. title: 넷스케이프의 자바스크립트(JavaScript)와 마이크로소프트의 J스크립트(JScript) 차이를 줄이기 위해 에크마스크립트(ECMAScript (ES)) 라고 불리는 국제표준이 생겼다.](https://janghoo.notion.site/bb7-1-1-2_1-2__2-title-JavaScript-J-JScript-4abedc299997409490cbb052b3c1de0b)
  4. bc2_1.1_2. title: 컨테이너 기술은 표준을 위해 계층적으로 구성되어 있다. 도커도 마찬가지다. 도커 엔진은 표준을 지키는 도커 데몬(고수준 컨테이너 런타임)에게 일을 시키고, 도커 데몬은 표준을 지키는 도커 런타임(저수준 컨테이너 런타임)에게 일을 시킨다. 도커 런타임은 컨테이너를 실행한다.