TFX는 머신러닝 프로젝트를 진행하며 작성되는 소스코드들을 재활용 가능한 형태로 적절히 추상화하는 방법의 표준(ref1)을 제시한다. 예를 들어, “이만~큼의 과정을 묶으면 ‘모델 검증’ 이라고 볼 수 있겠군” 이라고 생각하는 것이다. 그리고 ‘모델 검증’ 이라는 요소에 항상 사용되어야 하는 입력과 출력이 무엇일지 고민하고 정형화하는 것이라고 볼 수 있다.


parse me : 언젠가 이 글에 쓰이면 좋을 것 같은 재료들.

  1. 50p, 컴포넌트의 입력 및 출력을 아티팩트라고 한다. 원시 입력 데이터, 전처리된 데이터, 학습된 모델이 아티팩트의 일종이다. … 컴포넌트들은 직접 아티팩트를 주고받는 대신 파이프라인에서 만들어지는 아티팩트에 대한 참조를 주고받는다.

from : 과거의 어떤 생각이 이 생각을 만들었는가?

  1. ba2.3. title: 머신러닝 프로젝트에는 코드를 둘러싸고 일어나는 일들이 있다. 예를 들어, 모델링, 데이터 전처리와 버전 관리, 코드 디버깅, 클라우드 프로비저닝, 결과 확인, 모델 배포, 모니터링, 그리고 이들을 지속적으로 반복하는 일이 이에 속한다.
  2. [bb7.1.1.2_1.2__2. title: 넷스케이프의 자바스크립트(JavaScript)와 마이크로소프트의 J스크립트(JScript) 차이를 줄이기 위해 에크마스크립트(ECMAScript (ES)) 라고 불리는 국제표준이 생겼다.](https://janghoo.notion.site/bb7-1-1-2_1-2__2-title-JavaScript-J-JScript-4abedc299997409490cbb052b3c1de0b)

supplementary : 어떤 새로운 생각이 이 문서에 작성된 생각을 뒷받침하는가?

  1. ba2.3_1.1. title: TFX는 표준화된 다양한 단계들이 어떻게 일관된 형태로 상호작용할 수 있는지를 고민하고 메타데이터스토어, 아티팩트, 컴포넌트라는 이름으로 표준화했다.

opposite : 어떤 새로운 생각이 이 문서에 작성된 생각과 대조되는가?

  1. None

to : 이 문서에 작성된 생각이 어떤 생각으로 발전되고 이어지는가?

  1. ba2.3_2. title: 파이토치 라이트닝은 머신러닝 코드를 추상화하는 방법을 제시한다는 점에서 TFX와 유사하다. 하지만 그 제안 범위는 연구이기 때문에 TFX에 비해 좁다. 라이트닝 모듈, 트레이너라는 이름으로 표준화했다.

ref : 레퍼런스

  1. 108p, TFT를 이용해 데이터 전처리를 표준화해야 하는 이유는 다음과 같습니다. (1) 전체 데이터셋의 콘텍스트에서 데이터를 효율적으로 처리합니다. (2) 전처리 단계를 효과적으로 확장합니다. (3) 잠재적인 학습-서빙 왜곡을 방지합니다.