MMOCR은 OCR 어노테이션 표준 양식을 제시한다(참고1). OCRDataset 클래스는 MMOCR 표준 어노테이션 포맷으로 작성된 파일을 파이썬 변수에 담을 수 있는 객체 모델(from2)이다(to2:활용예).


parse me : 언젠가 이 글에 쓰이면 좋을 것 같은 재료들.

  1. None

from : 과거의 어떤 생각이 이 생각을 만들었는가?

  1. [bb7.4. [entry] title: 객체 모델(Object model): 어떤 개념을 어떤 객체로 찍어낼지 정의하는 뼈대](https://janghoo.notion.site/bb7-4-entry-title-a700bbc2a622476fbda6989bbdeab29a)

supplementary : 어떤 새로운 생각이 이 문서에 작성된 생각을 뒷받침하는가?

  1. bc3__1_1.1. title: 상속을 이용해서 정의한 객체 모델 OCRDataset 은 커스텀 OCR 데이터셋의 베이스 클래스이다. CocoDataset 과 동일한 추상화 레이어가 아니다.

opposite : 어떤 새로운 생각이 이 문서에 작성된 생각과 대조되는가?

  1. None

to : 이 문서에 작성된 생각이 어떤 생각으로 발전되고 이어지는가?

  1. [ba2.4_1.1.1.1. title: 어떤 목적으로 사용될지 어떤 형태로 다시 가공되어야 할지 잘 모르는 채 일단 데이터를 적재만 해 두었다가 연구라는 목적이 명확히 세워지고 나서, 연구에 편한 OCRDataset 형태로 원시데이터를 가공하는 방법을 제시한 MMOCR의 사례는 일종의 ELT([[[SW Environment](https://janghoo.notion.site/Environment-d73d08b95a824b3f957eb0134f8ced1f) MLOps](https://janghoo.notion.site/MLOps-1be9e881d5444f268fde8c1ea7e00f59) Extract, Load, Transform (ELT)](https://janghoo.notion.site/Extract-Load-Transform-ELT-ac69bfc53bdc4fb0949aea6d805be80c)) 라고 해석할 수 있다](https://janghoo.notion.site/ba2-4_1-1-1-1-title--481e093232d44a32acd45a21e7d0e6c5)
  2. bc3__3. [info] title: MMOCR 에서 제공하는 detection 모델을 커스텀 데이터로 학습하기

참고 : 레퍼런스