컴퓨터공학 (2) 썸네일형 리스트형 Machine Learning: Data Bias (데이터 편향) 머신 러닝을 위한 데이터는 매우 중요합니다. Andrew Ng 교수님은 MLOps: From Model-centric to Data-centric AI 영상에서 파레토 법칙을 말하며 인공 지능 모델 성능의 80%는 데이터가 영향을 줄 수 있다고 말씀하셨습니다. 기계 학습 모델을 만들어야 한다면 먼저 모델에 사용되는 데이터를 이해할 필요가 있습니다. 이러한 데이터를 분석, 이해하는 과정을 통계학에서는, Exploratory Data Analysis (EDA)라고 합니다. 여기서는 데이터 bias(편향)에 대해서 알아보려고 합니다. Data Bias란 데이터 bias는 데이터가 전체를 표현하지 못하고 일부만을 표현하는 데서 비롯될 수 있습니다. 이미지에 있는 고양이를 인식하는 모델을 생각해 봅시다. 우리는 .. MLOps: Machine Learning + DevOps 최근에 보게된 Andrew Ng 교수님의 MLOps: From Model-centric to Data-centric AI talk에서 MLOps라는 단어를 보았습니다. 관련 업계에서 일하고 있으면 직감적으로 Machine Learning과 DevOps의 합성어임을 알수 있습니다. 딥러닝을 이용하여 신경망 모델을 학습하고 실제로 제품화하여 배포 해보신 분이라면 MLOps라는 단어는 생소하더라고 분명히 이 부분에 대해서 좋은 방법과 best practice를 찾아보려고 고민하셨을 거라고 생각합니다. 여기서는 MLOps라는 것이 무엇인지에 대해서 나름대로 정리를 해보았습니다. 인공지능 모델은 크게 4가지 단계로 만들어 집니다. 먼저, (1) 어떤 문제를 풀 것인지를 정의합니다. 그리고 문제를 풀기위한 (2) .. 이전 1 다음