데이터 부족
어떤 것을 하려든지 데이터가 필요합니다. 하지만 의료데이터의 X-ray 사진 같이 단순한 일반 검사가 많아 정상 이미지가 많고 아픈 환자의 데이터가 확연히 떨어질 것이라 생각이 듭니다.
이 모델은 빵형의 개발도상국 이라는 유튜버영상을 보고 알게 되었습니다.
이 모델 역시 찍먹을 하였기에 베이스라인에 따라 사용해봤습니다. VAE oulier detection을 사용하였습니다. Variational Auto-Encoder(VAE)는 일반 이미지를 학습하고 이와 비슷한 이미지를 기본 모델의 아이디어는 정상적인 사진만을 이용해서 비슷한 이미지를 생성하는 것을 학습하고 이제 정상적이지 못한 이미지는 제대로 생성하지 못해 입력과 생성한 이미지의 차이로 비정상이다 판단하는 것입니다.
위 이미지의 왼쪽은 원본이고 오른쪽은 재생성된 이미지입니다.
위 이미지의 오른쪽사진은 왼쪽과 중앙과 비교하여 오차를 표현한 것이라 보시면됩니다. 가지고있는 사진의 크기가 매우커서 줄이는 도중에 R이 안보일 수 있는데 사진의 오른쪽을 표시한 것 입니다.
그 글자도 이상치로 잡았는데 데이터를 전처리로 R 없애고 모델을 훈련시키고 테스트를 한다면 훨씬 괜찮은 이상치 찾는 모델이 완성될 것 같습니다. 일단 말 그대로 찍먹이기에 빠르게 테스트가 목적이기에 전처리를 따로 안해주고 가능성만 보았습니다. 이것으로 폐렴환자를 판단하는데 도움을 줄 수있지 않을까 하는 마음에 소개하였습니다.
코드보기
깃허브 레포에서 코드와 결과물을 확인 할 수 있습니다.