[오피니언] 임상의사결정을 위한 기계학습 : 보이지 않는 것에 주의하세요!
기계학습을 통한 연구의 주장을 심도 있게 검토하지 않고 받아들여서는 안 됨.
◆ 데이터에 대한 비판
-전자의무기록(청구, 임상 기록 등)의 흔한 형태는 보건의료시스템과 접한 사람에 대해서만 정보를 보유하고 있음.
-병원에 방문하는 환자도 건강상태가 지속적으로 기록되지는 않음.
-흑인과 원주민 환자는 암 임상시험에 실제 인구집단보다 현저하게 적게 참여하고 있음.
◆ 측정기준(metrics)에 대한 비판
-하나의 평가측정기준은 성능의 복잡함을 포착할 수 없음.
-교차검증에서 다중 홀드아웃샘플에 기초하여 평가되지 않는 경우가 자주 있음.
-어떤 도구가 하위그룹에서 작동하는지도 평가하여야 함.
-알고리즘에서 편향은 보건의료연구에 거의 초점을 맞추지 않고 있음.
-기술이 평가하는 사항에 대해 누군가의 주관이 개입됨.
기계학습으로 건강을 개선하기 위한 우리의 노력(drive)에서 우리는 무엇을 놓쳤는지 찾아내는 것을 잊지 말아야 함.