제목: Expert-level sleep scoring with deep neural networks
저자: Siddharth Biswal, Haoqi Sun, Balaji Goparaju, M Brandon Westover, Jimeng Sun, and Matt T Bianchi
링크: https://academic.oup.com/jamia/article/25/12/1643/5185596?login=true
소속: School of Computational Science and Engineering, Georgia Institute of Technology
인용: 245(2024.04.09 기준)
출판: Journal of the American Medical Informatics Association 2018 (IF 4.5)
Main Figure
- 이 논문에서 주장하는 가장 큰 장점? 특징은, 한번의 검사로, 다양한 4가지의 검사를 동시에 + 빠르게 수행할 수 있다는 점이다. Sleep staging을 시작으로 Apnea detection, AHI categorization, Limb movement detection을 하나의 모델 구조를 바탕으로 수행할 수 있다. 이 모델은 RCNN을 사용하였으며, CNN과 RNN을 결합한 구조라고 논문에서 언급한다.
또한 이 4가지의 테스크에 대해 모두 Human expert와 비슷한 성능을 보였다.
- 이 그림은 전체적인 구조를 Supplementary에 요약해둔 그림이다. 각 task별로 수행하는 Channel이 정해져 있으며, Spectgrogram으로 변환 후 사용한다는 것이 특징이다.
++ 데이터의 다양성과 규모: 또한 이 논문에서 사용된 데이터는 임상 및 연구용 PSG 데이터 모두를 포함하며, 이는 모델의 일반화 능력과 다양한 환경에서의 적용 가능성을 시사
++ 효율성과 접근성 향상: 자동화된 이러한 접근 방식은 수면 진단과 평가의 효율성을 개선하고, 수면 장애의 조기 발견과 관리에 기여할 수 있습니다. 뿐만 아니라 수면 전문가의 부족한 자원을 보다 효율적으로 활용할 수 있다.
Objectives
Scoring laboratory polysomnography (PSG) data remains a manual task of visually annotating 3 primary categories: sleep stages, sleep disordered breathing, and limb movements. Attempts to automate this process have been hampered by the complexity of PSG signals and physiological heterogeneity between patients. Deep neural networks, which have recently achieved expert-level performance for other complex medical tasks, are ideally suited to PSG scoring, given sufficient training data.
Methods
We used a combination of deep recurrent and convolutional neural networks (RCNN) for supervised learning of clinical labels designating sleep stages, sleep apnea events, and limb movements. The data for testing and training were derived from 10 000 clinical PSGs and 5804 research PSGs.
Results
When trained on the clinical dataset, the RCNN reproduces PSG diagnostic scoring for sleep staging, sleep apnea, and limb movements with accuracies of 87.6%, 88.2% and 84.7% on held-out test data, a level of performance comparable to human experts. The RCNN model performs equally well when tested on the independent research PSG database. Only small reductions in accuracy were noted when training on limited channels to mimic at-home monitoring devices: frontal leads only for sleep staging, and thoracic belt signals only for the apnea-hypopnea index.
Conclusions
By creating accurate deep learning models for sleep scoring, our work opens the path toward broader and more timely access to sleep diagnostics. Accurate scoring automation can improve the utility and efficiency of in-lab and at-home approaches to sleep diagnostics, potentially extending the reach of sleep expertise beyond specialty clinics.
그 외
1. Dataset
2. Key outcome