Acompáñenme a revisar este estudio, publicado en línea hace unos días en Radiology Artificial Intelligence, por un grupo de radiólogos del Department of Radiology and Radiological Science, Johns Hopkins University School of Medicine, y cuyo objetivo fue evaluar la generalización de los algoritmos publicados de aprendizaje profundo (DL) para el diagnóstico radiológico. En esta revisión sistemática, se buscó en la base de datos PubMed estudios revisados por pares de algoritmos de DL para diagnóstico radiológico basado en imágenes que incluyeron validación externa, publicados desde el 1 de enero de 2015 hasta el 1 de abril de 2021. Esta revisión sistemática encontró que la gran mayoría de los estudios (81%) con validación externa demostraron una disminución del rendimiento del algoritmo en un conjunto de datos externo, y 24% informaron una disminución sustancial del rendimiento. Estos hallazgos enfatizan la importancia de incluir un conjunto de datos externo para evaluar la generalización de los algoritmos de DL, lo que mejoraría la calidad de los futuros estudios.
Acompáñenme a revisar este estudio, publicado en línea hace unos días en Radiology Artificial Intelligence, por un grupo de radiólogos del Department of Radiology and Radiological Science, Johns Hopkins University School of Medicine, y cuyo objetivo fue evaluar la generalización de los algoritmos publicados de aprendizaje profundo (DL) para el diagnóstico radiológico. En esta revisión sistemática, se buscó en la base de datos PubMed estudios revisados por pares de algoritmos de DL para diagnóstico radiológico basado en imágenes que incluyeron validación externa, publicados desde el 1 de enero de 2015 hasta el 1 de abril de 2021. Esta revisión sistemática encontró que la gran mayoría de los estudios (81%) con validación externa demostraron una disminución del rendimiento del algoritmo en un conjunto de datos externo, y 24% informaron una disminución sustancial del rendimiento. Estos hallazgos enfatizan la importancia de incluir un conjunto de datos externo para evaluar la generalización de los algoritmos de DL, lo que mejoraría la calidad de los futuros estudios.