Revista Conectividad
Julio diciembre 2023 ISSN:2806-5875
pp. 19-32 Correo: revista@ister.edu.ec
Volumen 4, Número 2
Revista Semestral del Instituto Tecnológico Universitario Rumiñahui 19
Aplicación de redes neuronales densas y convolucionales para detección de
COVID_19 en imágenes de rayos X
Application of dense and convolutional neural networks for COVID_19 detection in X-
ray images
Ronny Stalin Guevara Cruz
1
, Claudio Augusto Delrieux
2
1
Instituto de Ciencias e Ingeniería de la Computación, Universidad Nacional del Sur y Consejo Nacional de
Investigaciones Científicas y Tecnológicas (CONICET), r.s.guevara@hotmail.com
2
Instituto de Ciencias e Ingeniería de la Computación, Universidad Nacional del Sur y Consejo Nacional
de Investigaciones Científicas y Tecnológicas (CONICET), cad@uns.edu.ar
Autor para correspondencia: r.s.guevara@hotmail.com
Fecha de recepción: mayo 2023 Fecha de aceptación: junio 2023
RESUMEN
Las redes neuronales convolucionales (CNN) tienen gran potencial en resolver problemas de
clasificación con imágenes. La presente investigación tiene como objetivo presentar modelos
reducidos que permita identificar casos de neumonía y COVID-19 en imágenes de rayos X de
tórax(anterior-posterior), ofreciendo una amplia perspectiva del interés de herramientas que
brindan soporte y asistencia médica. La capacidad y tamaño de los modelos fueron reducidos hasta
obtener una opción perfecta para ser desplegados localmente en dispositivos con recursos
limitados. Los algoritmos propuestos se desarrollaron en Google Colab utilizando el lenguaje de
programación Python, aplicando redes neuronales densas y convolucionales a diferentes capas
hasta obtener un índice de error bajo, para posterior diagnosticar si el paciente presenta COVID-
19. Para ello, se utiliza un conjunto de 603 imágenes de alta resolución de bases de datos públicos
(ver en https://www.cell.com/cell/fulltext/S0092-8674(18)30154-5 y https://github.com/ieee8023/covid-
chestxray-dataset),.divididas en 403 imágenes para entrenamiento, 200 imágenes para prueba y 12
imágenes para validación. La herramienta diseñada con una red neuronal convolucional de 13 capas
propone la integración de aprendizaje de maquina (Machine Learning) como soporte en el proceso
de diagnóstico médico, con una precisión del 94.73% puede convertirse en una herramienta que
brinda mayor velocidad a la hora de dar un diagnóstico.
Palabras clave: COVID-19; neumonía; aprendizaje de máquina; inteligencia artificial; redes
neuronales convolucionales.
ABSTRACT
Convolutional neural networks (CNNs) have great potential in solving classification problems with
images. The present research aims to present reduced models that allow identifying cases of
pneumonia and COVID-19 in chest X-ray images (anterior-posterior), offering a broad perspective
of the interest of tools that provide medical support and assistance. The capacity and size of the
Revista Conectividad
Julio diciembre 2023 ISSN:2806-5875
pp. 19-32 Correo: revista@ister.edu.ec
Volumen 4, Número 2
Revista Semestral del Instituto Tecnológico Universitario Rumiñahui 20
models were reduced until obtaining a perfect option to be deployed locally in devices with limited
resources. The proposed algorithms were developed in Google Colab using the Python
programming language, applying dense and convolutional neural networks to different layers until
obtaining a low error rate, to later diagnose if the patient has COVID-19. To do this, a set of 603
high-resolution images from public databases (see in https://www.cell.com/cell/fulltext/S0092-
8674(18)30154-5 and https://github.com/ieee8023/covid-chestxray-dataset) is used, divided into 403
images for training, 200 images for testing and 12 images for validation. The tool designed with a
convolutional neural network of 13 layers proposes the integration of machine learning (Machine
Learning) as a support in the medical diagnosis process, with an accuracy of 94.73% can become
a tool that provides greater speed when giving a diagnosis.
Key words: COVID-19; pneumonia; machine learning; artificial intelligence; convolutional neural
networks
INTRODUCCIÓN
El COVID-19 es una enfermedad infecciosa causada por el síndrome respiratorio agudo severo
Coronavirus 2 (SARS-CoV-2), su forma es redonda u ovalada y a menudo polimórfica, con un
diámetro de 60 a 140 nm, una enfermedad desconocida que fue descubierta por primera vez en la
ciudad de Wuhan, provincia de Hubei, China a finales de 2019 (Pérez Abreu, Gómez Tejeda, &
Dieguez Gauch, 2022). Presenta síntomas similares a los de la gripe, entre los que se incluyen
fiebre, tos, disnea, mialgia y fatiga, además, causa daños intersticiales pulmonares y,
posteriormente, cambios parenquimatosos; en casos más graves se caracteriza por producir
neumonía, por esta razón, inicialmente muchos casos de COVID-19 fueron diagnosticados como
neumonía (Ye, Zhang, Wang, Huang, & Song, 2020).
La rápida expansión de la enfermedad hizo que la Organización Mundial de la Salud, el 30 de enero
de 2020, la declara una emergencia sanitaria de preocupación internacional, basándose en el
impacto que el virus podría tener en países subdesarrollados con menos infraestructuras sanitarias
y elevó el riesgo de COVID-19 a un nivel muy alto en todo el mundo el 28 de febrero de 2020
(OMS, 2020).
A pesar de los constantes esfuerzos tanto gubernamentales como sociales, al presente se reportan
765 903 278 casos confirmados, 6 927 378 muertes a causa del COVID-19 (OMS, 2023).
En la actualidad, el desarrollo tecnológico permite crear aplicativos capaces de diagnosticar
enfermedades rápida y verazmente. Una tecnología de gran utilidad en el desarrollo de sistemas
Revista Conectividad
Julio diciembre 2023 ISSN:2806-5875
pp. 19-32 Correo: revista@ister.edu.ec
Volumen 4, Número 2
Revista Semestral del Instituto Tecnológico Universitario Rumiñahui 21
inteligentes son las redes neuronales, puntualmente las redes perceptrón multicapa y redes
neuronales convolucionales (MLP & CNNs, por sus siglas en ingles). La MLP es un algoritmo de
aprendizaje supervisado, donde una gran cantidad de perceptrones se agrupan en capas y solo
existen conexiones directas entre ellos, esto proporciona al algoritmo potentes ventajas como el
mapeo no lineal y la tolerancia al ruido (Gómez Macedo, 2022). Mientras que, las CNNs son redes
de neuronas que han demostrado su eficiencia en tareas de segmentación y clasificación de
imágenes, su función es imitar las neuronas de la corteza visual primaria del cerebro humano
(Losada Gutiérrez & Fuentes Jiménez, 2019).
Las arquitecturas de los modelos CNNs y MLPs son capaces de aprender a detectar patrones
simples o complejos, en tareas de clasificación de imágenes están compuestas por dos secciones
(Lopez Betancur, Bosco Duran, Guerrero Mendez, Zambrano Rodríguez, & Saucedo Anaya,
2021). Específicamente, las CNNs han demostrado ser eficientes en clasificación y detección de
afecciones dicas como cáncer de piel (Combalia & Vilaplana, 2019), artritis reumatoide
(Serrano Muñoz, Viera López, & Betancourt Hernández, 2018), retinopatía diabética (Catalán, De
la Cruz Gámez, Montero Valverde, & Hernández) y en otros casos, de personas en imágenes de
profundidad (Losada Gutiérrez & Fuentes Jiménez, 2019). Diversas investigaciones han
incursionado en la clasificación de imágenes radiológicas de pecho con COVID-19 (Gómez
Macedo, 2022), (Cabanilla del Estal & Martín Martín, 2021) & (Belman Lopez, 2022), sin
embargo, carecen de interacción con el usuario generando nuevas posibilidades y desafíos.
En base al análisis realizado, se propone el desarrollo de un aplicativo basada en técnicas Deep
Learning aplicando redes neuronales convolucionales con arquitectura ResNet-18 y MLPs-12 para
detección de COVID-19, con el objetivo de convertirse en una herramienta que brinde soporte en
el diagnóstico médico.
MATERIALES Y MÉTODOS
En la Fig. 1. se muestra la arquitectura del modelo para detección de COVID-19 en imágenes de
rayos X, compuesto de una entrada, dos módulos y una salida; el módulo de pre-procesamiento de
las imágenes, es el encargo de preparar cada imagen y encapsularla en una tupla para enviarlo al
segundo módulo denominado experimentación, encargado de recibir las imágenes, dividirlas en
Revista Conectividad
Julio diciembre 2023 ISSN:2806-5875
pp. 19-32 Correo: revista@ister.edu.ec
Volumen 4, Número 2
Revista Semestral del Instituto Tecnológico Universitario Rumiñahui 22
datos para entrenamiento y prueba, ajustar el número de capas y épocas hasta obtener un modelo
óptimo tanto en características computacionales como en resultados de predicción.
Fig. 1. Arquitectura del modelo
Filtrado
Escalamiento
Reajuste
Etiquetado
Normal
Neumonía
Covid-19
Dataset
Experimentation and automated
hyperparameter optimization
Classification
Diseño del módulo de preprocesamiento
El módulo de pre-procesamiento se encarga de preparar cada imagen y enviarlos al clasificador.
Como se muestra en la Fig. 1., su diseño está compuesto de cuatro etapas.
La función image_processing encapsula las tres primeras etapas del preprocesamiento de las
imágenes. La selección del modelo de color a trabajar con la imagen es fundamental para evitar
comportamientos no deseados o retraso en la lectura de la data set. Para tal fin, se elige utilizar la
librería de visión artificial y código abierto OpenCV, el comando cv2.cvtColor para transformar
del espacio RGB a escala de grises, debido a la irregularidad en el tamaño de las imágenes se aplica
cv2.resize para reajustar la resolución de las imágenes a 600 * 600 pixeles, astype de la librería
pandas para cambiar el tipo de dato de la imagen y normalizar en el rango de 0 a 255, finalmente,
retornar la información en una tupla.
La etapa de etiquetado crea arreglos de 3 etiquetas, permite al modelo estadístico asociar patrones
e imágenes con la etiqueta correcta. Estas corresponden 0 para casos normales, 1 para casos con
neumonía y 2 para casos con COVID-19.
Fig. 2. Imagen de rayos X aleatoria resultante del pre-procesamiento
Revista Conectividad
Julio diciembre 2023 ISSN:2806-5875
pp. 19-32 Correo: revista@ister.edu.ec
Volumen 4, Número 2
Revista Semestral del Instituto Tecnológico Universitario Rumiñahui 23
Diseño del módulo clasificación
El módulo de clasificación recibe y entrena al clasificador sirviendo de interfaz con el usuario, a
fin de, visualizar los resultados obtenidos. Como se muestra en la Fig. 1., su diseño está compuesto
de 2 etapas y un submódulo de retroalimentación.
En este trabajo se propone el uso y adaptación de una MLP con 12 capas y una ResNet a 18 capas.
La etapa MLP (multi layer perceptron) utiliza una red neuronal unidireccional constituida por tres
o más capas: una capa de entrada, una capa de salida y capas intermedias o capas ocultas (Quiñones
Huatangari, Ochoa Toledo, & Gamarra Torres, 2020). Para el desarrollo de la investigación se
consideran inicialmente como hiperparámetros:
Tabla 1. Hiperparámetros para la red MLP de 4 capas
Parámetros /
Hiperparámetros
Valor
Activación
Capas de entrada
1
Capas densas
4
Relu
Capas de salida
1
Softmax
Épocas
30
Optimizador
ADAM
Tasa de aprendizaje
0.001
Batch size
13
Con la finalidad de mejor el clasificador se aumenta el número de capas Dense con arquitectura
encoders y las épocas de entrenamiento de la red, obteniendo:
Tabla 2. Hiperparámetros para la red MLP de 12 capas
Parámetros /
Hiperparámetros
Valor
Activación
Capas de entrada
1
Revista Conectividad
Julio diciembre 2023 ISSN:2806-5875
pp. 19-32 Correo: revista@ister.edu.ec
Volumen 4, Número 2
Revista Semestral del Instituto Tecnológico Universitario Rumiñahui 24
Capas densas
12
Relu
Capas de salida
1
Softmax
Épocas
30
Optimizador
ADAM
Tasa de aprendizaje
0.001
Batch size
13
La etapa CNN (convolutional neural networks) utiliza la operación de convolución como base para
el procesamiento de datos. Dentro de esta red, existen matrices llamadas filtros y cada una de ellas
detecta, a su vez, distintos tipos de características dentro de los datos que se quieren procesar. En
imágenes estos filtros son capaces de detectar bordes, moviéndose según un parámetro que mide
la longitud del salto (stride) (Bueno, 2019). Para el desarrollo de la investigación se consideran
como hiperparámetros:
Tabla 3. Hiperparámetros para la red CCN de 18 capas
Parámetros /
Hiperparámetros
Valor
Activación
Capas de entrada
1
Capas de convolución
8
Relu
Capas densas
8
Relu
Capas de activación
1
Dropout
Capas de salida
1
Softmax
Épocas
75
Optimizador
ADAM
Tasa de aprendizaje
0.001
Batch size
13
El submódulo de retroalimentación permite ajustar los clasificadores hasta obtener un modelo
óptimo tanto en características computacionales como en resultados de predicción, mediante el
análisis de las métricas de desempeño y la magnitud de perdida en razón del número de épocas de
entrenamiento.
RESULTADOS Y DISCUSIÓN
Ajuste del clasificador MLP
Para alcanzar el objetivo funcional del aplicativo se realizaron pruebas en el ajuste de capas y
épocas. El procedimiento inicia con 4 capas densas y 30 épocas de entrenamiento para verificar las