Entrenamiento y Validación de un Modelo de Detección Ecográfica Prenatal de Cardiopatías Congénitas Estructurales Basado en el Uso de un Algoritmo de Aprendizaje Automático Profundo en Gestantes Derivadas al Centro de Referencia Perinatal Oriente (CERPO)

Dra. Karen Rumante · Dr. Max Monckeberg

Programa de Especialidad en Medicina Materno Fetal

Facultad de Medicina — Universidad de Chile

en colaboracion con EMERCOM SpA (desarrollo técnico e IA)

Mayo 2025

Las cardiopatías congénitas (CC) representan una de las anomalías estructurales mas frecuentes en el periodo prenatal. Hasta el 90% de los casos se presentan en fetos de bajo riesgo, lo que convierte al cribado ecográfico prenatal en una herramienta fundamental para su detección temprana. Sin embargo, la tasa de detección prenatal es variable, oscilando entre un 4.5% y un 50% según las series publicadas, condicionada por factores como la experiencia del operador y la calidad del equipo.

El presente proyecto propone el entrenamiento y validación de un modelo de aprendizaje automático profundo basado en redes neuronales convolucionales (CNN), utilizando imágenes ecográficas de los cinco planos cardíacos de Yagel obtenidos durante el screening cardíaco fetal de rutina en gestantes entre las 18 y 32 semanas de edad gestacional derivadas al CERPO, con el objetivo de alcanzar un rendimiento diagnóstico comparable al de un operador experto en la detección de cardiopatías congénitas estructurales.

Contexto y Fundamentos

Las cardiopatías congénitas (CC) representan las anomalías estructurales mas frecuentes detectables durante el periodo prenatal. Constituyen una causa significativa de morbimortalidad neonatal, y su detección temprana permite una planificacion adecuada del parto y tratamiento postnatal inmediato.

0%
Casos en bajo riesgo
De las CC se presentan en fetos sin factores de riesgo conocidos
0.0%
Tasa mínima de detección
En las series con menor rendimiento diagnóstico
0%
Tasa máxima de detección
En centros especializados con operadores expertos

Hasta el 90% de las cardiopatías congénitas se presentan en fetos de bajo riesgo[1], lo que hace del cribado prenatal una herramienta fundamental. Sin embargo, la tasa de detección prenatal es notablemente variable, oscilando entre un 4.5% y un 50%[2], condicionada por factores como la experiencia del operador[3], la calidad del equipo ecográfico, y las condiciones de la paciente durante el examen.

Está variabilidad en la detección plantea un desafío crítico: ¿como mejorar las tasas de detección de manera consistente, independientemente de la experiencia del operador? La propuesta de este proyecto es explorar el uso de modelos de inteligencia artificial basados en redes neuronales convolucionales profundas como herramienta de apoyo diagnóstico.

Pregunta de Investigación

En mujeres embarazadas que cursan embarazos unicos y en quienes se realiza una ecografía de screening de cardiopatías congénitas de rutina entre las 18 y 31+6 semanas de edad gestacional, utilizando imágenes de los 5 planos de Yagel: ¿puede un modelo de aprendizaje automático basado en algoritmos de redes neuronales convolucionales, entrenado con imágenes ecográficas de los cinco planos cardíacos de Yagel, alcanzar un rendimiento diagnóstico comparable al de un operador experto en la detección de cardiopatías congénitas estructurales?

Objetivo General

Entrenar y validar un modelo de aprendizaje automático profundo para la detección de anomalías cardíacas estructurales, utilizando imágenes ultrasonográficas de los 5 planos de Yagel, obtenidos durante el screening cardíaco fetal realizado en gestantes entre las 18 y 32 semanas de edad gestacional derivadas a CERPO, y comparar el rendimiento diagnóstico del modelo desarrollado contra un gold estándar ecocardiográfico fetal.

Objetivos Específicos

El Trabajo Médico en CERPO

Centro de Referencia Perinatal Oriente

El Centro de Referencia Perinatal Oriente (CERPO) es un centro especializado del sistema de salud público chileno, dependiente del Servicio de Salud Metropolitano Oriente, dedicado a la evaluación y seguimiento de embarazos de alto riesgo. CERPO recibe derivaciones de múltiples centros de atención primaria y hospitales del área oriente de Santiago, constituyendo un punto crítico en la cadena de detección prenatal de anomalías congénitas.

El Screening Cardíaco Fetal

El screening cardíaco fetal se realiza mediante ecografía entre las 18 y 32 semanas de edad gestacional. Siguiendo las guias de la ISUOG[5], el examen sistemático del corazón fetal se basa en la obtención de cinco cortes axiales secuenciales propuestos por Yagel et al.[4]

Los 5 Planos Cardíacos de Yagel

Propuestos por Yagel et al. (2001) como método sistemático para la evaluación cardíaca fetal completa mediante cinco cortes axiales secuenciales.

1
Abdomen Superior / Situs

Corte transversal del abdomen fetal superior que permite evaluar la posición del estómago, aorta descendente y vena cava inferior para determinar el situs visceral.

Imagen ecográfica — pendiente aprobacion comité de ética
2
4 Cámaras

Vista axial del corazón fetal que muestra ambas aurículas y ventrículos. Es el plano mas importante del screening cardíaco y permite evaluar 14 puntos anatómicos clave.

Imagen ecográfica — pendiente aprobacion comité de ética
3
Tracto de Salida del Ventrículo Izquierdo (LVOT)

Muestra la continuidad entre el septum interventricular y la raíz aórtica, permitiendo evaluar la salida del ventrículo izquierdo.

Imagen ecográfica — pendiente aprobacion comité de ética
4
Tracto de Salida del Ventrículo Derecho (RVOT)

Visualiza la arteria pulmonar emergiendo del ventrículo derecho y su cruce normal con la aorta.

Imagen ecográfica — pendiente aprobacion comité de ética
5
3 Vasos y Tráquea

Corte transversal superior que muestra la arteria pulmonar, aorta y vena cava superior en relación con la tráquea. Permite evaluar el tamaño relativo y la disposición espacial de los grandes vasos.

Imagen ecográfica — pendiente aprobacion comité de ética

Checklist de Evaluación — Vista de 4 Cámaras

La vista de 4 cámaras es el plano mas importante del screening cardíaco fetal. Se evalúan sistemáticamente 14 puntos anatómicos:

01.Área cardíaca
02.Derrame pleural
03.Ángulo cardíaco
04.Posición cardíaca
05.Proporción cámaras
06.Foramen ovale
07.Septum interventricular
08.Venas pulmonares
09.Tamaño ventricular
10.Hipertrofia de paredes
11.Banda moderadora
12.Cruz cardíaca
13.Insercion valvular
14.Evaluación global

Reclutamiento de Pacientes

El estudio contempla el reclutamiento prospectivo de gestantes que cumplen los criterios de inclusión, organizadas en dos cohortes independientes:

Cohorte 1 — Entrenamiento y Validación Interna
  • 70% de los datos para entrenamiento del modelo
  • 30% para validación interna
  • Partición aleatoria estratificada
Cohorte 2 — Validación Externa
  • Cohorte independiente para validación
  • Comparacion contra gold estándar ecocardiográfico
  • Evaluación de rendimiento diagnóstico real

El proceso de reclutamiento incluye la aplicación de criterios de inclusión y exclusión, la obtención de consentimiento informado, y la administración de una encuesta pre-especificada digital. Cada participante es evaluada con una ecografía cardíaca básica de screening y, adicionalmente, con una evaluación ecocardiográfica fetal avanzada que constituye el gold estándar diagnóstico.

Seguimiento Postnatal

Se realiza seguimiento postnatal de cada participante mediante revision de fichas clínicas y contacto telefónico, con el objetivo de confirmar o descartar los hallazgos prenatales y establecer el diagnóstico definitivo.

Proceso de Etiquetado de Imágenes

Cada imagen ecográfica se evalúa en CVAT (Computer Vision Annotation Tool) mediante un sistema jerárquico de 3 niveles diseñado por el equipo médico de CERPO, con un total de 39 puntos de evaluación distribuidos en los 5 planos de Yagel.

Sistema de Etiquetado — 3 Niveles

PRIMARIO

Identificación del plano de Yagel en cada imagen. Incluye la opción de marcar que el corte no fue obtenido.

01. SA02. C4C03. TSVI04. TSVD05. 3VTNo encontrado
SECUNDARIO

Evaluación de cada estructura anatómica por plano. Cada checkpoint se clasifica en 3 estados:

NormalAnormalNo Evaluable
TERCIARIO

Clasificación final: Normal o Anormal con diagnóstico específico usando el sistema de codificacion CRP (73 códigos).

Clasificación de Cardiopatías — Sistema CRP

El diagnóstico terciario utiliza un sistema propio de 73 códigos organizados en 9 categorías. Formato: CRP[categoría].[subcategoria].[específico]

CRP1Anomalía de 4 cámaras
1.1Miocardiopatía:
1.1.1 Hipertrófica (HCM)1.1.2 Dilatada (DCM)1.1.3 No Compactada (LVNC)1.1.4 Otro
1.2Fibroelastosis:
1.2.0 Fibroelastosis (EFE)
1.3Asimetrías de 4 cámaras:
1.3.1 Auricular1.3.2 Ventricular1.3.3 Otro
1.4Hipoplasia VI:
1.4.0 HLHS
1.5Hipoplasia VD:
1.5.0 HRHS
1.6Ventrículo unico:
1.6.0 Ventrículo unico
1.7Aneurisma/divertículo:
1.7.0 Aneurisma o divertículo cardíaco
1.8Tumores:
1.8.1 Rabdomioma1.8.2 Teratoma1.8.3 Fibroma1.8.4 Hemangioma1.8.5 Mixoma1.8.6 Otro
1.9Derrame pericárdico:
1.9.0 Derrame pericárdico
1.10Otro:
1.10.0 Otro
CRP2Malformaciones conotruncales
2.1Tetralogía de Fallot:
2.1.0 TOF
2.2Doble Salida VD:
2.2.0 DSVD / DORV
2.3TGA:
2.3.0 D-TGA
2.4TGA corregida:
2.4.0 L-TGA / C-TGA
2.5Tronco arterioso:
2.5.0 PTA
2.6Otro:
2.6.0 Otro
CRP3Valvulares
3.1V. aórtica:
3.1.1 Estenosis aórtica (AS)3.1.2 Otro
3.2V. pulmonar:
3.2.1 Atresia pulmonar (PA)3.2.2 Estenosis pulmonar (PS)3.2.3 Otro
3.3V. tricúspide:
3.3.1 Atresia tricuspídea (TA)3.3.2 Displasia / IT3.3.3 Anomalía de Ebstein3.3.4 Otro
3.4V. mitral:
3.4.1 Atresia mitral (MA)3.4.2 Estenosis mitral (MS)3.4.3 Otro
3.5Otro:
3.5.0 Otro
CRP4Defectos septales
4.1CIV:
4.1.1 Membranosa4.1.2 Muscular4.1.3 Otro
4.2CIA:
4.2.1 Tipo OP (primum)4.2.2 Tipo OS (secundum)4.2.3 Otro
4.3Canal AV:
4.3.1 Completo (CAVC)4.3.2 Parcial (CAVP)4.3.3 Otro
4.4FO aneurismático:
4.4.0 Foramen oval aneurismático
4.5Otro:
4.5.0 Otro
CRP5Anomalías del Arco Aórtico
5.1Coartación:
5.1.0 Coartación aórtica (CoA)
5.2Interrupción:
5.2.0 Interrupción arco aórtico (IAA)
5.3Hipoplasia:
5.3.0 Hipoplasia arco aórtico
5.4Doble arco:
5.4.0 Doble arco aórtico
5.5Arco derecho:
5.5.0 Arco aórtico derecho
5.6Otro:
5.6.0 Otro
CRP6Anomalías de situs / posición cardíaca
6.1Heterotaxias:
6.1.0 Heterotaxias
6.2Dextrocardia:
6.2.0 Dextrocardia
6.3Dextroposición:
6.3.0 Dextroposición
6.4Ectopia cordis:
6.4.0 Ectopia cordis
6.5Otro:
6.5.0 Otro
CRP7Anomalías del drenaje venoso
7.1Pulmonar:
7.1.1 DVPAT (total)7.1.2 DVPAP (parcial)7.1.3 Otro
7.2Sistémico:
7.2.1 Shunt portosistémico (CPSS)7.2.2 VCSI persistente (PLSVC)7.2.3 VCI interrumpida
7.3Otro:
7.3.0 Otro
CRP8Arritmias
8.1Taquiarritmias:
8.1.0 Taquiarritmias
8.2Bradiarritmias:
8.2.0 Bradiarritmias
8.3Extrasístoles:
8.3.0 Extrasístoles
8.4Otro:
8.4.0 Otro
CRP9Otro
9.0Otro:
9.0.0 No clasificable

Checklist Anatómico por Plano (Nivel Secundario)

Cada estructura se evalúa como Normal, Anormal o No Evaluable.

01. Corte Situs Abdominal5 items
#EstructuraNANE
1.Circunferencia Abdominal
2.Estómago a izquierda
3.Aorta posterior y a la izquierda de la columna
4.VCI anterior y a la derecha de la columna
5.Segmento corto de la Vena Umbilical
02. Corte 4 Cámaras15 items
#EstructuraNANE
1.Área Cardíaca
2.Posición cardíaca en hemitorax izquierdo
3.Ángulo cardíaco 45° +/-20
4.4 cámaras presentes
5.2 atrios de similar tamaño
6.2 ventrículos de similar tamaño
7.Concordancia Aurículo Ventricular
8.FO de derecha a izquierda
9.Septum interauricular indemne
10.Al menos una vena pulmonar en AI
11.Banda moderadora en VD
12.Cruz cardíaca indemne
13.Offseting valvular normal
14.Aorta descendente posterior a AI
15.Derrame pericárdico < 2 mm
03. Tracto de Salida de Ventrículo Izquierdo6 items
#EstructuraNANE
1.Se visualizan dos aurículas y dos ventrículos
2.Valvula aórtica abriendo libremente
3.Continuidad mitro aórtica
4.Continuidad entre el tabique interventricular y pared posterior de la aorta ascendente
5.Raíz aórtica
6.Aorta descendente retrocardíaca
04. Tracto de Salida de Ventrículo Derecho6 items
#EstructuraNANE
1.Tronco pulmonar en su origen en VD
2.Valvula pulmonar abriendo libremente
3.Bifurcación de arteria pulmonar en izquierda y derecha
4.Aorta ascendente
5.Aorta descendente retrocardíaca
6.VCS a la derecha de la aorta mas posterior
05. Corte 3 Vasos o 3 Vasos Tráquea7 items
#EstructuraNANE
1.Grandes vasos de tamaño similar
2.Número de 3 vasos correctos
3.Arco aórtico transverso a izquierda de tráquea
4.Arteria pulmonar principal anterior y a izquierda
5.Flujos anterógrados en forma de V con Doppler color
6.VCS a la derecha de la tráquea
7.Tráquea a la derecha de la aorta

Los 5 cortes de Yagel — ejemplo visual

Estas son las clases que el Modelo 1 distingue. Ejemplo representativo de cada plano sobre ecografías reales del CERPO.

Ejemplo representativo de cada uno de los 5 cortes cardíacos fetales: 01_SA, 02_C4C, 03_TSVI, 04_TSVD, 05_3VT

Estadísticas del Dataset (reporte final)

Snapshot al 2026-05-27. Hay ~1.500 imágenes adicionales pendientes de etiquetado (trabajo en curso).

0
Pacientes etiquetados
0
Imágenes totales
0
Con plano (Modelo 1)
0
C4C (Modelo 2)

El subset C4C para Modelo 2 cubre 73 pacientes con C4C usable, con desbalance ~3:1 normal:anormal a nivel paciente. 35 pacientes tienen diagnóstico CHD con códigos CRP específicos (CRP1.x — cardiopatías cono-truncales, CRP4.x — septales, etc.).

Hallazgo metodológico — auditoría de etiquetas (2026-05-26).

Una auditoría posterior detectó que la primera versión del pipeline derivaba el label normal/anormal de criterios anatómicos secundarios (atajos heurísticos sobre etiquetas CVAT auxiliares) en lugar de la observación clínica primaria 99901_Observación del Excel maestro. La corrección de la fuente de label:

  • Aumentó el número de C4C anormales image-level de 53 → 65.
  • Alineó el dataset con el Excel maestro del cardiólogo.
  • Mejoró la performance de Modelo 2 en +16 puntos de AUC en validación cruzada.

La auditoría de etiquetas contra ground-truth clínico queda documentada como práctica recomendada para todo proyecto análogo.

Distribucion por Plano

4 Cámaras
491
TSVI
136
3VT
134
Situs Abd.
111
TSVD
79

Construcción del Sistema de Detección

El sistema opera como una cascada de dos modelos independientes entrenados sobre EfficientNet-B3 pre-entrenado en ImageNet. Esta arquitectura desacopla la tarea anatómica (identificar el plano) de la tarea clínica (detectar cardiopatía), permitiendo que cada modelo se especialice y que la métrica final agregue evidencia a nivel paciente.

Pipeline en cascada

01
Imagen ecográfica entrante
Frame único o múltiple por paciente · 320×320 px
02
Modelo 1 — Clasificador de plano
EfficientNet-B3 + cabezal lineal 5 clases (SA, C4C, TSVI, TSVD, 3VT)
03
Filtro: ¿plano = C4C?
Sólo las imágenes clasificadas como C4C pasan a la siguiente etapa
04
Modelo 2 — Detector de cardiopatía
EfficientNet-B3 + cabezal binario · sólo sobre C4C
05
Agregación a nivel paciente
prob_max sobre todas las C4C del paciente → veredicto único

Arquitectura común — EfficientNet-B3

Ambos modelos comparten el mismo backbone: EfficientNet-B3 (≈11M parámetros) de la librería timm, inicializado con pesos pre-entrenados en ImageNet. Las imágenes se redimensionan a 320×320 px. El cabezal y la función de pérdida cambian según la tarea:

Optimizador AdamW (lr = 1×10⁻⁴, weight_decay = 1×10⁻²) · augmentación: RandomResizedCrop, flips horizontales, brillo/contraste, blur leve, CoarseDropout.

Partición de datos — sin leakage entre pacientes

Para evitar fuga de información, todas las imágenes de un mismo paciente quedan en el mismo split. La partición es estratificada por paciente, no por imagen, con semilla fija 42 (reproducible). La proporción objetivo es 70/15/15 a nivel paciente, alcanzada mediante asignación greedy.

Train (74%)131 pacientes
Val (12%, 5-fold CV)27 pacientes
TEST (14%)30 pacientes

Excepción FORCE_TRAIN: el paciente ID-191 tiene 147 imágenes C4C (≈30% del dataset C4C). Se forzó al split train para que no domine ningún fold de val ni test.

El TEST set nunca fue visto por ningún modelo durante entrenamiento ni durante la selección de hiperparámetros. Es la única métrica reportada como capacidad de generalización real del sistema.

Validación cruzada y ensemble

Sobre el conjunto train+val se ejecuta 5-fold cross-validation estratificada por paciente. Por cada fold se entrena un modelo independiente y se selecciona el checkpoint con mejor F1 macro (Modelo 1) o mejor AUC (Modelo 2). La inferencia final promedia las predicciones softmax de los 5 checkpoints (ensemble), reduciendo varianza y mejorando calibración.

Modelo 2 — Propagación de label y umbral operativo

Las etiquetas de normalidad se propagan a nivel paciente: toda C4C de un paciente con cardiopatía hereda el label anormal, aunque el defecto anatómico no sea visible en ese frame específico. Este enfoque sigue a Arnaout et al. (Nature Medicine, 2021) y obliga al modelo a aprender características generales asociadas con CHD en lugar de firmas anatómicas muy específicas que podrían no estar presentes en imágenes nuevas.

El re-balanceo combina WeightedRandomSampler en cada batch con Focal Loss (γ = 2, α = [1, 1]) — pesos uniformes en la loss: el sampler ya regula la proporción. El doble re-pesaje (sampler + α desbalanceado) causó colapso en una ablación previa. El umbral operativo se calibra ex-post sobre validación para sensibilidad = 1.0, alineado con el criterio clínico del CERPO de no perder casos anormales.

Agregación a nivel paciente — prob_max

Para cada paciente con múltiples C4C, las probabilidades de anormalidad se agregan tomando el máximo:

ppaciente=maxiC4C(p)  panormal(xi)p_{\text{paciente}} = \max_{i \in \text{C4C}(p)} \; p_{\text{anormal}}(x_i)

Esta estrategia se alinea con el criterio operativo: una sola imagen sospechosa amerita derivación. Se comparó contra prob_mean (AUC 0.844) y prob_top2 (AUC 0.911); prob_max ganó con AUC 0.933 en TEST.

Métricas y curva ROC

La validación reporta AUC, sensibilidad, especificidad y matriz de confusión. Para Modelo 2 se calcula adicionalmente un intervalo de confianza por bootstrap (2.000 remuestreos sobre pacientes de TEST) para cuantificar la incertidumbre dada por el tamaño del set:

Sensibilidad:
Se=VPVP+FN\text{Se} = \frac{VP}{VP + FN}
Especificidad:
Sp=VNVN+FP\text{Sp} = \frac{VN}{VN + FP}
AUC: área bajo la curva ROC, agregada sobre todos los umbrales posibles. Independiente del umbral operativo.

Decisiones de diseño — ablaciones descartadas

Durante el desarrollo se probaron sistemáticamente las siguientes alternativas, todas descartadas con evidencia cuantitativa. Esta tabla forma parte del marco metodológico: ninguna intervención algorítmica estándar rescata un dataset insuficiente para una tarea sutil. El techo de performance actual está dado por el tamaño y diversidad anatómica del dataset etiquetado, no por la elección del modelo.

Intervención probadaResultadoRazón del descarte
Pre-entrenamiento SSL (SimSiam, 200 epochs, 2.451 imgs)M1 F1m −0.04 · M2 AUC −0.03 vs ImageNetDataset insuficiente para SSL; ImageNet es suficiente a esta escala
Focal Loss + α = [1, 3] sobre Modelo 2Colapso a clase positiva (spec ≈ 0.21)Doble re-pesaje (sampler + α desbalanceado) sobreajusta a anormales
Backbone EfficientNet-B0 sobre Modelo 2AUC val −0.06 vs B3B3 captura mejor la geometría sutil de las cámaras cardíacas
Labels image-level (sin propagación) sobre Modelo 2AUC TEST = 0.38 (colapso en generalización)Dataset insuficiente para aprender label image-level confiable
Label desde criterios anatómicos secundarios (CVAT auxiliar)AUC val −0.16 vs label clínico explícitoAtajos heurísticos no replican la observación clínica primaria

Resultados Preliminares

Reporte final — métricas sobre TEST held-out. Todos los resultados de esta sección son sobre el split TEST que el modelo nunca vio durante el desarrollo. No son métricas optimistas de validación cruzada.

El pipeline opera en cascada de dos modelos: el Modelo 1 identifica cuál de los 5 planos de Yagel está presente en la imagen. Si se trata del corte 4 cámaras (C4C), el Modelo 2 estima la probabilidad de cardiopatía y se agrega a nivel paciente.

Modelo 1 — Clasificación de planos cardíacos

Tarea de 5 clases (SA, C4C, TSVI, TSVD, 3VT). Backbone EfficientNet-B3 pre-entrenado en ImageNet, ensemble de 5 folds. TEST: 104 imágenes en 30 pacientes.

Accuracy TEST
0.904
CV interna: 0.770 ± 0.033
F1 macro TEST
0.891
CV interna: 0.714 ± 0.054
PlanoPrec.RecallF1n
01_SA — Situs Abdominal0.8821.0000.93815
02_C4C — 4 Cámaras0.9800.8890.93254
03_TSVI — Tracto Sal. VI0.9000.8180.85711
04_TSVD — Tracto Sal. VD0.9091.0000.95210
05_3VT — 3 Vasos + Tráquea0.7060.8570.77414
Matriz de confusión del Modelo 1 sobre TEST set: F1m = 0.891, Accuracy = 0.904
Fig. 1. Modelo 1 — matriz de confusión sobre TEST. 01_SA y 04_TSVD obtienen recall 100%. Las confusiones residuales ocurren entre 02_C4C y 05_3VT (planos anatómicamente cercanos).

La generalización en TEST es superior a la validación cruzada (+0.18 F1 macro), señal de que el modelo aprendió representaciones robustas y no está sobreajustado. El plano más difícil sigue siendo 3VT, consistente con su mayor variabilidad anatómica.

Modelo 2 — Detección de cardiopatía sobre C4C

Clasificador binario (normal / anormal) entrenado únicamente sobre cortes 4 cámaras. Agregación a nivel paciente con estrategia prob_max — alineada con el criterio clínico: una sola imagen sospechosa amerita derivación.

AUC = 0.933
IC 95% bootstrap [0.73, 1.00] · n = 14 pacientes · umbral operativo T = 0.811
P(AUC > 0.85) ≈ 85% · P(AUC > 0.90) ≈ 72%
Métrica (paciente-level)Valor TEST
Sensibilidad1.000
Especificidad0.889

Comparación de estrategias de agregación a paciente

EstrategiaAUCT óptimoSensSpec
prob_maxOPERATIVA0.9330.8111.000.889
prob_top20.9110.7731.000.778
prob_mean0.8440.4751.000.667
Curvas ROC del Modelo 2 (prob_max, prob_top2, prob_mean) y scatter de score por paciente con threshold operativo T=0.811
Fig. 2. (a) Curvas ROC de las 3 estrategias de agregación. (b) Score por paciente — la fila roja (ANORMAL) está completamente a la derecha del threshold; un único punto verde cae a la derecha (ID-183, falso positivo).

Matriz de confusión (14 pacientes test, prob_max)

Pred. Anormal
Pred. Normal
Real Anormal
5
VP
0
FN
Real Normal
1
FP
8
VN

Predicciones por paciente en TEST

Pacienten C4CVerdadprob_maxDecisión
ID-833ANORMAL0.999SOSPECHOSO
ID-876ANORMAL0.993SOSPECHOSO
ID-115ANORMAL0.982SOSPECHOSO
ID-524ANORMAL0.817SOSPECHOSO
ID-291ANORMAL0.811SOSPECHOSO
ID-18314NORMAL0.990SOSPECHOSO
ID-151NORMAL0.808NORMAL
ID-902NORMAL0.793NORMAL
ID-143NORMAL0.746NORMAL
ID-826NORMAL0.556NORMAL
ID-721NORMAL0.482NORMAL
ID-981NORMAL0.418NORMAL
ID-104NORMAL0.416NORMAL
ID-553NORMAL0.405NORMAL

El modelo detectó los 5 pacientes anormales (sensibilidad = 100%) y clasificó correctamente 8 de 9 normales. El único falso positivo es ID-183, un paciente normal con 14 imágenes C4C: al tomar prob_max bastó una sola imagen sospechosa para marcar el caso. En la práctica clínica esto se resuelve con revisión humana rápida.

Limitaciones reconocidas.
  • El TEST de Modelo 2 contiene sólo 14 pacientes con C4C; el intervalo bootstrap [0.73, 1.00] refleja esta limitación de tamaño. Validación prospectiva con ≥50 pacientes angostaría el intervalo.
  • Validación monocéntrica (sólo CERPO). La generalización a otros centros, equipos y operadores requiere validación externa.
  • Modelo 2 sólo opera sobre C4C; anormalidades visibles únicamente en TSVI, TSVD o 3VT no son capturadas por esta versión.
  • Modelos congelados al estado de entrenamiento — sin retroalimentación clínica continua aún.

Demo: Predicción de Cardiopatía Congénita

Demostrador clínico funcional. Subí una imagen ecográfica fetal (pestaña Una imagen) o todas las imágenes de un mismo paciente (pestaña Paciente — varias imágenes) y el sistema correrá la cascada Modelo 1 → Modelo 2 → agregación a nivel paciente sobre los checkpoints reales entrenados.

El demo expone exactamente el mismo pipeline reportado en los resultados: ensemble de 5 folds de EfficientNet-B3 para el Modelo 1 (clasificación de plano de Yagel) y para el Modelo 2 (detección de cardiopatía sobre C4C). La inferencia corre en CPU; ~5 segundos por paciente con 10–15 imágenes.

¿Cargás muchas imágenes y la página se siente apretada? Abrir el demo en pantalla completa.

Aviso Legal: Está herramienta es exclusivamente para fines de investigación y demostración académica. Los resultados NO constituyen un diagnóstico médico. Consulte siempre a un especialista en medicina materno-fetal para la evaluación clínica. Las imágenes subidas no se almacenan en disco — el modelo las procesa en memoria y las descarta tras la inferencia.

Equipo Investigador

Equipo Médico — CERPO

Programa de Especialidad en Medicina Materno Fetal, Facultad de Medicina, Universidad de Chile.

R
Dra. Karen Rumante
Investigadora Principal
CERPO — Universidad de Chile

Médica en formación en el Programa de Especialidad en Medicina Materno Fetal, Facultad de Medicina, Universidad de Chile.

M
Dr. Max Monckeberg
Co-Investigador
CERPO — Universidad de Chile

Especialista en Medicina Materno Fetal, Facultad de Medicina, Universidad de Chile. Experiencia en ecocardiografía fetal avanzada.

Equipo Técnico —

EMERCOM

Desarrollo del pipeline de IA, sistema de etiquetado, infraestructura de inferencia y plataforma web.

L
Mg. Barbarita Lara
Investigadora Principal
EMERCOM SpA

Lidera el desarrollo técnico del proyecto: arquitectura de IA, pipeline de entrenamiento y validación de los modelos CNN, e integración con el flujo clínico de CERPO.

C
Roberto Carvajal
AI Engineer
EMERCOM SpA

Supervisa las decisiones técnicas clave del pipeline de IA, infraestructura de inferencia y estándares de calidad del desarrollo.

C
María Cirano
Data Specialist
EMERCOM SpA

Diseño del sistema de clasificación de hallazgos ecográficos de CERPO, estructurando las categorías diagnósticas que utiliza el modelo.

C
Mateo Carvajal
Data Analyst
EMERCOM SpA

Soporte en la verificación y análisis de los datos del sistema de clasificación de hallazgos.

Cronograma

El proyecto se desarrolla entre junio de 2025 y julio de 2026, abarcando las fases de reclutamiento, etiquetado, entrenamiento, validación y publicación.

May 2025
Presentación del proyecto
Completado
Jun 2025
Aprobacion comité de ética
Completado
Jun-Jul 2025
Inicio reclutamiento Cohorte 1
Completado
Jul-Dec 2025
Reclutamiento y obtención de imágenes
Completado
Oct 2025 - Feb 2026
Etiquetado de imágenes
Completado
Ene-Mar 2026
Entrenamiento del modelo CNN
En progreso
Mar-Abr 2026
Validación interna (Cohorte 1)
En progreso
Abr-Jun 2026
Reclutamiento y validación Cohorte 2
Pendiente
Jun-Jul 2026
Análisis final y publicación
Pendiente

Referencias y Publicaciones

Referencias

  1. [1]
    van der Linde D, Konings EE, Slager MA, et al. Birth prevalence of congenital heart disease worldwide: a systematic review and meta-analysis. J Am Coll Cardiol. 2011;58(21):2241-2247.
  2. [2]
    Van Nisselrooij AEL, Haak MC, et al. Why are congenital heart defects being missed? Ultrasound Obstet Gynecol. 2020;55(6):747-757.
  3. [3]
    Tegnander E, Eik-Nes SH. The examiner's ultrasound experience has a significant impact on the detection rate of congenital heart defects at the second-trimester fetal examination. Ultrasound in Obstet & Gynecol. 2006;28(1):8-14.
  4. [4]
    Yagel S, Cohen SM, Achiron R. Examination of the fetal heart by five short-axis views: A proposed screening method for comprehensive cardiac evaluation. Ultrasound in Obstet & Gynecol. 2001;17(5):367-369.
  5. [5]
    Carvalho JS, Allan LD, Chaoui R, et al. ISUOG Practice Guidelines (updated): fetal cardiac screening. Ultrasound Obstet Gynecol. 2023;61(5):788-803.

Publicaciones del Proyecto

Pendiente — Las publicaciones derivadas de esta investigación serán listadas aquí una vez disponibles.

Información de Contacto

Investigadores

Dra. Karen Rumante
krumante@uchile.cl
Dr. Max Monckeberg
mmonckeberg@uchile.cl

Institucion

Centro de Referencia Perinatal Oriente (CERPO)

Programa de Especialidad en Medicina Materno Fetal

Facultad de Medicina

Universidad de Chile

Santiago, Chile

Colaboración Técnica

EMERCOM SpA

Desarrollo de infraestructura de IA, pipeline de entrenamiento y plataforma web.