Excelente idea: Macro Excel proyecta fecha fin pandemia

No imagino un área de ventas, marketing, planificación de la producción o finanzas que no use modelos predictivos.

¿Cómo determinar las ventas del próximo mes? ¿La evolución de las bolsas? ¿La tasa esperada de reclamos de clientes o la cantidad de artículos que debo producir el mes siguiente?

Con apoyo de modelos matemáticos y por supuesto, la tecnología, hoy día, para un cualquier persona es posible efectuar complejas estimaciones sin necesidad de aprender ningún modelo matemático.

No es necesario que estos usuarios conozcan los modelos que allí se encuentran, ya que los sistemas hacen el trabajo por uno.

Y con estos tremendos avances en materia de tecnología, ¿no te sorprende que no hayan salido ya modelos predictivos para determinar cuándo terminará esta pandemia que nos tiene con el alma en un hilo?

En este artículo te contaré algunos avances a este respecto y cómo podemos utilizar estos modelos para (al menos) tener una idea de lo que podemos esperar con el temido COVID-19.

La curva de Gompertz

Al inicio de una epidemia el aumento de casos es exponencial. Un comportamiento que sorprende a la mayoría por su explosivo crecimiento, sin embargo esto solo es la fase inicial de un modelo de crecimiento denominado sigmoide.

El modelo de crecimiento sigmoide más conocido fue propuesto por Pierre François Verhulst entre 1838 y 1847 y por ello se le suele llamar función de Verhulst o función logística.

Sin embargo para multitud de procesos de crecimiento biológico se suele utilizar el modelo propuesto en 1825 por Benjamin Gompertz para estudiar la relación entre la edad y el incremento de la mortalidad en humanos. Lo que él denominaba «el agotamiento promedio del poder de un hombre para evitar la muerte», o la «porción de su poder restante para oponerse a la destrucción»

La función de Gompertz, rápidamente fue adoptada por la industria de los seguros para proyectar el riesgo de muerte, es ampliamente utilizada en biología como modelo de regresión para estudiar el crecimiento de las poblaciones de animales, bacterias, crecimiento de tumores y supervivencia de pacientes de cáncer, y por supuesto modelos de infección.

Variables de la función de Gompertz

La función de Gompertz es muy similar a la función logística, pero se diferencia de ella en que es asimétrica. El crecimiento es más rápido al principio de la curva que al final. Esta pequeña diferencia la hace más apropiada para describir el crecimiento biológico.

La función de Gompertz es la solución a la ecuación diferencial que describe los cambios en la población (P) con el paso del tiempo (t) en función de su capacidad de crecimiento intrínseca (c, constante) y la máxima población que el ecosistema puede soportar, lo que se define como capacidad de carga (K, carrying capacity).

P(t) = K e^-ln(K/P0) e^-ct

Donde P0 es el tamaño de la población inicial.

En Excel se puede escribir como:

=K*EXP((-LN(K/P0))*EXP((-C)*i))

Donde K es el número que refleja el máximo de casos que se van a alcanzar, la asíntota superior.
P0 es el número de casos iniciales.
C es el número que corresponde a la constante de crecimiento.
i es el primer número de celda de donde debe tomar el dato de tiempo (número de días desde el inicio).

Una de las propiedades de la función de Gompertz es que su segunda derivada se vuelve cero cuando la población alcanza el valor de la capacidad de carga dividido por e, P = K/e, (e = 2,718). Esto quiere decir que antes de alcanzar la mitad del total de casos que va a haber, el número de nuevos casos alcanza su máximo y comienza a descender, como se aprecia en la siguiente figura:

Función de Gompertz para una capacidad de carga K =200.000 y una constante de crecimiento C de 0,06, con una P0 de 2 en el día 1. El peak de nuevos casos se alcanza en el día 42 con 4.400 casos al día.

Funcion de Gompertz aplicada al Coronavirus

Como vimos, para poder modelar la funcion de Gompertz, es nesario conocer dos variables: el número total de casos (K) y el valor de la variable de crecimiento (c)

Si por ejemplo, tomamos la gráfica de las muertes por coronavirus en China y aplicamos este modelo estimando valores de K y C que se ajusten, llegamos a la siguiente solución:

Como pueden apreciar, la gráfica se ajusta casi perfectamente a los valores reales para un valor de K=3450 y C=0,088. Los detalles de la estimación y el cálculo los puedes revisar en el siguiente artículo.

Si mediante el uso de macros excel podemos calcular el valor de la curva de Gompertz y compararlo con los datos reales de la pandemia, es posible estimar un modelo que se ajuste a la realidad, y con esto, podríamos estimar la proyección de casos si las condicones se mantuvieran(*)

(*) IMPORTANTE: La evolución de la pandemia va cambiando en función de las medidas que se van tomando, por lo que las proyecciones efectuadas tomado estos parámetros como referencia deben irse ajustando día a día para reducir los márgenes de error.

Los gráficos presentados en esta publicación corresponden a la mejor estimación posible con los datos disponibles al 31 de Marzo de 2020.

Mediante el uso de macros de Excel, simulé escenarios con valores de K entre 3.000 y 50.000 y valores de C entre – 0,01 y – 0,08. Luego, seleccioné la curva cuya desviación estándar fuera menor para los datos disponibles a la fecha.

El gráfico resultante, tomando los datos reales de evolución del COVID-19 en Colombia, es el siguiente:

Como pueden ver, el modelo se ajusta bastante bien a la realidad hasta el 31 de marzo de 2020. La proyección para los próximos 60 días sería la siguiente:

Según esta proyección, si la evolución se mantiene como hasta ahora, el total de casos no superaría los 5.000 y hacia fines de mayo ya estarian saliendo de la pandemia.

Si repetimos el ejercicio, con los datos reales de Chile, el gráfico resultante sería el siguiente (datos actualizados al 06 de Abril de 2020):

Y la proyección a 60 días

Según esta proyección, si la tendencia se mantiene, el número total de infectados se elevaría a los 19.000 y hacia fines de mayo estaríamos en vías de salir de la pandemia, con poco más de 1.300 personas aún contagiadas, pero lo peor habría pasado.

Es IMPORTANTE recalcar, que el modelo de Gompertz entrega una aproximación de la realidad, calculada en base a la información disponible a la fecha.

Los resultados pueden cambiar en función de las medidas que se adopten para revertir la tendencia actual, y en la medida que se va disponiendo de mayores datos, es posible ajustar el modelo; pero al menos nos entrega una visión estimada del futuro, con una base de cálculo matemática, sobre la que tú mismo puedes investigar.

Espero que esta información te haya servido para conocer acerca de estos interesantes modelos, y como siempre, te invito a compartir este artículo con tus amigos y enviarnos tus dudas y comentarios.

Si te interesa ver cómo funciona la planilla con la proyección y los cálculos, puedes revisar AQUI.

Te invito a revisar también otras interesantes aplicaciones de las macros de Excel.

8 comentarios sobre “Excelente idea: Macro Excel proyecta fecha fin pandemia

  1. excelente, lo que no sería bueno que en base a esto el gobierno manipule la información que nos entrega día a día.

    Puedes mostrar los valores que corresponden a todos los días?

    1. Gracias por tu comentario, Álvaro. Estoy preparando un video y ordenando un poco la planilla para, poder compartir los datos.
      Saludos!!!

  2. Muy interesante y más que útil, necesario. Entiendo que mientras más nos aproximemos a la fecha tentativa, más certera será la proyección.

    1. Gracias por tu comentario Gonzalo. Efectivamente si agregamos más datos reales al modelo, podemos ajustar la curva de proyección y recalcularla, verificando si la estimación se corrige con las nuevas medidas.
      Un saludo!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Abrir chat
1
Sabemos que tu tiempo es muy importante. ¿En qué podemos ayudarte?