Escrito por José Luis López en Planeta Chatbot.
Esta es mi primer entrada sobre algoritmos de Inteligencia artificial, en la cual hablaremos del algoritmo de Regresión Lineal.
Cuando hablamos del algoritmo de Regresión lineal hablamos de un algoritmo de Inteligencia artificial supervisada.
Si no entiendes de que va lo de algoritmos supervisados o no supervisados clic aquí.
Me enfocare en su mayoría a la parte práctica y no tanto teórica del origen o de donde proviene la ecuación de la regresión lineal. En caso de tener un interés en la parte teórica puedes consultarlo aquí.
Tabla de contenidos
¿Que es la regresión lineal?
El objetivo del análisis de regresión como método causal es pronosticar la demanda a partir de una o más causas (variables independientes), las cuales pueden ser por ejemplo el tiempo, precios del producto o servicio, precios de la competencia, economía del país, acciones del gobierno o fomentos publicitarios.
Formula del pronostico:
Formula para el pronostico.
Xt es el pronostico del periodo t.
a es la intersección de la linea con el eje.
b pendiente (positiva o negativa).
t periodo de tiempo.
Donde:
Formula de la Intersección
X media de la variable dependiente (Ventas o demanda)
b valor de la pendiente
t media la variable independiente (tiempo)
Donde:
Formula de la pendiente.
Ejemplo de un pronóstico de Regresión lineal Simple
La juguetería Gaby desea estimar mediante regresión lineal simple las ventas para el mes de Julio de su nuevo carrito infantil “Mate”. La información del comportamiento de las ventas de todos sus almacenes de cadena se presenta en el siguiente tabulado.
Tabla de datos.
El primer paso para encontrar el pronóstico del mes 7 consiste en hallar la pendiente. Primero se busca la pendiente (b) ya que no se puede calcular la intersección (a) ya que es necesario el valor de la pendiente para encontrarla.
Pendiente
Para ello efectuamos los siguientes cálculos:
Vamos a partir en pequeños fragmento la formula para posteriormente sustituirlo.
La sumatoria de los valores de X (ventas) multiplicado por el t (tiempo).
[(7000*1) + (9000*2) + (5000*3) + (11000*4) + (10000*5) + (13000*6)] = 212 000
La sumatoria de de los valores de X (ventas)
(7000 + 9000 + 5000 + 11000 + 10000 + 13000) = 55 000
La sumatoria de t (tiempo).
(1 + 2 + 3 + 4 + 5 + 6) = 21
<
La sumatoria de los valores de t (tiempo) elevados al cuadrado.
[(1)² + (2)² + (3)² + (4)² + (5)² + (6)²] = 91
La sumatoria de de t (tiempo) elevada al cuadrado.
(21)² = 441
Sustitución:
b = [(6 * 212000) – (55000 * 21)] / [(6 * 91) – 441]
= (1 272 000 – 1 155 00) / (546 – 441)
= 117 000 / 105
b = 1114.28
Intersección de la linea
Formula de la Intersección
Media o promedio de X
(7000 + 9000 + 5000 + 11000 +10000 +13000) / 6 = 9166.67
Media o promedio de t
(1 + 2 + 3 + 4 + 5 + 6) / 6 = 3.5
b =1114.28
Sustitución:
a = 9166.67 – (1114.28*3.5)
= 9166.67 – 3899.98
a = 5266.68
Regresión lineal
Una vez se tienen todos los valores, se sustituyen en la formula.
Formula para el pronostico.
Xt = 5266.68 + (1114.28 * 7)
= 5266.68 + 7799.96
Xt = 13067
Ahora tenemos que el pronostico para el mes numero 7 es de 13,067.
Para dejar un poco mas en claro la formula, se puede ver de la siguiente forma:
Pronostico = Intersección + [pendiente * periodoDeTiempo]
Por ahora es todo en cuanto el algoritmo de regresion lineal. En cuanto genera el codigo en Python actulizo la entrada.
Cualquier duda con gusto la contesto. Saludos y nos vemos.
Fuente de apoyo: link.