Ciencia de datos : funciones lineales


Es importante conocer las funciones matemáticas como científico de datos, porque queremos hacer predicciones e interpretarlas.


Funciones lineales

En matemáticas se usa una función para relacionar una variable con otra variable.

Supongamos que consideramos la relación entre el consumo de calorías y el pulso promedio. Es razonable suponer que, en general, el consumo de calorías cambiará a medida que cambie el pulso promedio; decimos que el consumo de calorías depende del pulso promedio.

Además, puede ser razonable suponer que a medida que aumenta el pulso promedio, también lo hará el consumo de calorías. La quema de calorías y el pulso promedio son las dos variables que se están considerando.

Debido a que el consumo de calorías depende del pulso promedio, decimos que el consumo de calorías es la variable dependiente y el pulso promedio es la variable independiente.

La relación entre una variable dependiente y una independiente a menudo se puede expresar matemáticamente usando una fórmula (función).

Una función lineal tiene una variable independiente (x) y una variable dependiente (y), y tiene la siguiente forma:

y = f(x) = ax + b

Esta función se usa para calcular un valor para la variable dependiente cuando elegimos un valor para la variable independiente.

Explicación:

  • f(x) = la salida (la variable dependiente)
  • x = la entrada (la variable independiente)
  • a = pendiente = es el coeficiente de la variable independiente. Da la tasa de cambio de la variable dependiente.
  • b = intercepto = es el valor de la variable dependiente cuando x = 0. También es el punto donde la línea diagonal cruza el eje vertical.


Función lineal con una variable explicativa

Una función con una variable explicativa significa que usamos una variable para la predicción.

Digamos que queremos predecir el consumo de calorías usando el pulso promedio. Tenemos la siguiente fórmula:  

f(x) = 2x + 80

Aquí, los números y las variables significan:

  • f(x) = La salida. Este número es donde obtenemos el valor predicho de Calorie_Burnage
  • x = La entrada, que es Average_Pulse
  • 2 = Pendiente = Especifica cuánto aumenta Calorie_Burnage si Average_Pulse aumenta en uno. Nos dice qué tan "empinada" es la línea diagonal
  • 80 = Intersección = Un valor fijo. Es el valor de la variable dependiente cuando x = 0

Trazar una función lineal

El término linealidad significa una "línea recta". Entonces, si muestra una función lineal gráficamente, la línea siempre será una línea recta. La línea puede inclinarse hacia arriba, hacia abajo y, en algunos casos, puede ser horizontal o vertical.

Aquí hay una representación gráfica de la función matemática anterior:

Función lineal

Explicaciones gráficas:

  • El eje horizontal generalmente se llama el eje x. Aquí, representa Average_Pulse.
  • El eje vertical generalmente se llama eje y. Aquí, representa Calorie_Burnage.
  • Calorie_Burnage es una función de Average_Pulse, porque se supone que Calorie_Burnage depende de Average_Pulse.
  • En otras palabras, usamos Average_Pulse para predecir Calorie_Burnage.
  • La línea azul (diagonal) representa la estructura de la función matemática que predice el consumo de calorías.