diumenge, 16 de novembre del 2008

REGRESSIÓ: lifting matemàtic


Regressió vol dir normalment tornar enrere, però al laboratori significa en molts aspectes tirar endavant.
En estadística, la regressió lineal o ajust lineal és un mètode matemàtic que ens dóna un model (representació d'un fenomen a través d'una equació o funció matemàtica que el descriu) per simular el comportament d'un fenomen. Es diu lineal perquè ens dóna com a resultat una línia, la línia que més s'ajusta al comportament d'una col·lecció de punts o dades d'un experiment.
Suposem que hem estudiat l'estatura de diferents alumnes al llarg dels diferents cursos d’ESO i volem veure si el creixement obeeix a algun tipus de llei matemàtica.
Si representem les alçades dels alumnes en un gràfic, en funció de la seva edat, s'observa una certa dispersió, però amb una clara evolució creixent.
 
Si enllacem amb segments els punts ens donen una idea de la seva evolució més clarament.
 
Si ens imaginem la línia recta que més s’aproxima a aquesta col·lecció de punts, sens dubte és la següent, calculada de manera que la seva distancia a tots els punts sigui la mínima possible. Com que és impossible que passi per tots, ens hem de conformar am la que més s’ajusta. Acabem de fer un ajust lineal o regressió lineal i la línia que més s’ajusta l’anomenem línia de tendència o corba de regressió.
 
I cóm es calcula per on passa aquesta línia?
L’aparició dels fulls de càlcul han marcat un abans i un després en el món del càlcul numèric. Allò que abans costava hores (i resa per què no t’equivoquis) amb l’ajut de l’Excel es fa en dos clics:
Situem el cursor sobre un dels punts, cliquem el botó dret del ratolí i seleccionem “Afegir línia de tendència” i ja està. Ens preguntarà quin tipus de línia volem entre diverses opcions:
  • Lineal: dóna una recta (y=a·x+b)
  • Logarítmica: dóna una funció logarítmica (y=a·ln(x)+b)
  • Exponencial: dóna una funció exponencial (y= a·eb·x)
  • Potencial: dóna una funció potencial (y=a·xb)
  • Polinòmica: dóna una funció polinòmica de grau n (y=a·xn+b·xn-1+....)
El full de càlcul sempre interpreta que “y” és el paràmetre que es representa en l’eix vertical (ordenades) del gràfic, mentre que “x” és el paràmetre que es representa en l’eix horitzontal (abcises) del gràfic. Així, “y” és l’altura i “x” és l’edat en el nostre exemple.
I quin tipus de corba triem?
Doncs està molt clar, fem proves i ens quedem amb la que vagi millor. En informàtica, les proves són gratis!
Per més informació, dintre de les opcions de representació, li podem demanar que ens mostri la equació de la línia de tendència i el coeficient R2, que és un indicador de la qualitat de l’aproximació (quant més proper a 1 millor).
Així, després de diverses proves, trobem que la corba que més s’aproxima és una polinomial de grau 3.
 
Per què ens pot servir aquesta corba?
La corba i sobretot, la seva equació ens pot servir per calcular valors intermitjos (interpolar) entre els que s’han mesurat, o punts més enllà dels mesurats (extrapolar). És a dir, que podem calcular aproximadament quina es l’altura esperada per un alumne de 14 anys i mig, i també podrem calcular l’altura d’un alumne de 17 anys amb força aproximació, i tot això perquè tenim una informació més valuosa que una taula de punts, tenim l’equació de la línia que segueix l’evolució de l’altura al llarg dels anys.
Si comparem la primera línia poligonal, punxeguda i discontínua, amb la darrera línia ajustada per regressió, suau i contínua, bé podríem pensar que se li ha fet un lifting, en dos clics i sense anestèsia!