lunes, 15 de diciembre de 2008

Estadística

Ahora los problemas con el ordenador es la estadística. Tenemos disponible en nuestra Universidad SPSS. Tiene ciertas ventajas, como lo fácil que es de usar, pero otros inconvenientes, como que algunos algoritmos no son todo lo "interesantes" que podrían ser. Eso nos enfrenta ante varias posibilidades, cada una con "ciertos" problemas.
Como es natural, lo mejor sería pasarse a R, pero no tengo tiempo para controlarlo (lenguaje matemático que requiere el uso de comandos en linea, lo que los anglosajones llaman CLI (Command line interface), cosa que yo hacía cuando era pequeñito y usaba dBase, pero ya no me dedico a tanto sufrimiento desde hace exactamente 15 años y 2 meses y, además, no tengo tiempo.
Otra opción sería utilizar otros programas, como pueden ser, para lo que estoy interesado ahora mismo, Sipina, Weka (También CLI), Knime (utilidad Java), Orange y otros. Para el que no esté acostumbrado, estoy intentando hacer un analisis de minería de datos (que nada tiene que ver con la minería tradicional, si no de la extracción de información oculta -"enterrada"- dentro de los datos; vamos, lo que no se ve a "simple vista", sin analisis multivariantes. En concreto quiero obtener árboles de decisión, clasificatorios, de mis datos-animales. Estos programas que acabo de decir son de código abierto, o al menos freeware, pero tienen un problema. Tengo que comprenderlos y saber como se usan, a ser posible antes de mañana, y algunos son solo para Windows. Es decir, a ver como va esto. Tendremos que estudiar un montón y analizar de que algoritmos disponemos en cada programa para ver cual es el que más me interesa. Que dolor de cabeza.

No hay comentarios:

Publicar un comentario