Introducción a los árboles de clasificación

Dentro de los métodos de clasificación supervisada nos encontramos con una gran variedad, específicamente en este post se hablará de los árboles de clasificación; esto se lo ha realizado por algunas ventajas que los mismos nos proporcionan, entre ellas tenemos:

  • Sencillez.
  • Accesibilidad a diferentes implementaciones.
  • Aporta con una explicación al momento de analizar la clasificación realizada.
  • Pueden ser representados en forma gráfica.
  • Representa una gran rapidez a la hora de clasificar nuevos patrones.

Definición: Los árboles de clasificación tienen una estructura en forma de árbol, en la que las ramas representan conjuntos de decisiones; estas decisiones generan sucesivas reglas para la clasificación de un conjunto de datos en subgrupos de datos disjuntos y exhaustivos.  Las ramificaciones se generan de forma recursiva hasta que se cumplan ciertos criterios de parada.

Árbol de clasificación de los seres vivos.

Para nuestro estudio se tomará como referencia la clasificación de los seres vivos, misma que ha sido recuperada desde el enlace “Clasificación de los seres vivos”, donde se muestran en forma de tabla la clasificación existente entre las diferentes especies de seres vivos.

Este árbol servirá como herramienta de aprendizaje para que las personas interesadas en conocer aspectos relacionados a este tema, puedan practicar en base a un escenario de conocimiento que no implica estrictos conocimientos en el área biológica, sino más bien se presenta como una propuesta en la cual el conocimiento se genere de una forma rápida e intuitiva.

A continuación se presentan algunos conceptos, definiciones y aspectos relevantes de los árboles de clasifiación.

ESTRUCTURA: La estructura de un árbol de clasificación consta de los siguientes elementos.

  • Nodo Raíz: En este nodo se encuentran agrupados todos los elementos que van a ser clasificados (Ejemplo: SERES VIVOS).
  • Nodos Intermedios: Son aquellos nodos que se encuentran en una posición intermedia del árbol, su finalidad es permitir la selección de una opción (Ejemplo: ANIMAL, Parazoa, Eumetazoa, Artropodos, Cordados, Vertebrados).
  • Nodos terminales: también llamados nodos hoja, debido a que no tendrán descendencia posterior representan a una categoría específica previamente definida en el dominio del problema (Ejemplo: Cianobacterias, Bacterias, Protozoo, Algas, Poriferos o esponjas, Cnidarios, Platelmintos o gusanos planos, Nematodes o gusanos cilíndricos, Anelidos, Moluscos, Equinodermos, Aracnidos, Miriapodos, Crustáceos, Insectos, Peces, Anfibios, Reptiles, Aves, Mamiferos).

Dependiendo del dominio del problema que estemos clasificando, deberemos responder las siguientes preguntas:

¿Cómo se realiza la selección de las divisiones?

Aplicando al ejemplo: La selección de divisiones se realiza en base a aspectos fisiológicos de los ejemplares a clasificar.

¿Cómo se toma la decisión de declarar a un nodo como intermedio o como hoja?

Aplicando al ejemplo: Los nodos intermedios en este tipo de clasificación se han declarado así debido a características en común que tienen con otros individuos, pero que al seguir analizando sus características físicas pueden ser catalogadas en grupos tan específicos, de los cuales no se conozca una subdivisión (nodos hoja).

y ¿Cómo se asigna la pertenecía de cada nodo hoja a las posibles clases?

Aplicando al ejemplo: Uno de los ejemplares que se ha tomado del conjunto Seres Vivos, tiene las siguientes características: Es animal, posee tejidos, presenta una cuerda dorsal, en su fisionomía cuenta con la presencia de vertebras, su forma de alimentar a las crías es por medio de sus glándulas mamarias.

Con todas estas características podríamos irlo clasificando de la siguiente manera:

Es animal -> Animal

posee tejidos -> Eumetazoa

presenta una cuerda dorsal -> Cordado

en su fisionomía cuenta con la presencia de vertebras -> Vertebrados

su forma de alimentar a las crías es por medio de sus glándulas mamarias. -> Mamíferos.

TIPOS DE ÁRBOLES DE CLASIFICACIÓN

Existen varias taxonomías mediante las cuales se puede realizar la clasificación de estos árboles, una de las más frecuentes es aquella en la que se evalúa la naturaleza de la variable a ser tratada; pudiendo ser discreta o continua. Si la variables son discretas al árbol resultante se lo conoce como árbol de clasificación; pero si las variables son continuas al árbol se lo conoce como árbol de regresión (Para nuestro ejemplo se ha trabajado con variables discretas, razón por la cual el árbol de nuestro ejemplo es un árbol de clasificación)

Otra forma de clasificar a estos árboles es por el número de ramas o hijos que se permite salir de un nodo, existen algunas variantes, entre ellas árboles binarios, árboles ternarios, árboles n-arios. (El árbol de clasificación de los seres vivos corresponde al grupo de árboles n-arios).

Espero les ayude a entender aunque sea de forma muy básica el funcionamiento de los árboles de clasificación, saludos.




    Responder

    Introduce tus datos o haz clic en un icono para iniciar sesión:

    Logo de WordPress.com

    Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

    Imagen de Twitter

    Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

    Foto de Facebook

    Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

    Google+ photo

    Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

    Conectando a %s



A %d blogueros les gusta esto: