Una comprensión del concepto de aprendizaje profundo

May 10 2022
Digamos que hay un grupo de estudiantes que nunca han visto un dinosaurio. ¡Estos estudiantes son muy ingenuos y no tienen idea de cómo se ve este animal...! Nuestra intención es capacitar a estos estudiantes para ayudarlos a identificar un dinosaurio.

Digamos que hay un grupo de estudiantes que nunca han visto un dinosaurio.
¡Estos estudiantes son muy ingenuos y no tienen idea de cómo se ve este animal...!
Nuestra intención es capacitar a estos estudiantes para ayudarlos a identificar un dinosaurio.

Lo que hacemos es asignar tareas individuales a cada uno de los alumnos.
Ram trabaja para detectar los ojos de un dinosaurio.
Sita trabaja en la detección de la nariz del dinosaurio.
Shyam trabaja en la detección de la boca del dinosaurio.

La forma en que dan su decisión se basará en puntajes que van de 0 a 1.

0: los ojos no pertenecen a Dinosaur
0.5: los ojos se parecen un poco a los ojos de Dinosaur
1: los ojos son de Dinosaur

Supongamos que les damos una imagen de un León,
Ram dirá que la decisión es 0.03 (muy cerca de 0), ya que los ojos son de un León y ha sido entrenado para detectar los ojos de un Dinosaurio.

Así es como envían sus puntuaciones.

Para nuestro caso con el Dinosaurio, supongamos que los puntajes de muestra recopilados por los tres estudiantes son 0.8, 0.9, 0.6 para ojos, nariz y boca, respectivamente.
Estos puntajes de muestra son para la detección de rostros del dinosaurio.

Ahora estos puntajes se envían a otra persona para que decida si la imagen tiene la cara de dinosaurio o no. Esa persona puede usar una fórmula como esta, donde podemos asignar diferentes pesos a diferentes características.
Cara = ojos*0,2 + nariz*0,3 + boca*0,5
En un dinosaurio, la boca se ve bastante prominente, por lo que se le ha dado más peso a la boca.
Sustituyendo las puntuaciones de la muestra,
(0,8)(0,2) + (0,9)(0,3) + (0,6)(0,5) = 0,73
obtenemos un valor de 0,73.

El valor es superior a 0,5 (valor umbral según lo decidido), por lo que la imagen dada es de un dinosaurio.

Supongamos que les damos una imagen de Perro a estos estudiantes y les pedimos que identifiquen si es un Dinosaurio o no. Digamos, el puntaje calculado, considerando los pesos definidos y algunos puntajes de muestra supuestos de
0.25, que es menor que 0.5, esto indica que la imagen está remotamente lejos de la cara del Dinosaurio. Y podemos decir que la imagen detectada no es la del Dinosaurio.

De la misma manera, todos los estudiantes pueden ser entrenados para detectar partes separadas del cuerpo del Dinosaurio y pueden enviar sus respectivas puntuaciones de muestra a diferentes individuos.
Las puntuaciones de muestra de ojos, nariz y boca se pueden calcular y enviar a otra persona para la detección de la cara del dinosaurio. Simultáneamente, las puntuaciones de muestra de piernas, brazos, garras y otras partes del cuerpo pueden calcularse y enviarse a otra persona para la detección del cuerpo del dinosaurio.

Finalmente, las puntuaciones de la cara y el cuerpo se obtuvieron de ambas personas (que detectan la cara y el cuerpo) y se enviaron a otra persona que combina la puntuación de la cara y la puntuación del cuerpo para detectar el cuerpo completo del dinosaurio.
Esta detección se realiza nuevamente con la ayuda de pesos asignados a la cara y al cuerpo. Por lo general, se asigna más ponderación a la cara.

Este tipo de red completa que se forma entre los estudiantes se describe como una red neuronal.

Cada persona individual aquí actúa como una neurona individual y trabaja en una subtarea específica; en el lenguaje de las redes neuronales, forman la capa de entrada o la primera capa
. Luego, estas neuronas pasan su subtarea a otro grupo de personas.
En términos de redes neuronales, se describen como capas ocultas.
La última persona que detecta la cara nos da la salida final que nuevamente forma la última capa.

Toda esta red se llama Red Neuronal.
Esta es una red neuronal entrenada

La parte más importante de la Red Neuronal es
"¿Cómo la entrenas?"
"¿Cómo detectas estas características?"

Imagínese que estos estudiantes no están capacitados.
Cuando tratamos de mostrar una imagen de Dinosaurio a la clase, todos harán una suposición aleatoria de los puntajes y luego proporcionarán el puntaje final basado en los puntajes de muestra.

Ahora, la persona que calcula los puntajes finales y decide si es un Dinosaurio o no, sale del salón de clases y se encuentra con otro supervisor, quien realmente sabe la respuesta correcta.

Según las puntuaciones aleatorias, la persona le dice al supervisor que la imagen no se parece realmente a un dinosaurio y luego el supervisor niega esa afirmación en particular.
Debido a la negación, la persona regresa nuevamente al salón de clases y verifica las puntuaciones con los estudiantes o reasigna diferentes pesos a las características.
Los estudiantes tienen presente este error o el error.
Entonces, ahora el error pasa de la capa de salida a la capa oculta y luego vuelve a la capa interna. Este proceso se denomina Propagación de errores hacia atrás.
Este proceso de cometer errores y obtener retroalimentación y luego pasar la retroalimentación a todo el grupo para que el grupo ajuste los pesos asignados a las características es básicamente la propagación hacia atrás.

Este tipo de detección de imágenes se trabaja en diferentes imágenes de Dinosaurio y el mismo proceso se repite tomando una conjetura aleatoria sobre los puntajes de varias características y luego ajustando los puntajes nuevamente.
Esta forma de ajustar sus cerebros de manera que finalmente puedan encontrar la respuesta correcta.

Dado un conjunto de 10000 o más imágenes de Dinosaurio, este grupo de estudiantes puede ser entrenado y, finalmente, este grupo se vuelve mejor en la detección de la cara del Dinosaurio.
Inicialmente se producen muchos errores, pero la precisión mejora con el tiempo.

Ahora, surge la pregunta de cómo se mejoran los pesos con el tiempo.
Hay algunas derivadas y matemáticas detrás de esto.

La motivación detrás de las redes neuronales provino del mecanismo de cómo funcionan las redes neuronales en nuestro cerebro.

Volviendo a nuestra infancia, si podemos recordar cómo aprendimos a andar en bicicleta. Inicialmente nos caíamos y luego volvíamos a intentarlo... otra vez nos caíamos y volvíamos a intentarlo. Y eventualmente dominamos esa habilidad. Durante el proceso de prueba y error, lo que sucede es… nuestro cerebro tiene miles de millones o billones de neuronas, y en esas neuronas, este tipo de proceso de entrenamiento continúa constantemente. Entonces, existe este bucle de error o retroalimentación de propagación hacia atrás que va dentro de esas pequeñas neuronas y los pesos entre las neuronas se ajustan constantemente hasta que llegamos a una situación en la que los errores son mínimos.

En el contexto de la ciencia de datos, cuando observamos conjuntos de datos complejos y enormes, no sabemos qué características estamos viendo en realidad.
Entonces, solo construimos una red neuronal que tiene una capa de entrada, una capa oculta y una capa de salida y esta red neuronal ayudará a identificar las características importantes con cada neurona individual, calcula sus propias subtareas individuales.

© Copyright 2021 - 2022 | unogogo.com | All Rights Reserved