Innovando la educación en la tecnología. Группа авторов. Читать онлайн. Newlib. NEWLIB.NET

Автор: Группа авторов
Издательство: Bookwire
Серия:
Жанр произведения: Математика
Год издания: 0
isbn: 9789972455315
Скачать книгу
de aprendizaje para cada weight de la red neuronal.

      Adam utiliza los gradientes elevados al cuadrado para escalar la velocidad de aprendizaje como el algoritmo RMSprop (Tieleman y Hinton, 2012) y aprovecha el impulso al usar la media móvil de los gradientes en lugar de solo la gradiente como el algoritmo stochastic gradient descent.

      Para estimar los momentos, Adam utiliza promedios móviles exponenciales, calculados en el gradiente evaluado en un minilote actual:

Image Image

      Donde mt y vt son los promedios móviles, g es la gradiente del minilote actual y los β son los hiperparámetros del algoritmo. Ambos tienen un valor default de 0,9 y 0,999, respectivamente

      La fórmula para obtener el promedio móvil mt también puede ser representada por la siguiente ecuación:

Image

      Después de esto se necesita realizar un paso llamado “bias correction”, esto quiere decir que se necesita corregir el valor inicial de mt y vt, para ello se realizan las siguientes transformaciones:

Image Image

      Para finalizar, se utilizan estos promedios móviles Image y Image para escalar la learning rate individualmente para cada parámetro. La forma en que se hace en Adam es simple, para realizar una actualización de weights hacemos lo siguiente:

Image

      Donde Wt es una matriz weights y la η es el tamaño del step (Zhang, Ma, Li y Wu, 2017).

      2.4 Impacto de las noticias positivas

      Para poder validar la hipótesis se decidió usar el test PANAS (Positive and Negative Affect Schedule).

      Fue desarrollado en 1988 por Watson, Clark y Tellegen con el objetivo de medir de una forma más pura el efecto negativo o positivo de algún evento en específico (Watson, Clark y Tellegen, 1988). En un inicio el test PANAS contaba con 60 ítems (sentimientos) para determinar el sentimiento negativo o positivo, pero luego se realizó una reducción de la lista, basada en el coeficiente de importancia, y al final se obtuvieron 20 ítems, 10 para el sentimiento negativo y 10 para el sentimiento positivo (Watson, Clark y Tellegen, 1988).

      Los resultados de este cuestionario fueron alentadores, porque fueron acertados, presentando los siguientes porcentajes: para la escala de sentimiento positivo, el coeficiente alfa de Cronbach (Cronbach, 1951) fue de 0,86 a 0,90; para la escala de sentimiento negativo, 0,84 a 0,87 (Watson, Clark y Tellegen, 1988).

      3. RESULTADOS

      3.1 Validación del modelo LSTM

      Luego de haber implementado el modelo, se probó su eficacia utilizando el método de validación cruzada k-folds con un k=10 (Kohavi, 1995). Los resultados fueron los siguientes:

      Tabla 2

      Resultados de la validación cruzada k-folds

Validación cruzada k-folds (k=10)
Folds (k)Accuracy
186,56 %
285,36 %
386,85 %
489,37 %
588,29 %
685,67 %
789,95 %
891,51 %
988,30 %
1087,92 %
Promedio: 87,98 %

      Elaboración propia

      Para comparar la efectividad del modelo se implementaron otros dos métodos que también son usados en la actualidad:

      1) Naive Bayes

      2) Red neuronal recurrente (RNN)

      El método usado para la validación, por consistencia, fue el de validación cruzada k-folds (k=10).

       1) Naive Bayes

      Tabla 3

      Resultados de la validación cruzada k-folds

Validación cruzada k-folds (k=10)
Folds (k)Accuracy
179,89 %
283,25 %
379,28 %
481,59 %
583,17 %
679,03 %
779,98 %
880,55 %
981,71 %
1082,99 %
Promedio: 81,14 %

      Elaboración propia

       2) Red neuronal recurrente RNN

      Tabla 4

      Resultados de la validación cruzada k-folds

Validación cruzada k-folds (k=10)
Folds (k)Accuracy
182,79 %
281,90 %
383,58 %
481,27 %
582,90 %
683,51 %
784,95 %
880,11 %
982,76 %
1080,56 %
Promedio: 82,43 %

      Elaboración propia

      Luego de ver estos resultados, se puede afirmar que el modelo propuesto, una variación de la red neuronal recurrente LSTM tiene un mejor accuracy que el método de Naive Bayes y la red neuronal recurrente.

      3.2 Procedimiento experimental

       Test PANAS

      Para validar la hipótesis se realizó un experimento basado en encuestas, con la participación de 520 personas de edades diferentes (entre 20-45 años) y de diferentes géneros (320 mujeres, 200 hombres). La encuesta se realizó antes y después de haber leído las noticias. La muestra se dividió de la siguiente forma:

Image

      Después de haber realizado las encuestas, los resultados fueron los siguientes:

Image

      4. CONCLUSIONES

      Luego de haber realizado este reporte, implementando tanto el modelo de LSTM, para poder clasificar las noticias escritas en español en positivas o negativas, como el test de PANAS, con una población variada para poder determinar el efecto de las noticias positivas en ellas, se pueden concluir dos grandes puntos:

      a) El modelo propuesto basado en las redes neuronales LSTM cuenta con un accuracy del 87,98 %, esto es bueno comparado con el método de Naive Bayes y la red neuronal recurrente.

      b) Los resultados del test de PANAS nos demuestran que todas las personas que han leído las noticias positivas han mejorado su estado de ánimo.

      5.