Adam utiliza los gradientes elevados al cuadrado para escalar la velocidad de aprendizaje como el algoritmo RMSprop (Tieleman y Hinton, 2012) y aprovecha el impulso al usar la media móvil de los gradientes en lugar de solo la gradiente como el algoritmo stochastic gradient descent.
Para estimar los momentos, Adam utiliza promedios móviles exponenciales, calculados en el gradiente evaluado en un minilote actual:
Donde mt y vt son los promedios móviles, g es la gradiente del minilote actual y los β son los hiperparámetros del algoritmo. Ambos tienen un valor default de 0,9 y 0,999, respectivamente
La fórmula para obtener el promedio móvil mt también puede ser representada por la siguiente ecuación:
Después de esto se necesita realizar un paso llamado “bias correction”, esto quiere decir que se necesita corregir el valor inicial de mt y vt, para ello se realizan las siguientes transformaciones:
Para finalizar, se utilizan estos promedios móviles
Donde Wt es una matriz weights y la η es el tamaño del step (Zhang, Ma, Li y Wu, 2017).
2.4 Impacto de las noticias positivas
Para poder validar la hipótesis se decidió usar el test PANAS (Positive and Negative Affect Schedule).
Fue desarrollado en 1988 por Watson, Clark y Tellegen con el objetivo de medir de una forma más pura el efecto negativo o positivo de algún evento en específico (Watson, Clark y Tellegen, 1988). En un inicio el test PANAS contaba con 60 ítems (sentimientos) para determinar el sentimiento negativo o positivo, pero luego se realizó una reducción de la lista, basada en el coeficiente de importancia, y al final se obtuvieron 20 ítems, 10 para el sentimiento negativo y 10 para el sentimiento positivo (Watson, Clark y Tellegen, 1988).
Los resultados de este cuestionario fueron alentadores, porque fueron acertados, presentando los siguientes porcentajes: para la escala de sentimiento positivo, el coeficiente alfa de Cronbach (Cronbach, 1951) fue de 0,86 a 0,90; para la escala de sentimiento negativo, 0,84 a 0,87 (Watson, Clark y Tellegen, 1988).
3. RESULTADOS
3.1 Validación del modelo LSTM
Luego de haber implementado el modelo, se probó su eficacia utilizando el método de validación cruzada k-folds con un k=10 (Kohavi, 1995). Los resultados fueron los siguientes:
Tabla 2
Resultados de la validación cruzada k-folds
Validación cruzada k-folds (k=10) | |
Folds (k) | Accuracy |
1 | 86,56 % |
2 | 85,36 % |
3 | 86,85 % |
4 | 89,37 % |
5 | 88,29 % |
6 | 85,67 % |
7 | 89,95 % |
8 | 91,51 % |
9 | 88,30 % |
10 | 87,92 % |
Promedio: 87,98 % |
Elaboración propia
Para comparar la efectividad del modelo se implementaron otros dos métodos que también son usados en la actualidad:
1) Naive Bayes
2) Red neuronal recurrente (RNN)
El método usado para la validación, por consistencia, fue el de validación cruzada k-folds (k=10).
1) Naive Bayes
Tabla 3
Resultados de la validación cruzada k-folds
Validación cruzada k-folds (k=10) | |
Folds (k) | Accuracy |
1 | 79,89 % |
2 | 83,25 % |
3 | 79,28 % |
4 | 81,59 % |
5 | 83,17 % |
6 | 79,03 % |
7 | 79,98 % |
8 | 80,55 % |
9 | 81,71 % |
10 | 82,99 % |
Promedio: 81,14 % |
Elaboración propia
2) Red neuronal recurrente RNN
Tabla 4
Resultados de la validación cruzada k-folds
Validación cruzada k-folds (k=10) | |
Folds (k) | Accuracy |
1 | 82,79 % |
2 | 81,90 % |
3 | 83,58 % |
4 | 81,27 % |
5 | 82,90 % |
6 | 83,51 % |
7 | 84,95 % |
8 | 80,11 % |
9 | 82,76 % |
10 | 80,56 % |
Promedio: 82,43 % |
Elaboración propia
Luego de ver estos resultados, se puede afirmar que el modelo propuesto, una variación de la red neuronal recurrente LSTM tiene un mejor accuracy que el método de Naive Bayes y la red neuronal recurrente.
3.2 Procedimiento experimental
Test PANAS
Para validar la hipótesis se realizó un experimento basado en encuestas, con la participación de 520 personas de edades diferentes (entre 20-45 años) y de diferentes géneros (320 mujeres, 200 hombres). La encuesta se realizó antes y después de haber leído las noticias. La muestra se dividió de la siguiente forma:
Después de haber realizado las encuestas, los resultados fueron los siguientes:
4. CONCLUSIONES
Luego de haber realizado este reporte, implementando tanto el modelo de LSTM, para poder clasificar las noticias escritas en español en positivas o negativas, como el test de PANAS, con una población variada para poder determinar el efecto de las noticias positivas en ellas, se pueden concluir dos grandes puntos:
a) El modelo propuesto basado en las redes neuronales LSTM cuenta con un accuracy del 87,98 %, esto es bueno comparado con el método de Naive Bayes y la red neuronal recurrente.
b) Los resultados del test de PANAS nos demuestran que todas las personas que han leído las noticias positivas han mejorado su estado de ánimo.
5.