METODOLOGÍA ~ Analítica de la web

Para la metodología propuesta, se piensa usar una base de datos que se encuentra en aquí y se realizará el preprocesamiento de la misma eliminando caracteres especiales, ¿stop words?. Seguido, se realiza la tokenización por tweets para formar vectores característicos para cada palabra. Para cada palabra tokenizada, se transformará las palabras en vectores númericos con one hot-encoder y finalmente se obtendrá las palabras lexicas con referencia a la depresión para hallar su probabilidad. Estos valores serán entrenados con los modelos de clasificación basados en Machine Learning / Deep Learning, obteniendo sus medidas correspondientes y determinando su resultado correspondiente.