- Autor: Ricardo Moya García, PhD
- Fecha última actualización: 24-11-2021
En este proyecto de GitHhub podrás encontrar parte del material que utilizo para impartir las clases de Procesamiento de Lenguaje Natural con Python.
El contenido compartido es el siguiente:
- Conceptos: Corpus, Bag of Words (BoW), Tokenización, N-Grammas, Stemming, Lematización, Stop-Words, Parts of Speech, Named Entity Recognition (NER)
- Normalización de textos: Preprocesamiento
- Introducción: Clasificación de textos con Naive Bayes
- Clasificación de textos: Algoritmos de aprendizaje para la clasificación
- 09_Scikit_Clasificacion_Textos.ipynb
- 11_NLTK_Scikit_Clasificacion_Textos.ipynb
- 13_PoC_Tendencias_Politicas_Twitter_Generacion_Exportacion_Modelos.ipynb
- 14_PoC_Tendencias_Politicas_Twitter_Prediccion.ipynb
- Clasificación de textos: Redes Neuronales
- 15_Keras_MLP_Clasificacion_Textos.ipynb
- 16_Keras_MLP_Tendencias_Politicas_Twitter.ipynb
- 17_Keras_LSTM_Tendencias_Politicas_Twitter.ipynb
- LSI: Latent Semantic Index
- LDA: Latent Dirichlet Allocation
- 20_LDA_Ejemplo_Basico_Topic_Modeling.ipynb
- 21_Topic_Modeling_noticias.ipynb
- 22_Topic_Modeling_Tweets_Politica.ipynb
Para ejecutar los scripts y notebooks de este proyecto es necesario tener creado un entorno virtual con conda (también puede ser con un virtualenv), en el que a parte de tener instaladas las librerías que te instala anaconda por defecto al crear el entorno (numpy, scipy, pandas, matplotlib, scikit, etc) hay que instalar una serie de librerías específicas que se indican en el fichero requirements.txt.
A continuación se muestran los pasos a seguir para crear el entorno virtual con conda por medio de una consola:
Nota: estos mismos pasos pueden realizarse también por medio del Anaconda Navigator.
- Pasos para la creación de un Virtualenv con conda e instalación de las librerías necesarias
1.- Creación del entorno virtual "Python37_NLP" con un python 3.7
>> conda create -n Python37_NLP python=3.7 anaconda
2.- Activar el entorno virtual
>> conda activate Python37_NLP
3.- Instalar librerías especificadas en el fichero requirements.txt:
>> pip install -r requirements.txt
- En caso de tener algún problema con la instalación de alguna de las librerías, proceder a instalar la librería manualmente de la siguiente manera:
>> pip install nombre_libreria==VERSION
A continuación se muestran algunas acciones extra:
1.- Desinstalar librerías con conda y pip respectivamente:
>> pip uninstall nombre_libreria
2.- Desactivar el entorno virtual (previamente tiene que estar activado)
>> conda deactivate
3.- Eliminar entorno virtual (llamado "Python37_NLP")
>> conda remove -n Python37_NLP -all