El análisis de sentimientos es una técnica de procesamiento del lenguaje natural que se utiliza para determinar si los datos son positivos, negativos o neutrales. El análisis de sentimiento a menudo se realiza en datos textuales para ayudar a las empresas a monitorear el sentimiento de marca y producto en los comentarios de los clientes y comprender sus necesidades.

En el artículo de hoy, vamos a hablar sobre cinco proyectos de análisis de sentimientos desconocidos en Github y que podrás aplicar en tus proyectos de NLP para mejorar tus habilidades en el campo de la data science y el machine learning.

Nota: En este artículo, vamos a hablar sobre algunos proyectos de análisis de sentimiento de código abierto “low ball” pero realmente buenos que puedes utilizar en tus proyectos. Para leer más sobre cada uno de ellos, recomiendo seguir el enlace que se proporciona junto con el proyecto.

Tabla de contenidos

Bonus

Awesome Sentiment Analysis: una lista seleccionada de métodos, implementaciones y misceláneos de análisis de sentimientos.

El objetivo de este repositorio es proporcionar enlaces adecuados para los académicos que deseen investigar en este campo; y al mismo tiempo, ser lo suficientemente accesible para los desarrolladores que quieran integrar el análisis de sentimientos en sus aplicaciones.

Repositorio de Github

Tener un buen conocimiento teórico es asombroso, pero implementarlos en código en un proyecto de machine learning en tiempo real es algo completamente diferente. Es posible que obtengas resultados diferentes e inesperados basados en diferentes problemas y conjuntos de datos. Entonces, como bonificación, también estoy agregando los enlaces a los diversos cursos que me han ayudado mucho en mi viaje para aprender ciencia de datos y aprendizaje automático. Personalmente soy fanático de DataCamp, comencé desde él y sigo aprendiendo a través de DataCamp y sigo haciendo nuevos cursos. En serio, tienen algunos cursos emocionantes. Échales un vistazo.

  1. Data-scientist-with-python
  2. Data-scientist-with-r
  3. Machine-learning-scientist-with-r
  4. Machine-learning-scientist-with-python
  5. Machine-learning-for-everyone
  6. Data-science-for-everyone
  7. Data-engineer-with-python
  8. Data-analyst-with-python

1. Análisis de sentimiento de Twitter

Github

Twitter Sentiment Analysis es una utilidad de lenguaje natural general para el análisis de sentimientos en tweets usando Naive Bayes, SVM, CNN, LSTM, etc.

Usan y comparan varios métodos diferentes para el análisis de sentimientos en tweets (un problema de clasificación binaria). Se espera que el conjunto de datos de entrenamiento sea un archivo csv de tipo tweet_id, sentimiento, tweet donde el tweet_id es un número entero único que identifica el tweet, el sentimiento es 1 (positivo) o 0 (negativo) y el tweet es el tweet entre “” . De manera similar, el conjunto de datos de prueba es un archivo csv de tipo tweet_id, tweet. Ten en cuenta que no se esperan encabezados csv y deben eliminarse de los conjuntos de datos de entrenamiento y prueba.

Hay algunos requisitos de biblioteca generales para el proyecto y algunos que son específicos de métodos individuales. Los requisitos generales son los siguientes.

  • Numpy
  • scikit-learn
  • scipy
  • nltk

Los requisitos de biblioteca específicos de algunos métodos son:

  • keras con backend de TensorFlow para regresión logística, MLP, RNN (LSTM) y CNN.
  • xgboost para XGBoost.

Nota: se recomienda utilizar la distribución Anaconda de Python.

2. Análisis del sentimiento de Pytorch

Github

Pytorch Sentiment Analysis, un repositorio que contiene tutoriales que cubren cómo realizar análisis de sentimientos usando PyTorch1.7 y Torchtext 0.8 usando Python 3.8.

Los primeros 2 tutoriales cubrirán cómo comenzar con el enfoque de facto para el análisis de sentimientos: redes neuronales recurrentes (RNN). El tercer cuaderno cubre el modelo FastText y el final cubre un modelo de red neuronal convolucional (CNN).

También hay 2 cuadernos extra de “appendix”. El primero cubre la carga de tus propios conjuntos de datos con TorchText, mientras que el segundo contiene una reflexión a las words embeddings previamente entrenadas proporcionadas por TorchText.

Tabla de contenido:

3. Senta

Github

Senta es una biblioteca de Python para muchas tareas de análisis de sentimientos. Contiene soporte para ejecutar múltiples tareas, como la clasificación de sentimientos a nivel de oración, la clasificación de sentimientos a nivel de aspecto y el etiquetado de roles de opinión.

La mayor parte del código de este repositorio se utiliza para implementar SKEP: Capacitación previa mejorada de conocimiento de sentimiento para el análisis de sentimiento.

En el documento, demuestran cómo integrar el conocimiento de los sentimientos en modelos previamente entrenados para aprender una representación de sentimientos unificada para múltiples tareas de análisis de sentimientos.

Puedes usar directamente el paquete Python para predecir tareas de análisis de opiniones cargando un modelo SKEP previamente entrenado.

python -m pip install Senta

o

git clone https://github.com/baidu/Senta.git  cd Senta  python -m pip install .

4. Análisis de texto con Python

Github

Text-Analytics con Python te ayuda a aprender a procesar, clasificar, agrupar, resumir, comprender la sintaxis, la semántica y el sentimiento de los datos de texto con el poder de Python. Este repositorio contiene código y conjuntos de datos utilizados en mi libro, “Análisis de texto con Python” publicado por Apress / Springer.“Text Analytics with Python” es un libro repleto de 674 páginas de información útil basada en técnicas, algoritmos, experiencias y diversas lecciones aprendidas a lo largo del tiempo en el análisis de datos de texto. Este repositorio contiene conjuntos de datos y código utilizado en este libro.

5. Análisis de sentimiento de LSTM

Github

LSTM Sentiment Analysis es un repositorio que contiene el cuaderno iPython y los datos de entrenamiento para acompañar el tutorial de O’Reilly sobre análisis de sentimientos con LSTM en Tensorflow.

Nota: Consulta el tutorial original para ejecutar este código en un entorno prediseñado en los servidores de O’Reilly con guía paso a paso, o ejecuta estos archivos en tu propio sistema.

También hay otro archivo llamado Pre-Trained LSTM.ipynb que te permite ingresar tu propio texto y ver el resultado de la red entrenada.

Para ejecutar el cuaderno iPython, necesitarás las siguientes bibliotecas:

  • TensorFlow versión 1.1 (consulte las versiones posteriores a continuación)
  • NumPy
  • Jupyter
  • Matplotlib

Si te ha gustado leer este artículo, estoy seguro de que compartimos intereses similares y estamos o estaremos en industrias similares. Así que conectemos a través de LinkedIn y Github.

¡No dudes en enviarme una invitación para conectar!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *