Python Nordeste 2023

Python Nordeste 2023

Uma "cipuada" de python para Mineração de Texto
23/09/2023 , Laboratório 2

Alô Pythoníacos nordestinos!! Uma introdução de diversas técnicas de Mineração de Texto utilizando o python! Passaremos por diversas ferramentas e processamento na estruturação dos dados. Além disso, será apresentado algumas problemáticas envolvendo análise de sentimento de texto, extração de formação e sumarização automática de texto.


Este tutorial fornecerá uma introdução prática à Mineração de Texto utilizando Python. Durante a sessão, os participantes terão a oportunidade de mergulhar no mundo fascinante do processamento de linguagem natural e aprender como extrair informações valiosas de textos não estruturados.

O tutorial começará com uma visão geral da Mineração de Texto e sua importância no contexto atual, onde grandes volumes de dados de texto estão disponíveis em diversas áreas, como redes sociais, blogs, artigos científicos e muito mais. Em seguida, os participantes serão apresentados a algumas bibliotecas essenciais em Python, como NLTK (Natural Language Toolkit) e spaCy, que serão utilizadas ao longo do tutorial.

A primeira parte do tutorial se concentrará nas etapas fundamentais de pré-processamento de texto. Os participantes aprenderão como limpar e normalizar os textos, realizando tarefas como tokenização, remoção de stopwords, stemming e lematização. Serão discutidas as principais técnicas e melhores práticas para garantir a qualidade e a consistência dos dados.

Em seguida, os participantes explorarão técnicas avançadas de análise de texto. Serão apresentados algoritmos de extração de informações, como reconhecimento de entidades nomeadas e detecção de relações entre entidades. Serão demonstradas as capacidades do Python para realizar análise de sentimento, permitindo que os participantes classifiquem textos em categorias como positivo, negativo ou neutro. Além disso, serão abordadas técnicas de detecção de tópicos, permitindo que os participantes agrupem textos em categorias semelhantes.

Na última parte do tutorial, será explorada a sumarização automática de texto. Os participantes aprenderão a extrair as informações mais relevantes de textos longos e a apresentá-las de forma concisa e resumida. Serão apresentados algoritmos populares, como o TextRank, e será mostrado como aplicá-los em conjuntos de dados de texto reais.

Ao longo do tutorial, serão fornecidos exemplos práticos e exercícios para permitir que os participantes apliquem os conceitos e as técnicas aprendidas. Além disso, serão compartilhadas dicas e truques úteis para enfrentar os desafios comuns encontrados durante a Mineração de Texto.

Ao final do tutorial, os participantes terão uma sólida compreensão dos principais conceitos e técnicas de Mineração de Texto com Python. Eles estarão prontos para aplicar esse conhecimento em seus próprios projetos de IA, análise de dados e pesquisa, aproveitando o poder da linguagem natural para extrair insights valiosos dos textos disponíveis.

Não são necessários conhecimentos prévios em Mineração de Texto, mas é recomendado que os participantes tenham alguma familiaridade com Python e noções básicas de processamento de dados. Venha se juntar a nós neste tutorial e explore o vasto potencial da Mineração de Texto com Python!