Neste projeto você encontrará uma análise de dados sobre os títulos produzidos pela Netflix no ano de 2019. As etapas do projeto são a preparação dos dados, filtragem e limpeza e a visualização dos dados com criação de gráficos e nuvens de palavras utilizando as bibliotecas Numpy, Pandas e Matplotlib .
Com análise teremos:
- Relação entre Filmes e Séries
- Relação entre as faixa etária
- Top 5 generos e Top 5 diretores
- Nuvem de palavras
O processo de análise foi baseado em 3 etapas principais:
- 1º Obtenção dos dados na plataforma Kaggle ;
- 2º Filtragem e limpeza dos dados e criação dos dataframes para realizar a análise;
- 3º Criação dos gráficos com a biblioteca Seaborn e Nuvem de palavras com a biblioteca Wordcloud.
O dados com a base de dados da copa foram obtidos no site Kaggle e inspirandos pelo seguinte tutoriais:
1º https://www.kaggle.com/code/chirag9073/netflix-data-analysis
2º https://www.kaggle.com/code/jatinsahani/netflix-data-analysis/notebook
- Python, Pandas, Numpy, Plotly & Matplotlib;
- Visual Studio Code;
- Excel.
1º Gráfico: Relação entre a quantidade de filmes e séries produzidos
2º Gráfico: Relação do Rating(Faixa Etária) com a quantidade produzida
3º Gráfico: Nuvem de palavras dos países com as maiores produção