Add this suggestion to a batch that can be applied as a single commit.
This suggestion is invalid because no changes were made to the code.
Suggestions cannot be applied while the pull request is closed.
Suggestions cannot be applied while viewing a subset of changes.
Only one suggestion per line can be applied in a batch.
Add this suggestion to a batch that can be applied as a single commit.
Applying suggestions on deleted lines is not supported.
You must change the existing code in this line in order to create a valid suggestion.
Outdated suggestions cannot be applied.
This suggestion has been applied or marked resolved.
Suggestions cannot be applied from pending reviews.
Suggestions cannot be applied on multi-line comments.
Suggestions cannot be applied while the pull request is queued to merge.
Suggestion cannot be applied right now. Please check back later.
Turma Online 34 | Python | Semanas 17 e 18 | 2024 |
Instruções
Turma Online 34 | Python | Semanas 17 e 18 | 2024 |
Realizado o Fork do repositório https://github.com/reprograma/on34-python-s17-s18-projeto-final
Clonei o fork na minha máquina (Para isso basta abrir o seu terminal e digitar
git clone url-do -repositorio-forkado
)Add o arquivo da base de dados e o colab, bem como o README.
Commit – m : das atualizações/ alterações
Git Status: para verificação se está tudo ok
Git push: para enviar as mudanças para o repositório remoto
fonte de dados escolhida
Análise exploratória
Semana destinada a esse tipo de análise para entendimento da base.
Nessa etapa foi usado comandos da biblioteca pandas e matplotlib
Foram usados funções como:
.DataFrame é uma estrutura de dados bidimensional amplamente usada na biblioteca pandas do Python. Ele se assemelha a uma tabela (como em uma planilha do Excel ou uma tabela SQL), onde os dados são organizados em linhas e colunas.
A função value_counts() é muito usada em Pandas para contar a frequência de valores únicos em uma coluna de um DataFrame.
A função sort_index(): é utilizada para ordenar os dados de uma Series ou DataFrame de acordo com o índice.
A função groupby() do pandas é usada para agrupar dados com base em uma ou mais colunas e realizar operações agregadas, como somas, médias, contagens, etc., em cada grupo
A função crosstab() do pandas é usada para criar uma tabela de frequência cruzada entre duas ou mais colunas. Ela é útil para gerar tabelas de contingência que mostram a relação entre variáveis categóricas, como a contagem de ocorrências entre elas.
Criando uma história com dados
Conteúdo
O que é um projeto de análise de dados?
Nesse ponto vocês já aprenderam que ter dados não é a mesma coisa que ter informação.
Dados: são elementos brutos e não processados, como números, palavras, ou símbolos que precisam ser interpretados para se tornarem úteis.
Informação: é o resultado do processamento, organização e interpretação dos dados, fornecendo significado e contexto para tomar decisões ou entender situações.
Assim, dados são a matéria-prima da informação, que é o produto final após análise e interpretação dos dados.
Por isso a importância de nós contarmos uma história estruturada a partir dos dados que conseguimos coletar. E é exatamente sobre isso, que se trata um projeto de análise de dados: gerar informação útil a partir da construção de uma perspectiva contextualizada!
Então aqui vão algumas perguntas gerais que devemos nos fazer ao iniciar um projeto como esse:
Conteúdo
Compreender a percepção dos entrevistados sobre seu estado mental em relação ao tempo dedicada a telas.
Público
Projeto destinado a conclusão de curso do Análise de dados Reprograma
O conteúdo da base é relevante para compreender qual a percepção dos entrevistados frente ao uso de telas
Transformação
O conteúdo é relevante para analisar o nível de aprendizado, bem como ter acesso as informações relacionadas a base de dados
Objetivo
Saúde mental e uso de tecnologia
Escolha da Base de Dados
https://www.kaggle.com/datasets/waqi786/mental-health-and-technology-usage-dataset?resource=download
O objetivo da análise é compreender a percepção dos entrevistados sobre seu estado mental em relação ao tempo dedicada a telas.
Verificar o padrão de horas dedicadas a horas de sono e atividade física.
Verificar a percepção sobre o impacto no trabalho em relação ao uso de telas.
Base de Dados