Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Projeto Guiado II #18

Open
wants to merge 1 commit into
base: main
Choose a base branch
from
Open
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
452 changes: 452 additions & 0 deletions exercicios/para-casa/ProjetoGuiadoII/ETL_ProjetoGuiado.ipynb

Large diffs are not rendered by default.

58 changes: 58 additions & 0 deletions exercicios/para-casa/ProjetoGuiadoII/README.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,58 @@
# Projeto Guiado II🏠

# Introdução
O projeto realiza uma análise exploratória de um conjunto de dados que detalha os hábitos de leitura de diferentes indivíduos.
O objetivo principal é identificar padrões e tendências relacionadas à quantidade de livros lidos e a idade, contextualizando também outras características como sexo, educação e raça.

Linguagem utilizada: Python
Bibliotecas Utilizadas:
pandas: Para manipulação e análise de dados.
numpy: Para operações numéricas.
matplotlib: Para visualização de dados através de gráficos.
seaborn: Para criação de gráficos estatísticos.

***Turma:*** Reprograma On33

**Orientação:** Profa. Stefany Gracy

**Autoras:** Hitawana Araújo e Nathália Pereira

**Dataset utilizado:** Global Mental Health Disorders

**Fonte de dados:** [Kaggle](https://www.kaggle.com/datasets/thedevastator/global-mental-health-disorders)

**Escolha dos dados:** Amantes de leitura, as autoras escolheram o dataset com a curiosidade a respeito dos hábitos de leitura de uma determinada população. Os dados para análise referem-se a informações amostrais de pesquisa com estadunidenses.

O dataset utilizado foi escolhido por conter informações de Gênero, Raça, Idade e Educação, possibilitando uma análise mais completa do perfil dos leitores e relacões sociais de prevalência de determinados grupos.



# Funcionalidades Principais:

Limpeza e preparação de dados.
Criação de gráficos para visualização de tendências e padrões.
Análise de distribuição por características demográficas.

# Arquivos

Esse projeto inclui:

- *reading_habits.csv:* dataset utilizado para as análises
- *ETL_ProjetoGuiado.ipynb*: relatório contendo códigos e gráficos sobre dados utilizados para subsidiar a análise.
- *SQL_ProjetoGuiado.ipynb*: código de criação e edição em sql para consultas que validem o teste de hipótese.
- *README.md*

# Funções principais:

- age_range: Comparar dois grupos específicos de leitores (jovens e idosos) em relação à leitura de e-books.
- gender_reader: feita para calcular a média de livros lidos por diferentes gêneros e visualizá-la em um gráfico de barras horizontal.
- biggest_readers: Identifica aqueles que leram mais livros nos últimos 12 meses e examina a distribuição de suas características como educação.
- ttest_ind é usada para calcular a estatística t (estatistica_t) e o valor p (valor_p).



Consulta SQL:

- Contagem: Conta o número de leitores de e-books (coluna Ebook_readers) que responderam "Yes".
- Filtro por idade: Apenas os leitores com idade acima de 60 anos são incluídos.
- Execução e impressão: O resultado da consulta é carregado em um DataFrame Readers_60_age e exibido.
105 changes: 105 additions & 0 deletions exercicios/para-casa/ProjetoGuiadoII/SQL_ProjetoGuiado.ipynb
Original file line number Diff line number Diff line change
@@ -0,0 +1,105 @@
{
"cells": [
{
"cell_type": "code",
"execution_count": 7,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"Readers of ebook 50-60 years old\n",
" Ebook readers\n",
"0 186\n",
"\n",
" No Readers of ebook 50-60 years old\n",
" Ebook readers\n",
"0 489\n",
"Readers of ebook 18-30 years old\n",
" Ebook readers\n",
"0 181\n",
"\n",
"No Readers of ebook 18-30 years old\n",
" Ebook readers\n",
"0 402\n"
]
}
],
"source": [
"import pandas as pd\n",
"import sqlite3\n",
"\n",
"#importação dataframe e renomeando colunas\n",
"df = pd.read_csv('./reading_habits.csv')\n",
"df.rename(columns={'Read any e-books during last 12months?': 'Ebook_readers', 'Age Range': 'Age_Range'}, inplace=True)\n",
"\n",
"# conexão \n",
"conn = sqlite3.connect('reading_habits.db')\n",
"\n",
"#escrever o df em uma tabela sql\n",
"df.to_sql('reading_habits', conn, index=False, if_exists='replace') \n",
"\n",
"#executar a consulta \n",
"query_sql = \"\"\"\n",
"SELECT COUNT(Ebook_readers) AS 'Ebook readers'\n",
"FROM reading_habits\n",
"WHERE Ebook_readers = 'Yes' and Age >= 60\n",
"\"\"\"\n",
"\n",
"query_sql2 = \"\"\"\n",
"SELECT COUNT(Ebook_readers) AS 'Ebook readers'\n",
"FROM reading_habits\n",
"WHERE Ebook_readers = 'No' and Age >= 60\n",
"\"\"\"\n",
"\n",
"query_sql3 = \"\"\"\n",
"SELECT COUNT(Ebook_readers) AS 'Ebook readers'\n",
"FROM reading_habits\n",
"WHERE Ebook_readers = 'Yes' and Age <= 30\n",
"\"\"\"\n",
"query_sql4 = \"\"\"\n",
"SELECT COUNT(Ebook_readers) AS 'Ebook readers'\n",
"FROM reading_habits\n",
"WHERE Ebook_readers = 'No' and Age <= 30\n",
"\"\"\"\n",
"\n",
"Readers_60_age = pd.read_sql_query(query_sql, conn)\n",
"print('Readers of ebook 50-60 years old\\n', Readers_60_age)\n",
"\n",
"No_Readers_60_age = pd.read_sql_query(query_sql2, conn)\n",
"print('\\n No Readers of ebook 50-60 years old\\n',No_Readers_60_age)\n",
"\n",
"Readers_20_age = pd.read_sql_query(query_sql3, conn)\n",
"print('Readers of ebook 18-30 years old\\n', Readers_20_age)\n",
"\n",
"No_Readers_20_age = pd.read_sql_query(query_sql4, conn)\n",
"print('\\nNo Readers of ebook 18-30 years old\\n',No_Readers_20_age)\n",
"\n",
"#fechar a conexão\n",
"conn.close()"
]
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.12.4"
}
},
"nbformat": 4,
"nbformat_minor": 2
}
Loading