diff --git a/exercicios/para-casa/casa.py b/exercicios/para-casa/casa.py new file mode 100644 index 0000000..b81a145 --- /dev/null +++ b/exercicios/para-casa/casa.py @@ -0,0 +1,38 @@ +import pandas as pd +import matplotlib.pyplot as plt +from datetime import datetime + +df = pd.read_csv(r"C:/Users/Colaborador/Reprograma/on33-python-s10-pandas-numpy-II/material/Employee.csv") + +current_year = datetime.now().year # Pegar o ano atual +df['YearsAtCompany'] = current_year - df['JoiningYear'] + +df = df.drop_duplicates() +gender_group = df.groupby('Gender').size() + +print(gender_group) + +gender_group.plot(kind='bar', title='Distribuição por Gênero') +plt.xlabel('Gênero') +plt.ylabel('Número de Empregados') +plt.show() + + +age_group = df.groupby('Age').size() +print(age_group) + +age_group.plot(kind='bar', title='Distribuição por Idade') +plt.xlabel('Idade') +plt.ylabel('Número de Empregados') +plt.show() + +city_group = df.groupby('City').size() +print(city_group) + +mean_service_time_by_city = df.groupby('City')['YearsAtCompany'].mean() +print(mean_service_time_by_city) + +city_group.plot(kind='bar', title='Número de Empregados por Cidade') +plt.xlabel('Cidade') +plt.ylabel('Número de Empregados') +plt.show() diff --git a/exercicios/para-sala/aula.py b/exercicios/para-sala/aula.py index 7186a47..593a90e 100644 --- a/exercicios/para-sala/aula.py +++ b/exercicios/para-sala/aula.py @@ -1,4 +1,36 @@ import pandas as pd +<<<<<<< HEAD + +df = pd.read_csv(r"C:\Users\Colaborador\Reprograma\on33-python-s10-pandas-numpy-II\material\desenvolvimento_paises.csv") + +#print(df.describe()) +#print(df.info()) +#print(df["AveragScore"].value_counts()) + +# print (df.fillna(0, inplace=True)) +# print (df.isnull().sum()) +# print (df.duplicated().sum()) +# print (df.drop_duplicates(inplace=True)) +# print (df.duplicated().sum()) + +# pais_maior_security_value = df["SafetySecurity"].max() +# pais_menor_security_value = df["SafetySecurity"].min() + +# print(pais_maior_security_value) +# print(pais_menor_security_value) +# print("A diferença entre o maior pais com SafetySecurity é de:", pais_maior_security_value) + +# print (pais_maior_security_value) +# print (pais_menor_security_value) +# print ("A diferença entre o maior pais com SafetySecurity é de: ", pais_maior_security_value) + +# linha_maior_valor_security = df["SafetySecurity"]== pais_maior_security_value +# print (linha_maior_valor_security) + +# index_greater_value = df["SafetySecurity"].idxmax() +# print(df.loc[index_greater_value]) + +======= import matplotlib.pyplot as plt df = pd.read_csv(r"C:\Projetos\Reprograma\on33-python-s10-pandas-numpy-II\material\desenvolvimento_paises.csv") @@ -66,4 +98,5 @@ def categorizar_valores(valor): print(personel_freedom_filter.info()) print(df.sort_values(by=["Education", "Health"], inplace=True, ascending=False)) -print(df.head())np.nan \ No newline at end of file +print(df.head())np.nan +>>>>>>> 50041aaf1b397c4277ed53a9f9391bab6871415d