Desafio Titanic - CIT Einstein: análise dos dados do desastre do Titanic
- Cálculo das probabilidade:
- Respostas:
- Análise por gráficos:
- Comentários: (gráficos sobreviventes totais, homens e mulheres)
- Comentários: (gráfico sobreviventes em relação sexo)
- Verificando cruzamento dos dados entre a Classe dos tickets, Sexo e Sobreviventes:
- Comentários:(Classe dos Tickets cruzado com Sobreviventes)
- Comentários:(Classe dos Tickets e Sexo cruzado com Sobreviventes)
- Conclusão (Parte - 1):
- Algoritmos de Predição:
- Coméntarios:(Modelo 1 - preditivo simples)
- Scikit - Learn (usando a biblioteca sklearn)
- Análise tripulação
- Levando em consideração mais categorias
- Análise mulheres e homens
- Comentários:Resultados modelos preditivos:
- Conclusão geral:
O objetivo é fazer um modelo que prediz, dado as informações do passageiro, se ele morreu ou não no Titanic. Você está livre para usar qualquer ferramenta (python, R, weka, excel, etc) e algoritmo para fazer o modelo (regressão logística, knn, árvore de decisão, random forest, xgboost, rede neural, etc). O dataset do Titanic relaciona os passageiros e algumas de suas informações com sua morte no acidente. A análise exploratória dos dados é uma grande ferramenta para entender os dados. Então queremos que você também faça um pouco disso, respondendo as seguintes perguntas:
- Qual a porcentagem de homens e mulheres no navio?
- Dos que morreram, qual é a porcentagem de homens e mulheres?
- Qual modelo eu tenho uma acurácia maior (porcentagem de acerto), um que fala que toda mulher morreu ou um que fala que toda mulher sobreviveu?