Desafio referente ao módulo: Regressão Linear Múltipla
Introdução
Faaala Dev,
Nesse desafio você reforçará de forma prática os conceitos que aprendemos nesse módulo.
Como se trata de um desafio, ele necessita de alguns conhecimentos além dos abordados nesse módulo, então é importante ter autonomia para conseguir pesquisar essas coisas caso não saiba como resolver. Por isso, lembre-se, tenha calma e acredite no seu processo.
O aprendizado daqui é muito importante e com certeza você conseguirá sair com muito conhecimento bacana 💜
Sobre o desafio
O objetivo deste exercício é construir um modelo de machine learning capaz de prever o valor do aluguel de um imóvel com base em suas características. Através da análise de um dataset de imóveis, você irá:
- Explorar os dados: Realizar uma análise exploratória dos dados para entender a distribuição das variáveis, identificar possíveis outliers e correlações.
- Preparar os dados: Limpar os dados, tratar valores ausentes e codificar variáveis categóricas.
- Construir um modelo: Utilizar um algoritmo de regressão linear para construir um modelo que relacione as características do imóvel com o valor do aluguel.
- Avaliar o modelo: Avaliar a performance do modelo utilizando métricas adequadas e analisar os resíduos para verificar a qualidade das previsões.
- Interpretar os resultados: Analisar os coeficientes do modelo para entender a importância de cada variável na previsão do valor do aluguel.
Etapas:
- Carregar e explorar o dataset: Carregue o arquivo CSV fornecido e explore os dados utilizando as funções do pandas.
- Pré-processamento: Realize as seguintes tarefas:
- Identifique e trate valores ausentes.
- Remova outliers.
- Codifique as variáveis categóricas.
- Escale as variáveis numéricas (se necessário).
- Construção do modelo:
- Divida os dados em conjuntos de treino e teste.
- Crie um pipeline para pré-processar os dados e treinar o modelo de regressão linear.
- Treine o modelo utilizando o conjunto de treino.
- Avaliação do modelo:
- Faça previsões sobre o conjunto de teste.
- Calcule métricas de desempenho (R², MAE, RMSE).
- Analise os resíduos para verificar a qualidade do modelo.
- Interpretação dos resultados:
- Analise os coeficientes do modelo para entender a importância de cada variável.
- Discuta as limitações do modelo e sugira possíveis melhorias.