Pandas Python: Data Wrangling para Ciência de Dados

Pandas Python: Data Wrangling para Ciência de Dados

Eduardo Corrêa
5.0 / 5.0
0 comments
你有多喜歡這本書?
文件的質量如何?
下載本書進行質量評估
下載文件的質量如何?

Ciência de dados é um processo que emprega técnicas estatísticas e computacionais para analisar grandes bases de dados. A etapa de pré-processamento, onde as bases de dados relevantes devem ser reunidas e adequadamente formatadas, costuma ser a mais trabalhosa, ocupando tipicamente 80% do tempo consumido. É nesta fase que são realizadas as tarefas de seleção, limpeza e transformação dos dados, comumente referenciadas como atividades de Data Wrangling, Data Munging ou Data Preparation. A biblioteca pandas foi especialmente projetada para oferecer o suporte ao processo de Data Wrangling e ela já se consolidou como a biblioteca para ciência de dados mais utilizada no ambiente Python.

Neste livro, Eduardo Corrêa aborda a pandas sob uma perspectiva profissional, explicando como utilizá-la para resolver problemas práticos e, muitas vezes, difíceis de Data Wrangling. Você aprenderá a teoria com um projeto prático, que envolve o uso da pandas como ferramenta para viabilizar a execução das atividades de seleção, estudo, limpeza e transformação de uma base de dados real. O projeto mostrará o passo a passo para realizar o pré-processamento desta base de dados, que será então utilizada como fonte para a criação de um modelo de Machine Learning, mais especificamente, um modelo de classificação de dados.

年:
2020
出版商:
Casa do Código
語言:
portuguese
頁數:
223
ISBN 10:
8572540504
ISBN 13:
9788572540506
文件:
PDF, 1.27 MB
IPFS:
CID , CID Blake2b
portuguese, 2020
線上閱讀
轉換進行中
轉換為 失敗

最常見的術語