Preparação e Análise Exploratória de Dados
Autor: Leonardo Torres Marques , Rafael Gastão Coimbra Ferreira , Leandro Botelho Alves de Miranda , Rafael Albuquerque Pinto , Lucas Rafael Costella Pessutto , Mariana Araújo Pereira , Ana Luiza Cerchiari de Andrade
LIVRO IDEAL PARA
Alunos de graduação em Tecnologia em Big Data e Inteligência Analítica
SOBRE O LIVRO
Neste livro, você conhecerá os conceitos relacionados à análise exploratória de dados, suas etapas e importância, quando realizada antes de o conjunto de dados ser submetido a uma análise mais profunda, por meio de técnicas e ferramentais de investigação. Você também estudará sobre a linguagem Python e suas bibliotecas, a fim de analisar dados usando técnicas de estatística descritiva, bem como conhecerá análises uni e multivariadas e o relacionamento entre elas. Para isso, serão apresentados problemas e lições sobre componentes visuais e como implementá-los usando também a linguagem Python.
Resumo
As empresas cada vez mais procuram armazenar um grande volume de dados, e, para isso, novas tecnologias de armazenamento vêm surgindo e ganhando espaço, permitindo a representação de uma grande variedade de informações ditas não estruturadas, isto é, não necessariamente com um formato único de representação e de uma única origem. Essas tecnologias também permitem a manipulação de dados e, consequentemente, o seu cruzamento, gerando uma nova ciência de dados. Entretanto, essa ciência também é baseada no valor gerado pelos métodos estatísticos e algoritmos, que ajudam na descoberta de padrões nos dados. Portanto, o segredo de uma análise de dados eficiente é, por meio de uma análise exploratória desses dados, realizar uma atividade de observação mais de uma vez e por diferentes perspectivas — o que você poderá ver em detalhes nesta obra.
Referência
FERREIRA, R. G. C. et al. Preparação e análise exploratória de dados. Porto Alegre: SAGAH, 2021.
Informações técnicas
eBook
Formato ePDF
Páginas 284
ISBN 9786556902890
Ano 2021
Equipe técnica
Jean Paul Barddal, Doutor em Informática
Sumário
Análise exploratória de dados
Estatística descritiva usando Pandas e Numpy
Análise univariada de dados
Histogramas com Seaborn
Box-plots com Seaborn
Análise multivariada de dados
Gráficos de dispersão com Seaborn
Gráficos de barras com Seaborn
Gráficos de densidade com Seaborn
Relações pareadas usando grids com Seaborn
Codificação visual: cores, formas, tamanhos e escala com Seaborn
Correlações usando Pandas, Numpy e Seaborn
Tratamento de valores faltantes em Pandas
Normalização de dados usando Pandas, Numpy e Scikit-learn
Discretização de dados usando Pandas e Numpy
Tratando outliers em Pandas e Numpy