O fenômeno apontado como a quarta revolução industrial e também conhecido como Big Data está trazendo mudanças profundas no mundo em que vivemos.
Ainda é difícil fazer previsões precisas de como o fenômeno vai afetar nossas vidas e nosso mundo, mas sabendo que Big Data vai afetar sua vida pessoal, sua casa, seu carro, seu emprego, sua saúde, suas amizades, sua alimentação, seu sono e até seu lazer.
Dados produzidos em grande escala, com velocidade e variedade nunca antes imaginados e que a tecnologia atual tem dificuldade para armazenar e processar.
Você ouve falar de Big Data todos os dias!
Mas do que adianta uma montanha de dados se não formos capazes de extrair valor?
Big Data vai mudar a forma como uma indústria produz, como um avião voa, como se planta um alimento, como se trata uma doença, como anunciar um produto e até como ir a Marte. Por trás deste fenômeno está o dado eletrônico, que se por um lado a poucas décadas era produzido por alguns poucos equipamentos e tinha um alto custo de armazenamento, hoje é produzido em tudo que é lugar e o custo de armazená-lo é muito baixo, e a cada dia fica mais barato.
Como o dado é produzido?
Como é armazenado?
De que forma é consumido?
Como extrair informação e conhecimento?
Como tratar aspectos de segurança e privacidade?
Esta obra traz uma introdução ao mundo do dado, em um estudo que vem desde sua geração ao descarte, com ênfase especial na sua análise.
Esta obra está dividida em duas grandes partes: A primeira parte é uma introdução ao mundo da Ciência de Dados e Big Data, abordando questões que envolvem os modelos pré-relacionais, relacionais e pós-relacionais, como NoSQL, processos de transformação de dados, armazenamento analítico, como o Data Warehouse, e HDFS, sem deixar de tratar de maneira clara a Mineração de Dados e outras técnicas analíticas.
A segunda parte é prática, onde o leitor pode implementar os conceitos estudados, desenvolvendo diversas técnicas de análise de dados como Classificação,Agrupamentos, Lei de Benford, entre outras.