Curso de Apache Hadoop
Porquê fazer uma formação online em Apache Hadoop? Muitas empresas decidiram implementa o Hadoop nos seus sistemas informáticos. Trata-se de uma das ferramentas do Apache que trabalha com Big Data, permitindo o desenvolvimento de aplicações de processamento paralelo (podes trabalhar com milhares de nós e petabytes de dados). Com esta especialização do curso de Big Data da Tokio School vais aprofundar os teus conhecimentos em arquitetura Hadoop e, quem sabe se a empresa que trazes debaixo de olho, não está também ela com os olhos postos em ti…
Programa do Curso de Apache Hadoop
Na Tokio School, aprender a dominar o Apache Hadoop está cada vez mais próximo da realidade. Com esta especialização em Apache Hadoop vais trabalhar com o abAarmazenamento de dados (HDFS) e o processamento de dados (MapReduce). Converter um conjunto de valores de dados num determinado formato armazenado em HDFS para novos valores de dados? Claro! Utilizar o Spark? Obviamente! Dominar todos os processos de implementação e administração de recursos que usam softwares, sites ou aplicações alojadas? Monitorizar o seu desempenho e o cumprimento das normas e a segurança? Sim! Saídas profissionais do Apache Hadoop? Muitas! Por exemplo: poderás trabalhar como arquiteto de dados, developer de Hadopp ou consultor de infraestruturas para Big Data.
Bloco 1: Introdução ao Big Data
Conceitos básicos
SQL vs NoSQL
Preparação do ambiente de trabalho
Bloco 2: Apache Hadoop (HDFS)
Conceitos básicos e arquitetura
Leitura, escrita e replicação
Permissões e exclusão de dados
Safemode, snapshots e gestão de cache
Aprofundando o shell
Bloco 3: Map reduce & Yarn
Map reduce: o algoritmo
Implementação do algoritmo map reduce
Formas de executar o algoritmo
YARN: Arquitetura, gestão de filas e Zookeeper
Bloco 4: Ecossistema Hadoop
Apache Hive
Apache Sqoop
Apache Pig
Apache Spark
Reporting com Zeppelin
Certificação IBM Data Science
Vamos preparar-te para que consigas obter a certificação Data Science da IBM. A ciência de dados é a prática de extrair conhecimento a partir de grandes quantidades de dados, utilizando métodos como estatística, aprendizagem automática, mineração de dados e análises preditivas. Esta disciplina está a revolucionar a forma como as organizações resolvem os problemas e obtêm vantagens competitivas.
Além disso, terás acesso à IBM Skills Academy podendo realizar um curso de data science (75 horas com aulas, laboratórios e case studies).