Aprenda
e domine Machine learning, inteligência artificial e tudo sobre a ciência de dados!
Data
Science
Fundamentos: Numpy, Pandas, Estatísticas
Aprenda a demonstrar conceitos de programação usando as ferramentas Python e Numpy para tratar bases de dados e DataFrames.
Módulos
O curso de Data Science oferece conhecimentos sólidos no processo
de extração, processamento e análise de grandes quantidades de dados e se consiste em 7 módulos:
Módulo 1
EDA, Data Cleaning e Estatística Inferencial
Aprenda os conceitos e aplicações de biblioteca Pandas, “tidy data”, estruturação de dados, introdução ao problema de dados faltantes, noções de Expressões Regulares, de probabilidade, distribuições amostrais, entre outros.
Módulo 2
Intro a ML: Regressão Linear e Regularização
Entenda sobre interpretação, estimativa de coeficientes, suposições, medidas de ajuste. Introdução de não linearidades no modelo.
Módulo 3
Problemas de Classificação, GridSearch e Clustering
Aprenda sobre Regressão Logística. Naïve Bayes, Support Vector Machines. Avaliação de algoritmos de classificação. Princípio de transformação matemática sobre a regressão linear, interpretação dos estimadores, introdução à métricas para modelos de classificação.
Módulo 4
Árvores, Ensambles,
e Boosting
Aprenda sobre noção de Ensemble Learning. Vantagens e desvantagens. Apresentação do meta-algoritmo Bagging e de duas aplicações para árvores de decisão: Random Forest e ExtraTrees. Apresentação do meta-algoritmo de Boosting e de AdaBoost e Gradient Boosting.
Módulo 5
Séries Temporais e
Text Mining
Aprenda sobre pré-processamento de séries. Enfoque clássico (tendência, ciclo e resíduo). Sazonalidade. Modelos básicos e avançados. Uso de bibliotecas urllib2 e BeautifulSoup para scrape de sites.
Módulo 6
APIs, Pickle e Flask, BigQuery
Pipelines, automatização e encapsulamento de etapas do workflow. Deploy de modelos de machine learning em ambiente Web.
Módulo 7
Sobre o curso
Duração
5 meses
Formato da aula:
remoto e ao vivo
Tempo de dedicação
10 horas semanais