Inteligência Artificial, Big Data e Ciência de Dados
O mundo hoje é gerido por dados. Sociedade Data Driven, mas a análise decisão é humana, usando outras habilidades
Tópico principal
Inteligência Artificial
Capacidade das máquinas tomarem decisões inteligentes a partir de dados disponíveis com capacidade de se adaptarem a novas situações
Regras de tomada de decisão ensinadas pelos humanos
Auxílio e não uma ameaça ao humano, ela aponta uma solução mas a decisão é humana (WAZE)
Questões éticas: amostra de dados reduzida e de grupos.
Ciência do Dados
Dados: disponibilidade / qualidade / quantidade/ confiabilidade / idoneidade / fonte / volume
O problema de predição que preciso resolver tem dados disponíveis / a empresa possui equipe de ciência de dados capacitada para execução de um projeto de machine learning? / geralmente a solução está em parcerias com consultorias de IA e universidades
Impacto na área profissional: positivo para melhor tomada de decisão (área da saúde)com necessidade de treinamento, mas drástica em outras áreas menos qualificadas (motoristas). Qual seria a solução? Devemos ter medo de ter uma vida guiada por algoritmos?
Demanda por profissionais capazes de extrair informações relevantes dos dados
Machine Learning
Subtópico
Máquinas aprendendo sozinhas, através de dados, regras e exemplos
Tomada de decisão via identificação de padrões complexos de dados
As crianças são assim, aprendem vendo!
Importante: não precisa dar justificativa, pouco interessa interpretar modelos para relações complexas
através da análise de dados é possível fazer análises preditivas (sobre o futuro), acompanhando um padrão, exemplo: área da saúde, Covid, identificar tendências
Processo: ele aprende as regras com 70% dos dados,e depois testa. O resultado é analisado por um humano. O computador lê os dados em quantidade - os algoritimos (receita de bolo) constroem hipóteses e são testadas. o processo tem a supervisão humana que deve escolher o melhor algoritimo para cada caso.
Algoritimo não entende o conceito de futuro, ele desenha detalhadamente cada sequencia, assim o hiperparâmetro é humano, Human Learning (segura na mão do algorítimo) parametrizando a linha preditiva para definir o modelo. Na sequencia é feita uma validação cruzada, treinando o algorítimo a testar e predizer o futuro. Os algoritimos tem que ser testados, "não há almoço grátis", a unica forma de saber qual algoritimo funciona melhor é testando
Tipos de algoritimo
Arvores de Decisão: mais simples separa os dados em grupos semelhantes. É fácil de interpretar, porém tem alta variância e instabilidade e baixa performance preditiva.
Redes neurais: baseada no funcionamento do cérebro, com muitos cruzamentos e camadas e conexões complexas, oferece modelo de uma camada ou em várias camadas intermediárias entre preditores e a resposta, o Deep Learning
Subtópico
mão de obra cara mas algoritimos são livres, gratuitas e disponíveis online, sendo os principais linguagens de programação a R e Python
4 categorias: aprendizado supervisionado (divididos por classificação e regressão) / aprendizado não supervisionado (objetivo é encontrar padrões de dados) / aprendizado semi-supervisionado (presença de dados com rótulos outros sem) /aprendizado por esforço
principais problemas de machine learning: modelos muito complexos,tradeoff entre viés (erro gerado pelo modelo da dados reais) e variância (peq mudanças nos dados levam a gde mudança de parametros)