Inteligência Artificial, Big Data e Ciência de Dados
Será que estamos emitindo opiniões do século XIX com a tecnologia do século XXI?
Nosso dia a dia está cada vez mais direcionado pelo Machine Learning, e ela está selecionando o que a gente vê do mundo, formado bolhas por critério de afinidades aprendidas como padrão. Será que vamos deixar de ser empáticos? será que vamos continuar podendo contar com o acaso? será que furar a bolha provocaria uma reengenharia social?
Machine Learning
principais problemas de machine learning: modelos muito complexos,tradeoff entre viés (erro gerado pelo modelo da dados reais) e variância (peq mudanças nos dados levam a gde mudança de parametros)
4 categorias: aprendizado supervisionado (divididos por classificação e regressão) / aprendizado não supervisionado (objetivo é encontrar padrões de dados) / aprendizado semi-supervisionado (presença de dados com rótulos outros sem) /aprendizado por esforço
mão de obra cara mas algoritimos são livres, gratuitas e disponíveis online, sendo os principais linguagens de programação a R e Python
Processo: ele aprende as regras com 70% dos dados,e depois testa. O resultado é analisado por um humano. O computador lê os dados em quantidade - os algoritimos (receita de bolo) constroem hipóteses e são testadas. o processo tem a supervisão humana que deve escolher o melhor algoritimo para cada caso.
Algoritimo não entende o conceito de futuro, ele desenha detalhadamente cada sequencia, assim o hiperparâmetro é humano, Human Learning (segura na mão do algorítimo) parametrizando a linha preditiva para definir o modelo. Na sequencia é feita uma validação cruzada, treinando o algorítimo a testar e predizer o futuro. Os algoritimos tem que ser testados, "não há almoço grátis", a unica forma de saber qual algoritimo funciona melhor é testando
Tipos de algoritimo
Redes neurais: baseada no funcionamento do cérebro, com muitos cruzamentos e camadas e conexões complexas, oferece modelo de uma camada ou em várias camadas intermediárias entre preditores e a resposta, o Deep Learning
Arvores de Decisão: mais simples separa os dados em grupos semelhantes. É fácil de interpretar, porém tem alta variância e instabilidade e baixa performance preditiva.
através da análise de dados é possível fazer análises preditivas (sobre o futuro), acompanhando um padrão, exemplo: área da saúde, Covid, identificar tendências
Importante: não precisa dar justificativa, pouco interessa interpretar modelos para relações complexas
As crianças são assim, aprendem vendo!
Tomada de decisão via identificação de padrões complexos de dados
Máquinas aprendendo sozinhas, através de dados, regras e exemplos
Subtópico
Demanda por profissionais capazes de extrair informações relevantes dos dados
Impacto na área profissional: positivo para melhor tomada de decisão (área da saúde)com necessidade de treinamento, mas drástica em outras áreas menos qualificadas (motoristas). Qual seria a solução? Devemos ter medo de ter uma vida guiada por algoritmos?
Ciência do Dados
O problema de predição que preciso resolver tem dados disponíveis / a empresa possui equipe de ciência de dados capacitada para execução de um projeto de machine learning? / geralmente a solução está em parcerias com consultorias de IA e universidades
Dados: disponibilidade / qualidade / quantidade/ confiabilidade / idoneidade / fonte / volume
Inteligência Artificial
Questões éticas: amostra de dados reduzida e de grupos.
Auxílio e não uma ameaça ao humano, ela aponta uma solução mas a decisão é humana (WAZE)
Regras de tomada de decisão ensinadas pelos humanos
Capacidade das máquinas tomarem decisões inteligentes a partir de dados disponíveis com capacidade de se adaptarem a novas situações
Tópico principal
O mundo hoje é gerido por dados. Sociedade Data Driven, mas a análise decisão é humana, usando outras habilidades