Inteligência Artificial, Big Data e Ciência de Dados

O mundo hoje é gerido por dados. Sociedade Data Driven, mas a análise decisão é humana, usando outras habilidades

Tópico principal

Inteligência Artificial

Capacidade das máquinas tomarem decisões inteligentes a partir de dados disponíveis com capacidade de se adaptarem a novas situações

Regras de tomada de decisão ensinadas pelos humanos

Auxílio e não uma ameaça ao humano, ela aponta uma solução mas a decisão é humana (WAZE)

Questões éticas: amostra de dados reduzida e de grupos.

Ciência do Dados

Dados: disponibilidade / qualidade / quantidade/ confiabilidade / idoneidade / fonte / volume

O problema de predição que preciso resolver tem dados disponíveis / a empresa possui equipe de ciência de dados capacitada para execução de um projeto de machine learning? / geralmente a solução está em parcerias com consultorias de IA e universidades

Impacto na área profissional: positivo para melhor tomada de decisão (área da saúde)com necessidade de treinamento, mas drástica em outras áreas menos qualificadas (motoristas). Qual seria a solução? Devemos ter medo de ter uma vida guiada por algoritmos?

Demanda por profissionais capazes de extrair informações relevantes dos dados

Machine Learning

Subtópico

Máquinas aprendendo sozinhas, através de dados, regras e exemplos

Tomada de decisão via identificação de padrões complexos de dados

As crianças são assim, aprendem vendo!

Importante: não precisa dar justificativa, pouco interessa interpretar modelos para relações complexas

através da análise de dados é possível fazer análises preditivas (sobre o futuro), acompanhando um padrão, exemplo: área da saúde, Covid, identificar tendências

Processo: ele aprende as regras com 70% dos dados,e depois testa. O resultado é analisado por um humano. O computador lê os dados em quantidade - os algoritimos (receita de bolo) constroem hipóteses e são testadas. o processo tem a supervisão humana que deve escolher o melhor algoritimo para cada caso.

Algoritimo não entende o conceito de futuro, ele desenha detalhadamente cada sequencia, assim o hiperparâmetro é humano, Human Learning (segura na mão do algorítimo) parametrizando a linha preditiva para definir o modelo. Na sequencia é feita uma validação cruzada, treinando o algorítimo a testar e predizer o futuro. Os algoritimos tem que ser testados, "não há almoço grátis", a unica forma de saber qual algoritimo funciona melhor é testando

Tipos de algoritimo

Arvores de Decisão: mais simples separa os dados em grupos semelhantes. É fácil de interpretar, porém tem alta variância e instabilidade e baixa performance preditiva.

Redes neurais: baseada no funcionamento do cérebro, com muitos cruzamentos e camadas e conexões complexas, oferece modelo de uma camada ou em várias camadas intermediárias entre preditores e a resposta, o Deep Learning

Subtópico

mão de obra cara mas algoritimos são livres, gratuitas e disponíveis online, sendo os principais linguagens de programação a R e Python

4 categorias: aprendizado supervisionado (divididos por classificação e regressão) / aprendizado não supervisionado (objetivo é encontrar padrões de dados) / aprendizado semi-supervisionado (presença de dados com rótulos outros sem) /aprendizado por esforço

principais problemas de machine learning: modelos muito complexos,tradeoff entre viés (erro gerado pelo modelo da dados reais) e variância (peq mudanças nos dados levam a gde mudança de parametros)

Nosso dia a dia está cada vez mais direcionado pelo Machine Learning, e ela está selecionando o que a gente vê do mundo, formado bolhas por critério de afinidades aprendidas como padrão. Será que vamos deixar de ser empáticos? será que vamos continuar podendo contar com o acaso? será que furar a bolha provocaria uma reengenharia social?

Será que estamos emitindo opiniões do século XIX com a tecnologia do século XXI?