Conceitos de ML: classificação, agrupamento e recomendações
Os outros três conceitos fundamentais de ML são:
| Conceito | O que faz | Exemplo |
|---|---|---|
| Classificação | Atribuir dados a categorias pré-definidas | Classificar e-mails como spam ou não-spam |
| Agrupamento (Clustering) | Agrupar dados semelhantes sem categorias pré-definidas | Segmentação de clientes por comportamento de compra |
| Recomendações | Sugerir itens com base em preferências e histórico | Recomendar produtos em e-commerce |
A diferença-chave entre classificação e agrupamento: na classificação, as categorias já existem e o modelo aprende a atribuir dados a elas. No agrupamento, não há categorias — o modelo descobre sozinho grupos naturais nos dados.
Exemplos para fixar
Exemplo 1 (Classificação): Um banco classifica transações como "legítimas" ou "fraudulentas" com base em padrões de comportamento. As categorias existem previamente — o modelo aprende a distinguir uma da outra a partir de exemplos rotulados.
Exemplo 2 (Agrupamento): Uma empresa de marketing tem milhões de clientes sem nenhuma categorização. O ML analisa os dados (compras, frequência, valor gasto) e descobre naturalmente que existem 4 grupos de clientes com comportamentos distintos — sem que ninguém tenha definido esses grupos previamente.
Exemplo 3 (Recomendações): O Spotify analisa seu histórico de músicas, compara com milhões de outros usuários e descobre que pessoas com gostos similares ao seu também ouvem determinadas músicas. Ele então recomenda essas músicas para você. Esse é o conceito de filtragem colaborativa — uma técnica de recomendação baseada em similaridade entre usuários.
Aprendizado de Máquina
O Aprendizado de Máquina (Machine Learning) é o motor por trás de grande parte do que a IA moderna consegue fazer — de recomendações no streaming a diagnósticos médicos. Nesta lição, você vai entender como máquinas aprendem, os principais tipos de aprendizado e os conceitos fundamentais que sustentam essa tecnologia.
Nesta lição, você vai aprender:
- O que é Aprendizado de Máquina (ML)
- Redes neurais e aprendizagem profunda (Deep Learning)
- Modelos de linguagem grandes (LLMs)
- Tipos de aprendizado: online, baseado em instâncias e baseado em modelos
- Treinamento de algoritmos: viés e variância
- Conceitos de ML: predição, classificação, agrupamento e recomendações
- Aprendizado supervisionado, não supervisionado, semi-supervisionado e por reforço
O que é Aprendizado de Máquina (ML)
O Aprendizado de Máquina (Machine Learning — ML) é um subconjunto da inteligência artificial. A IA não é um conceito novo; o ML é mais um passo na evolução da IA.
"O campo do aprendizado de máquina se preocupa com a questão de como construir programas de computador que melhoram automaticamente com a experiência." — Tom Mitchell
ML é usado dentro da ciência de dados e consiste na aplicação de algoritmos para extrair insights de dados e big data. Em vez de ser programado com regras explícitas para cada situação, um sistema de ML aprende padrões a partir dos dados e usa esses padrões para fazer previsões ou tomar decisões.
Exemplos para fixar
Exemplo 1: Um sistema tradicional de recomendação de filmes usaria regras como "se o usuário gosta de ação, sugira filmes de ação". Um sistema com ML analisa o histórico completo de visualização e descobre padrões como "usuários que assistiram A e B também gostaram de C" — sem precisar de regras manuais.
Exemplo 2: Para detectar fraudes em cartão de crédito, seria impossível programar regras para cada tipo de fraude. O ML aprende padrões de transações normais e identifica automaticamente transações que fogem do padrão — melhorando com cada nova fraude detectada.
Exemplo 3: O ML está presente na sua vida diária: quando o corretor ortográfico do celular sugere a próxima palavra, quando o Spotify recomenda uma playlist, ou quando o Netflix sugere o próximo filme. Em todos os casos, o sistema melhora automaticamente com a experiência — quanto mais você usa, melhores ficam as sugestões.
Redes neurais
Redes neurais são modelos baseados em uma representação matemática do cérebro humano. Elas consistem em camadas de nós (neurônios artificiais) conectados, onde cada conexão tem um peso que é ajustado durante o treinamento.
Uma rede neural tem três tipos de camadas:
| Camada | Função |
|---|---|
| Entrada (Input) | Recebe os dados brutos |
| Ocultas (Hidden) | Processam e transformam os dados |
| Saída (Output) | Produzem o resultado final |
Características principais das redes neurais:
- Requerem treinamento — aprendem ajustando pesos com base em exemplos
- São caixas-pretas — é difícil explicar como chegaram a um resultado
- Aprendem a partir de dados estruturados e não estruturados
- Necessitam de muitos recursos computacionais
- Resultados promissores em bioinformática, reconhecimento de fala, processamento de imagens e processamento de linguagem natural
Exemplos para fixar
Exemplo 1: Uma rede neural treinada para reconhecer gatos em fotos recebe milhões de imagens rotuladas ("gato" e "não gato"). A camada de entrada recebe os pixels, as camadas ocultas aprendem a detectar bordas, depois formas, depois orelhas e bigodes — e a camada de saída diz "gato" ou "não gato".
Exemplo 2: Quando você fala "Ok Google" para o assistente do smartphone, uma rede neural processa o áudio, identifica os padrões sonoros e converte sua fala em texto. Ela foi treinada com milhões de amostras de voz em diferentes sotaques e idiomas.
Exemplo 3: Uma rede neural médica é treinada com milhares de radiografias para identificar pneumonia. Ela aprende padrões visuais que indicam a doença — mas como é uma caixa-preta, o médico pode ver o diagnóstico sem entender exatamente quais pixels levaram àquela conclusão. Essa falta de explicabilidade é um dos desafios das redes neurais.
Aprendizagem profunda (Deep Learning)
A aprendizagem profunda (Deep Learning) é uma rede neural com múltiplas camadas ocultas (por isso "profunda"). Ela é inspirada na construção fisiológica do cérebro humano.
Redes neurais profundas (DNNs) são usadas em:
- Reconhecimento de fala — Alexa, Siri, Google Assistant, Cortana
- Reconhecimento de imagens — identificação de objetos, rostos, cenas
- Diagnóstico médico — análise de exames e radiografias
- Processamento de linguagem natural (NLP) — tradução, resumo, geração de texto
A aprendizagem profunda é amplamente considerada uma revolução na IA porque ela se aproxima do conceito de agente inteligente autônomo: percebe dados complexos, processa em múltiplas camadas de abstração e produz resultados sofisticados.
Exemplos para fixar
Exemplo 1: Quando você pede à Alexa "toque músicas relaxantes", deep learning está em ação em múltiplas etapas: reconhecimento de fala (converter áudio em texto), processamento de linguagem natural (entender a intenção) e recomendação (selecionar músicas). Cada etapa usa redes neurais profundas.
Exemplo 2: Um sistema de reconhecimento facial usa deep learning com dezenas de camadas. As primeiras camadas detectam bordas e contrastes; as intermediárias reconhecem olhos, nariz e boca; as finais combinam tudo para identificar a pessoa. Quanto mais camadas, mais abstrata e sofisticada a representação.
Exemplo 3: A diferença entre uma rede neural "rasa" (poucas camadas) e deep learning (muitas camadas) é como a diferença entre reconhecer letras e compreender um texto. A rede rasa pode identificar caracteres; a rede profunda pode entender o significado de um parágrafo.
Modelos de linguagem grandes (LLMs)
Modelos de linguagem grandes (Large Language Models — LLMs) são algoritmos de aprendizagem profunda que podem reconhecer, resumir, traduzir, prever e gerar conteúdo usando conjuntos de dados muito grandes.
Características dos LLMs:
- São sistemas avançados de IA treinados em extensos datasets de texto
- Entendem e geram linguagem semelhante à humana
- Usam arquiteturas de aprendizagem profunda, principalmente transformers
- Processam e preveem sequências de texto
Exemplos para fixar
Exemplo 1: O ChatGPT é um LLM treinado em bilhões de textos da internet. Quando você pergunta "qual a capital da França?", ele não "sabe" a resposta — ele prevê que a sequência mais provável após essa pergunta é "A capital da França é Paris". Esse mecanismo de previsão de texto é o coração dos LLMs.
Exemplo 2: Um LLM pode traduzir um texto do inglês para o português, resumir um artigo de 10 páginas em 3 parágrafos, ou gerar código de programação — tudo com o mesmo modelo. Essa versatilidade é possível porque ele aprendeu padrões gerais da linguagem, não regras específicas para cada tarefa.
Exemplo 3: A arquitetura de transformers (introduzida pelo artigo "Attention Is All You Need" do Google em 2017) revolucionou os LLMs. Antes dos transformers, modelos processavam texto sequencialmente (palavra por palavra). Transformers processam todas as palavras simultaneamente, capturando relações entre palavras distantes — o que permite entender frases longas e complexas.
Aprendizado online
Além dos tipos principais (supervisionado, não supervisionado, etc.), existem diferentes abordagens de como o ML processa dados. A primeira é o aprendizado online.
No aprendizado online, o sistema aprende em passos incrementais com dados individuais ou pequenos lotes de dados.
- Útil para dados que mudam rapidamente e o modelo precisa se adaptar
- Útil para grandes datasets com recursos de hardware limitados
- O modelo se atualiza continuamente à medida que novos dados chegam
O pipeline típico é: dados chegam → algoritmo aprende → solução é avaliada → se adequada, é implantada; se não, os resultados são analisados e a abordagem é ajustada.
Exemplos para fixar
Exemplo 1: Uma plataforma de notícias usa ML para recomendar artigos. Como as notícias mudam a cada minuto, o sistema usa aprendizado online — atualiza o modelo a cada clique do usuário, sem precisar retreinar do zero.
Exemplo 2: Um sistema de detecção de fraudes em cartão de crédito usa aprendizado online: a cada transação processada (fraudulenta ou legítima), o modelo se atualiza. Isso é essencial porque os padrões de fraude mudam constantemente — um modelo treinado uma única vez ficaria rapidamente desatualizado.
Exemplo 3: Se uma plataforma de streaming treinasse seu modelo de recomendação apenas uma vez por mês, ele não captaria tendências em tempo real (como um filme que viralizou ontem). Com aprendizado online, o modelo se adapta continuamente às mudanças de comportamento dos usuários.
Aprendizado baseado em instâncias e baseado em modelos
Outras duas abordagens de ML diferem na forma como representam o conhecimento aprendido:
Aprendizado baseado em instâncias
O aprendizado baseado em instâncias é a forma mais simples de aprendizado — muitas vezes chamado de "aprendizado decorado" (learning by heart).
- O sistema memoriza os exemplos de treinamento
- Para classificar dados novos, compara com os exemplos memorizados usando uma medida de similaridade
- Pode ser generalizado construindo medidas de similaridade mais sofisticadas
Aprendizado baseado em modelos
No aprendizado baseado em modelos, construímos um modelo matemático dos dados.
- Escolhemos o tipo de modelo (linear, polinomial, etc.)
- O modelo é ajustado aos dados de treinamento
- Usamos o modelo para fazer previsões sobre dados novos
Exemplos para fixar
Exemplo 1 (Baseado em instâncias): Uma criança aprende a tabuada decorando: 7×8=56. Quando perguntam "quanto é 7×8?", ela recupera a resposta da memória. Um filtro de spam funciona de forma similar — memoriza e-mails marcados como spam e compara novos e-mails por similaridade.
Exemplo 2 (Baseado em modelos): Um cientista mede a temperatura e a pressão de um gás em vários pontos, ajusta uma reta (modelo linear) aos dados e usa a fórmula para prever a pressão em temperaturas que não mediu. Ele escolheu o modelo (reta) e usou os dados para calibrá-lo.
Exemplo 3 (Comparação): Imagine que você quer saber se um e-mail é spam. Na abordagem baseada em instâncias, você compara o e-mail com todos os spams que já viu — se é parecido com algum, é spam. Na abordagem baseada em modelos, você constrói uma fórmula (modelo) que calcula uma "pontuação de spam" com base em características do e-mail. A primeira memoriza; a segunda generaliza.
Treinamento de algoritmos: viés e variância
Ao treinar um algoritmo de ML, precisamos ajustar hiperparâmetros — configurações que controlam como o modelo aprende. Cada conjunto de hiperparâmetros pode gerar modelos diferentes.
Duas métricas estatísticas fundamentais para avaliar a qualidade do treinamento:
| Métrica | O que mede | Problema |
|---|---|---|
| Viés (Bias) | Quão longe as previsões estão do valor real | Viés alto = modelo muito simplificado, não captura os padrões (underfitting) |
| Variância (Variance) | Quão dispersas são as previsões | Variância alta = modelo se ajustou demais aos dados de treino, não generaliza (overfitting) |
O objetivo é encontrar o equilíbrio entre viés e variância — um modelo que captura os padrões reais sem se ajustar ao ruído dos dados.
Exemplos para fixar
Exemplo 1 (Viés): Um modelo prevê que a pontuação média do Reino Unido no Eurovision é 57, mas o valor real é 67. O viés é 10 pontos. O modelo está sistematicamente errado — simplificou demais a realidade.
Exemplo 2 (Variância): Um modelo prevê bem a média de 67 pontos no Eurovision, mas as previsões individuais variam de -250 a +1500. A variância é altíssima — o modelo se ajustou demais a padrões específicos dos dados de treino e não generaliza para dados novos.
Exemplo 3 (Equilíbrio): Pense em acertar um alvo. Viés alto é como sempre acertar o mesmo ponto, mas longe do centro (preciso mas não exato). Variância alta é como acertar perto do centro em média, mas com tiros espalhados (exato mas não preciso). O ideal é viés baixo e variância baixa — tiros consistentes no centro do alvo.
Conceitos de ML: predição e reconhecimento de objetos
O aprendizado de máquina pode ser aplicado em diferentes tipos de tarefas. Vamos começar pelos dois primeiros conceitos:
| Conceito | O que faz |
|---|---|
| Predição | Prever valores futuros com base em dados históricos, notícias e indicadores |
| Reconhecimento de objetos | Identificar e localizar objetos em imagens ou vídeos |
A predição é uma das aplicações mais comuns de ML — desde previsão de preços de ações até previsão do tempo. O modelo analisa dados passados para identificar tendências e padrões que se repetem.
O reconhecimento de objetos permite que máquinas "vejam" e identifiquem elementos em imagens e vídeos — pedestres, veículos, sinais de trânsito, rostos.
Exemplos para fixar
Exemplo 1 (Predição): Uma empresa de logística usa ML para prever a demanda de entregas na próxima semana com base no histórico de pedidos, feriados e previsão do tempo. Isso permite alocar motoristas e veículos com antecedência — reduzindo custos e melhorando o serviço.
Exemplo 2 (Reconhecimento de objetos): Um veículo autônomo usa reconhecimento de objetos para identificar pedestres, outros veículos, semáforos e condições da estrada em tempo real. Cada objeto reconhecido influencia a decisão de frear, acelerar ou mudar de faixa.
Exemplo 3 (Predição na saúde): Um hospital usa ML para prever quais pacientes na UTI têm maior risco de complicações nas próximas 24 horas, com base em sinais vitais e histórico clínico. Isso permite que a equipe médica priorize atenção aos pacientes mais críticos.
Conceitos de ML: classificação, agrupamento e recomendações
Os outros três conceitos fundamentais de ML são:
| Conceito | O que faz | Exemplo |
|---|---|---|
| Classificação | Atribuir dados a categorias pré-definidas | Classificar e-mails como spam ou não-spam |
| Agrupamento (Clustering) | Agrupar dados semelhantes sem categorias pré-definidas | Segmentação de clientes por comportamento de compra |
| Recomendações | Sugerir itens com base em preferências e histórico | Recomendar produtos em e-commerce |
A diferença-chave entre classificação e agrupamento: na classificação, as categorias já existem e o modelo aprende a atribuir dados a elas. No agrupamento, não há categorias — o modelo descobre sozinho grupos naturais nos dados.
Exemplos para fixar
Exemplo 1 (Classificação): Um banco classifica transações como "legítimas" ou "fraudulentas" com base em padrões de comportamento. As categorias existem previamente — o modelo aprende a distinguir uma da outra a partir de exemplos rotulados.
Exemplo 2 (Agrupamento): Uma empresa de marketing tem milhões de clientes sem nenhuma categorização. O ML analisa os dados (compras, frequência, valor gasto) e descobre naturalmente que existem 4 grupos de clientes com comportamentos distintos — sem que ninguém tenha definido esses grupos previamente.
Exemplo 3 (Recomendações): O Spotify analisa seu histórico de músicas, compara com milhões de outros usuários e descobre que pessoas com gostos similares ao seu também ouvem determinadas músicas. Ele então recomenda essas músicas para você. Esse é o conceito de filtragem colaborativa — uma técnica de recomendação baseada em similaridade entre usuários.
Aprendizado supervisionado
No aprendizado supervisionado, o modelo aprende a partir de dados de treinamento que incluem as soluções desejadas (rótulos/labels).
O processo funciona assim:
- Dados de treinamento vêm com rótulos (a resposta correta)
- O algoritmo aprende a relação entre os dados e os rótulos
- O modelo treinado pode então prever rótulos para dados novos
O aprendizado supervisionado é usado quando sabemos qual deve ser a saída — temos exemplos do resultado correto.
Exemplos para fixar
Exemplo 1: Um modelo é treinado com milhares de e-mails rotulados como "spam" ou "não-spam". Ele aprende quais características (palavras, remetente, formatação) indicam spam. Quando recebe um e-mail novo, prevê se é spam — com base nos padrões aprendidos dos rótulos.
Exemplo 2: Para prever preços de imóveis, treinamos um modelo com dados rotulados: características da casa (área, quartos, localização) + preço real de venda (o rótulo). O modelo aprende a relação entre características e preço, e depois prevê preços de casas novas.
Exemplo 3: Um sistema de diagnóstico médico é treinado com radiografias rotuladas por médicos ("pneumonia" ou "normal"). Cada imagem tem um rótulo correto — a supervisão vem dos especialistas humanos que rotularam os dados. O modelo aprende a associar padrões visuais ao diagnóstico.
Aprendizado não supervisionado
No aprendizado não supervisionado, o modelo aprende a partir de dados de treinamento que não incluem as soluções desejadas — não há rótulos.
O modelo precisa descobrir padrões e estruturas nos dados por conta própria.
Aplicações principais:
- Agrupamento (Clustering) — agrupar dados semelhantes
- Detecção de anomalias — identificar dados que fogem do padrão
- Redução de dimensionalidade — simplificar dados complexos para visualização
Exemplos para fixar
Exemplo 1 (Agrupamento): Uma empresa de marketing tem milhões de clientes, mas nenhuma categorização. O aprendizado não supervisionado analisa os dados (compras, frequência, valor gasto) e descobre naturalmente que existem 4 grupos de clientes com comportamentos distintos — sem que ninguém tenha definido esses grupos previamente.
Exemplo 2 (Detecção de anomalias): Um sistema monitora o tráfego de rede de uma empresa. Sem rótulos de "normal" ou "anomalia", o modelo não supervisionado aprende o padrão típico de tráfego e identifica automaticamente quando algo foge do normal — potencial indicador de ataque cibernético.
Exemplo 3 (Diferença-chave): No supervisionado, você diz ao modelo "isto é spam, isto não é" (tem rótulos). No não supervisionado, você diz ao modelo "aqui estão os e-mails — descubra padrões" (sem rótulos). A diferença fundamental é a presença ou ausência de rótulos nos dados de treinamento.
Aprendizado semi-supervisionado
O aprendizado semi-supervisionado combina elementos do supervisionado e do não supervisionado: começa com uma pequena quantidade de dados rotulados e depois introduz uma grande quantidade de dados não rotulados.
Essa abordagem é prática porque:
- Rotular dados é caro e demorado (requer trabalho humano especializado)
- Dados não rotulados são geralmente abundantes e baratos
- O modelo usa os poucos rótulos como "âncoras" e aprende a generalizar para os dados não rotulados
Exemplos para fixar
Exemplo 1: Uma empresa de saúde tem 100 radiografias rotuladas por médicos (caro e demorado) e 10.000 radiografias não rotuladas. O aprendizado semi-supervisionado usa as 100 rotuladas para aprender padrões iniciais e depois estende esse aprendizado para as 10.000 não rotuladas — obtendo resultados melhores do que usar apenas as 100.
Exemplo 2: O Google Photos usa semi-supervisionado: você rotula manualmente algumas fotos de amigos ("este é João"), e o sistema usa esse pequeno conjunto rotulado para aprender a reconhecer João em todas as suas outras fotos — mesmo sem rótulos.
Exemplo 3: A diferença prática: supervisionado = todos os dados têm rótulos; não supervisionado = nenhum dado tem rótulo; semi-supervisionado = poucos dados têm rótulos, e o modelo usa isso como ponto de partida para aprender com os muitos dados sem rótulos.
Aprendizado por reforço
No aprendizado por reforço (Reinforcement Learning), um agente observa um ambiente, seleciona e executa ações que são recompensadas ou penalizadas.
O processo funciona assim:
- O agente observa o estado do ambiente
- Seleciona uma ação usando uma estratégia (chamada política)
- Recebe uma recompensa (positiva ou negativa)
- Atualiza sua política para maximizar recompensas futuras
- Repete até encontrar a política ótima
O aprendizado por reforço é diferente dos outros tipos: não há dados rotulados nem descoberta de padrões — há tentativa e erro com feedback.
Aplicações: controle de robôs, automação de fábricas, agendamento, planejamento e jogos.
Exemplos para fixar
Exemplo 1: O AlphaGo (DeepMind) aprendeu a jogar Go por reforço: fez milhões de jogadas, recebeu recompensa (+1 por vitória, -1 por derrota) e ajustou sua política até descobrir estratégias que superaram o campeão mundial. Ninguém programou as estratégias — o agente as descobriu por tentativa e erro.
Exemplo 2: Um robô aprendendo a andar recebe recompensa positiva a cada passo sem cair e penalidade quando cai. Com milhares de tentativas, ele descobre a política ótima de movimentos para se manter em pé e andar — mesmo que nunca tenha sido programado com regras de equilíbrio.
Exemplo 3: Comparando os quatro tipos: supervisionado = professor diz a resposta certa; não supervisionado = aluno descobre padrões sozinho; semi-supervisionado = professor dá algumas respostas e o aluno generaliza; por reforço = aluno tenta, recebe nota (boa ou ruim) e ajusta sua estratégia.
Resumo
| Tema | Pontos-chave |
|---|---|
| ML (definição) | Programas que melhoram automaticamente com a experiência; subconjunto da IA |
| Redes neurais | Baseadas no cérebro humano; camadas de entrada, ocultas e saída; caixas-pretas |
| Deep Learning | Redes neurais com múltiplas camadas; fala, imagem, NLP, diagnóstico |
| LLMs | Algoritmos de deep learning para linguagem; usam transformers; reconhecem, resumem, traduzem, preveem e geram conteúdo |
| Aprendizado online | Aprende incrementalmente; útil para dados que mudam rapidamente |
| Baseado em instâncias | Memoriza exemplos; compara por similaridade (ex.: filtro de spam) |
| Baseado em modelos | Constrói modelo matemático; usa para prever (ex.: regressão linear) |
| Viés e variância | Viés = erro sistemático (underfitting); Variância = dispersão (overfitting) |
| Predição | Prever valores futuros a partir de dados históricos |
| Classificação | Atribuir dados a categorias pré-definidas |
| Agrupamento | Descobrir grupos naturais sem categorias pré-definidas |
| Recomendações | Sugerir itens com base em preferências |
| Supervisionado | Dados com rótulos → modelo aprende a relação |
| Não supervisionado | Dados sem rótulos → modelo descobre padrões |
| Semi-supervisionado | Poucos rótulos + muitos dados sem rótulo |
| Por reforço | Agente aprende por tentativa/erro com recompensas/penalidades |
Dica para o exame: questões frequentemente pedem que você diferencie supervisionado de não supervisionado (rótulos vs. sem rótulos), identifique o tipo de tarefa de ML (predição, classificação, agrupamento), ou explique conceitos como viés e variância. Lembre-se: redes neurais são caixas-pretas, deep learning é redes neurais com múltiplas camadas, e LLMs usam transformers.