O que é machine learning?
O aprendizado de máquina é um subconjunto de inteligência artificial (AI) que se concentra na criação e evolução de sistemas, que têm a capacidade de alavancar dados e padrões históricos, tomar decisões lógicas e fazer previsões precisas com o mínimo ou nenhum envolvimento humano.
Na década de 1950, AI pioneiro Arthur Samuel definiu o aprendizado de máquina como "o campo de estudo que dá aos computadores a capacidade de aprender sem serem explicitamente programados".
Os algoritmos de aprendizado de máquina, que são governados e impulsionados por modelos de aprendizado de máquina, são projetados para melhorar adaptativamente à medida que o volume de dados (ou seja, amostras) aumenta. No entanto, a existência de viés subjacente de aprendizado de máquina (também conhecido como viés de AI) levou a previsões errôneas, que, por sua vez, apoiaram decisões erradas e prejudiciais.
Atualmente usado por dois terços de todas as empresas recomendar produtos e serviços, Especialistas dizem que machine learning já mudou, ou mudará em breve, todas as indústrias do mundo à medida que a tecnologia continua a avançar.
Aprendizagem automática vs. AI
Enquanto o AI permite que máquinas ou sistemas pensem como um cérebro humano, usando dados para raciocinar, agir, adaptar-se e chegar a conclusões, o aprendizado de máquina é uma aplicação de AI que permite que máquinas ou sistemas transformem dados brutos em business intelligence (conhecimento) e aprendam com eles de forma autônoma. O aprendizado de máquina treina AI para saber o que fazer.
Essencialmente, o aprendizado de máquina é o motor que permite que um sistema desenvolva sua inteligência. O aprendizado de máquina não é AI, mas sim um caminho para AI.
Aprendizagem automática vs. aprendizagem profunda
A aprendizagem profunda é um subconjunto (ou forma especializada) da aprendizagem automática. Ele usa camadas de algoritmos para construir redes neurais artificiais capazes de aprender e tomar decisões de forma autônoma.
Se o sistema começar a gerar previsões questionáveis ou imprecisas, então um cientista de dados deve se envolver e fazer ajustes. No entanto, o algoritmo em um modelo de aprendizagem profunda tem a capacidade de determinar – por conta própria – se as previsões são imprecisas e pode fazer correções sem intervenção humana.
Aprendizagem automática vs. processamento de linguagem natural
Outro campo do aprendizado de máquina é o processamento de linguagem natural, que se concentra em permitir que máquinas e sistemas reconheçam, entendam e respondam corretamente à forma como os seres humanos escrevem e falam – o que no mundo da tecnologia é muito mais diversificado e dinâmico do que depender dos números e dados que são convencionalmente usados pelos programadores.
Chatbots como Siri, da Apple, e Alexa, da Amazon, são exemplos de aprendizado de máquina que aproveitam o processamento de linguagem natural para entender o que as pessoas estão dizendo, além de criar novos textos e realizar traduções de idiomas.
Como funciona o machine learning?
Até agora, analisamos uma definição básica de aprendizado de máquina e destacamos algumas diferenças importantes entre aprendizado de máquina e tecnologias e técnicas intimamente associadas. Com esta base estabelecida, podemos voltar a nossa atenção para Como funciona o Machine Learning.
Geralmente, existem Seis etapas principais na construção de um modelo de aprendizado de máquina Para treinar AI:
- Analise e esclareça o problema do negócio e defina como é o sucesso.
É extremamente importante garantir que os objetivos do modelo atinjam os requisitos de negócios, e não apenas os requisitos de aprendizado de máquina (por exemplo, precisão, precisão, etc.). O objetivo fundamental do modelo é resolver objetivos de negócios significativos, práticos e relevantes — quer isso signifique melhorar as experiências de viagem, tornando-o Mais fácil e mais rápido para as pessoas encontrarem empregoou habilitando Automação de processos de negócios em escala.
- Identifique os requisitos de dados e determine se há dados suficientes disponíveis para criar o modelo de aprendizado de máquina.
A sigla GIGO ("garbage in, garbage out") aplica-se aqui. Sem acesso a um volume suficiente de bons dados, o modelo de aprendizado de máquina será inerentemente incapaz de gerar previsões precisas e confiáveis. Garantir a quantidade e a qualidade dos dados permite que o modelo cumpra seu propósito de treinar AI.
- Recolha e preparação de dados
Em seguida, há uma variedade de atividades de preparação de dados estruturados (por exemplo, números de receita), não estruturados (por exemplo, pesquisas com clientes) e semiestruturados (por exemplo, e-mails) para cobrir, como coleta, limpeza, agregação, aumento, rotulagem, normalização e transformação.
Investir tempo, esforço e recursos de qualidade aqui é necessário. De fato, muitos modelos de aprendizado de máquina elegantes e impressionantes são prejudicados por lacunas no processo de preparação de dados.
- Treinar o modelo
Dados de treinamento são o conjunto de dados usado para treinar o modelo de aprendizado de máquina e isso ensina o algoritmo a tomar decisões.
- Avaliar e medir o desempenho
Pense nesta etapa do processo como um esforço de garantia de qualidade que inclui tarefas como:- Avaliação métrica do modelo: Medidas quantitativas para avaliar o desempenho e a eficácia do modelo de aprendizagem automática.
- Cálculos de matriz de confusão: Uma técnica para resumir o desempenho de um algoritmo de classificação.
- Métricas de desempenho do modelo: aquelas referentes a tarefas de regressão (por exemplo, erro quadrático médio, erro quadrático médio raiz e R-quadrado), bem como aquelas referentes a tarefas de classificação (por exemplo, precisão, precisão e recordação, pontuação F1 e AU-R (MSE), Erro quadrático médio raiz (RMSE) e R² (R-quadrado). Em contraste, as tarefas de classificação usam métricas como Precisão, Matriz de Confusão, Precisão e Recordação, Pontuação F1 e Curva AUC-ROC).
- Medições de qualidade do modelo: elas avaliam o quão bem o modelo de aprendizado de máquina generaliza para dados invisíveis na população-alvo.
- Operacionalizar e iterar o modelo
Operacionalizar o modelo de aprendizado de máquina pode ser um processo relativamente simples (por exemplo, gerar um relatório) ou um esforço mais complexo (por exemplo, implantação de vários pontos finais). No entanto, mesmo que o modelo esteja disparando em todos os cilindros, não há garantia – e não deve haver expectativa – de que ele permanecerá otimizado ao longo do tempo.
Tipos de técnicas algorítmicas
Existem quatro tipos de técnicas de aprendizado de máquina, que moldam e governam as principais funções do modelo, como classificar informações, reconhecer padrões, prever resultados e tomar decisões confiáveis.
Aprendizagem supervisionada
O aprendizado de máquina supervisionado é um processo de aprendizado no qual os algoritmos aprendem continuamente com dados rotulados e, como tal, se tornam mais inteligentes e precisos ao longo do tempo. Os rótulos podem ser orgânicos (ou seja, disponíveis nos próprios dados) ou adicionados externamente. Exemplos de algoritmos de aprendizagem supervisionada incluem árvores de decisão, máquinas vetoriais de suporte, florestas aleatórias e Naive Bayes.
Aprendizagem supervisionada algorithms are found in applications such as image and speech recognition, recommendation systems, and fraud detection.
Com acesso a dados relevantes, o aprendizado supervisionado pode gerar previsões precisas e aplicáveis — que é o objetivo central do modelo de aprendizado de máquina. No entanto, a aprendizagem supervisionada requer um grande conhecimento de domínio e esforço humano para rotular os dados.
Aprendizagem não supervisionada
O aprendizado de máquina não supervisionado é um método de aprendizado no qual o modelo analisa dados não rotulados para encontrar padrões ou tendências ocultos e agrupa pontos de dados em clusters com base em semelhanças ou anomalias. Por exemplo, alguns varejistas aproveitam o aprendizado não supervisionado para prever quando certos tipos de clientes provavelmente sairão do funil de vendas. Essa perceção é usada para ajustar e direcionar campanhas de marketing e mensagens.
O agrupamento K-means é o algoritmo de aprendizado de máquina não supervisionado mais rápido para dividir pontos de dados em grupos, mesmo quando há muito pouca informação disponível.
No entanto, como a aprendizagem não supervisionada é autónoma e não envolve intervenção humana, a falta de respostas predefinidas durante o treino pode dificultar a medição da precisão e fiabilidade.
Aprendizagem semi-supervisionada
Entre aprendizagem supervisionada e aprendizagem não supervisionada é apropriadamente chamada de aprendizagem semi-supervisionada. Com essa abordagem, o modelo é inicialmente treinado usando um pequeno número de amostras rotuladas, que são então aplicadas iterativamente a um volume maior de dados não rotulados (esse processo é conhecido como pseudo-rotulagem). Em última análise, o modelo é treinado usando uma mistura de dados rotulados e rotulados iterativamente.
Um dos principais benefícios da aprendizagem semi-supervisionada é que o tempo e os custos necessários para a preparação de dados são significativamente menores em comparação com a aprendizagem supervisionada. Além disso, ao contrário da aprendizagem não supervisionada, a aprendizagem semi-supervisionada pode aplicar-se a uma vasta gama de problemas (por exemplo, classificação, regressão, agrupamento, associação, etc.). No entanto, a principal desvantagem é que o processo de iteração é altamente complexo e, portanto, não é adequado para problemas mais elaborados.
Aprendizagem por reforço
Aprendizagem por reforço uses a trial-and-error approach to learn which actions and decisions are the most favorable over time. At the core of reinforcement learning is a reward system engine that tells the model when it has made a correct decision (and earned a reward) or made an incorrect decision (and is subjected to a penalty).
Aprendizagem por reforço can be extremely effective at solving complex problems. As the model learns from its mistakes and experiences, the reward and punishment engine reduces the likelihood of repeat errors. However, reinforcement learning requires a large volume of data, and maintenance costs can be high.
A aprendizagem por reforço excessivo também pode levar a uma sobrecarga de estados, o que reduz a fiabilidade dos resultados. Estados são observações que o agente (ou seja, a entidade ou programa independente que percebe através de sensores e age através de atuadores ou efetores) recebe do ambiente.
Exemplos de aplicações de aprendizagem automática
Prevê-se que o mercado global de aprendizado de máquina cresça para US$ 225,91 bilhões até 2030 e já está transformando e avançando em vários setores. A seguir estão alguns exemplos do mundo real e aplicações de aprendizado de máquina.
- Finanças: O aprendizado de máquina é usado para detetar fraudes em tempo real, automatizar tarefas de negociação e habilitar "robo-advisors" que fornecem aos clientes consultoria financeira automatizada com base em seus detalhes exclusivos de portfólio e perfil de risco.
- Negócios: As empresas usam o aprendizado de máquina para projetar chatbots e aplicativos que aumentam o envolvimento do cliente, aumentam as vendas e aprimoram o serviço. As organizações também usam o aprendizado de máquina para tomar decisões baseadas em dados em áreas como recrutamento e alocação de recursos.
- Seguros: O aprendizado de máquina está sendo usado para simplificar os processos de subscrição, acelerar a integração do cliente e reduzir os custos operacionais.
- Genética e genómica: O aprendizado de máquina está sendo usado na análise de dados dentro da pesquisa genética e genômica para entender melhor várias características genéticas, como aquelas que contribuem para distúrbios como hemofilia e diabetes.
- Cuidados de saúde: O aprendizado de máquina está sendo usado para ajudar hospitais e redes de saúde a simplificar processos administrativos e fluxos de trabalho, enquanto o reconhecimento de imagens está permitindo que os patologistas façam diagnósticos melhores e mais rápidos.
- Retalho: O aprendizado de máquina está sendo usado por varejistas para identificar, organizar, analisar e alavancar um imenso volume de dados de clientes estruturados, não estruturados e semiestruturados — tudo, desde comunicações orgânicas de mídia social até histórico de transações de compra — a fim de melhorar as vendas, os lucros, o reconhecimento da marca e envolvimento do cliente.
- Formação: O aprendizado de máquina está sendo usado para avaliar os níveis de habilidade dos alunos e desenvolver experiência instrucional guiada e currículo que os ajuda a se tornarem mais proficientes.
- Entretenimento: O aprendizado de máquina está sendo usado por serviços de streaming (por exemplo, Netflix, Amazon Prime Video, Disney+, Hulu, etc.) dentro de seus mecanismos de recomendação para fornecer aos assinantes conteúdo relevante com base em escolhas de visualização anteriores, bem como conteúdo que está sendo acessado por outros indivíduos que compartilham certas preferências ou características.
- Veículos autónomos: O aprendizado de máquina está sendo usado no desenvolvimento de robótica avançada e carros autônomos. Os veículos autônomos aproveitam a visão computacional (um tipo de AI), aprendizado de máquina e dados em tempo real de sensores para ajudar na navegação e na tomada de decisões para garantir a segurança dos passageiros.
Estes são apenas uma amostra dos casos de uso existentes para aprendizado de máquina. Há também muitos desenvolvimentos empolgantes de aprendizado de máquina no horizonte, como o crescimento de Ecossistemas de dados na nuvem, ao potencial de utilização Computação quântica para otimizar algoritmos para big data.
A palavra final
Enquanto o mundo está fervilhando sobre AI (e por muitas razões válidas), nos bastidores e longe dos holofotes, o aprendizado de máquina está sendo usado todos os dias em novas iniciativas de ciência de dados para transformar imensas quantidades de dados em insights confiáveis que resolvem problemas importantes e atingem objetivos dignos: tudo desde melhorar o entretenimentoPara melhorar a educaçãoPara Salvar vidas.
Saiba mais sobre o aprendizado de máquina em Artigos e Insights.