E aí pessoal beleza começando mais uma aula eu sou Professor Arnaldo professor de informática do Instituto Federal do Tocantins e hoje a gente vai aprender um pouco sobre aprendizado de máquina ou Machine learn mas antes da gente entrar no conteúdo eu gostaria de estender a vocês o convite para ingressarem aí no nosso grupo de WhatsApp para quem quer estudar informática para concurso de informática lá vocês vão ter acesso a PDF para leitura materiais que eu desenvolvo ao longo do meu trabalho enquanto professor questões para resolução entre outras vantagens outros benefícios Beleza então vamos agora para
o conteúdo vamos começar aqui entendendo a definição de aprendizado de máquina e é importante a gente de cara já deixar bem clara a distinção entre aprendizado de máquina e inteligência artificial a inteligência artificial ela é mais macro ela Ela opera num campo maior do que o aprendizado de máquina a inteligência artificial ela de forma simples falando ela busca analisar o meio no qual o sistema está inserido e Obter dados e a partir desse dados tomar decisões mais certeiras mais inteligentes o aprendizado de máquina por sua vez é uma sub área dentro da Inteligência Artificial e
a definição que eu trouxe aqui para vocês uma delas é a seguinte trata-se de do ramo da Inteligência Artificial de um ramo da Inteligência Artificial focado no uso de dados e algoritmos para imitar a forma como os humanos aprendem gradualmente aumentando a taxa de acerto então a coisa que é importante destacar aqui é que o aprendizado de máquina ele faz uso de metros estatísticos de algoritmos para tendo como entrada alguns dados e a partir desses dados por meio do processamento implementado ali através do método estatístico ele vai gerar uma saída buscando prever alguma informação ou
classificar dados classificar informações ou predizer algum comportamento Futuro por exemplo e uma característica de um sistema desse é que ao longo das experiências que ele vai tendo ele vai melhorando a sua taxa de acertos a gente pode também falar que o aprendizado de máquina é uma técnica que melhora a performance de sistemas aprendendo a partir de experiências via métodos computacionais É isso mesmo a gente vai ver mais à frente que existem algumas formas diferentes desses algoritmos e aprendizado de máquinas funcionarem mas todos eles têm essa característica em comum de aprender com as experiências que eles
vão é adquirindo ao longo do trabalho ao longo do processamento a gente também pode falar que aprendizado de máquina é um treinamento de algoritmos a partir de metas estatísticos para fazer classificações e predições a gente pode a partir do aprendizado de máquina identificar por exemplo potenciais clientes para terem uma vantagem exclusiva ou classificar clientes entre bons e maus pagadores ou identificar por exemplo se um e-mail que está chegando é um spam ou não nós temos em aplicações para este Esta área de conhecimento e permite descobrir em sites em projetos de mineração de dados o que
que são os insights em sites são aquelas aquelas descobertas importantes para um negócio para alta gestão de uma empresa para que ela possa tomar decisões estratégicas com base nessas informações como por exemplo uma grande rede Supermercados a gente pode um Insight seria por exemplo a partir da aplicação de uma técnica de aprendizado de máquina o analista de o cientista de dados ele descobriu que pessoas que compram pão compram café e leite costumam comprar café e leite então isso é um Insight é uma informação importante que pode por exemplo ajudar alta gestão as gerências superiores a
disporem os produtos de forma mais inteligente claro sempre buscando ali o lucro né no caso de uma empresa então por exemplo poderia já sabendo disso colocar perto do Pão o leite o café e é o que acontece legal nada é à toa nessas grandes empresas elas fazem uso dessas informações dos dados Hoje os nossos dados eles já estão na internet então tem-se muitas informações acerca dos usuários e com base nessas informações as empresas compreendem o seu público-alvo e naturalmente vendem para ele ou oferecem o conteúdo que mais desagrada uma outra coisa que é importante deixar
a gente deixar bem claro é que aprendizado de máquina não não se confunde também com Big da ou Big Data aí né a portuguesando o Big Data dessa questão da gente processar né E tratar uma grande quantidade de dados legal você ter armazenado né através de um Day da were a gente tem a nossa aula sobre Dead A partir dessa grande quantidade de dados as empresas aplicam esses métodos de Inteligência Artificial de aprendizado de máquina para obter essas informações privilegiadas que que eu tô retratando para vocês agora OK então o Big daida e o aprendizado
de máquina eles caminham em conjunto E como funciona Professor basicamente a gente tem três passos O primeiro é o processo de decisão os algoritmos são utilizados para fazer uma classificação ou uma predição a gente pode chamar de petição ou previsão a partir de dados rotulados ou não produz uma estimativa legal então nós temos algoritmos diversos que são implementados aí nós temos também entrada de dados tá então a gente tem sempre essa questão da entrada de dados esses dados podem ser rotulados ou não Professor o que que é um dado rotulado é um dado que já
vem classificado um dia desses aí no nosso grupo do WhatsApp Surgiu uma questão Eu acho que eu coloquei para vocês uma questão que tratava justamente sobre sobre um funcionário do Banco do Brasil ter que classificar lá se o quais eram os clientes atos a receberem um cartão VIP né E aí o analista ele teve como entrada ele já tinha ali um banco de informações acerca dos clientes que já inclusive tinha uma uma indicação prévia um rótulo indicando se aquele cliente bom ou não se era bom o mal paga doce tava devendo algo nesse sentido então
isso já são Dados mas são Dados rotulados porque eles já possui ali informações acerca da classificando o cliente em bom ou mau pagador por exemplo Beleza então isso é um dado rotulado o dado não do outro lado são essas informações que vem mas não tem uma classificação prévia o algoritmo vai vai através da observação dos métodos estatísticos ele vai classificar vai separar esses elementos dentro da amostra de acordo com características em comum vai classificar Ok então esse é o primeiro passo o segundo passo é o que a gente chama de função de erro que busca
ali que avalia a predição do modelo né que verifica se o modelo por exemplo um algoritmo ele pode ter ali já alguns exemplos de sucesso então ele observa o que foi previsto né a predição do modelo o resultado e compara com outras experiências ou com outros resultados de sucesso e ali ele consegue avaliar se o se foi satisfatório ou não o que pode ser melhorado né terceiro passo é o processo de otimização do modelo que busca reduzir a discrepância entre exemplos conhecidos e o modelo estimado na otimização a gente vai ter também esse processo de
avaliar o resultado alcançado é o que se esperava alcançar não é e como que que essa como que ocorre essa otimização Professor uma das formas é ajustando os pesos Então você recebe dados como entrada informações diversas o seu nome os seus CPF os seus hábitos de navegação de compra e pode-se por exemplo mudar o peso que se dá a cada um desses atributos então pode ser que para indicar um produto para você ou um conteúdo que talvez você vá gostar ele o algoritmo considere como mais importante de como tendo maior peso um atributo A ou
B Ok então observem isso que você que o algoritmo ele pode dar pesos diferentes para cada uma dessas características legal e isso vai Claro ocorrer esses ajustes podem ocorrer pelo algoritmo Mas normalmente ali com a supervisão do cientista de dados OK aí nós onde que isso é aplicada né Nós temos aqui alguns exemplos onde que o aprendizado de máquina é aplicar Todos nós temos contato com com o resultado do da aplicação de um aprendizado de máquina diariamente nós vemos por exemplo na recomendação de conteúdo isso que eu acabei de dizer então todos já passamos pela
experiência de a gente sabe quando a gente está navegando no Google por exemplo o Google começa a oferecer para nós conteúdos relacionados ao nosso gosto o YouTube também faz isso da mesma forma a gente pode questionar alguma coisa ou outra mas eles a partir de dados que eles coletam de nós eles vão ali é moldando o conteúdo de acordo com o nosso gosto e também claro oferecendo produto serviços para consumo outra coisa é na tradução de textos então identificar frases expressões e o significado dessas expressões então na tradução também a gente tem aplicação disso no
combate à fraudes em Sistemas de pagamentos ou vários outros sistemas cibernéticos a gente tem o emprego dessa tecnologia para a identificação dessas dessas ações fraudulentas né então por exemplo o sistema bancário ele tem mecanismos para identificar se foi você ou não que fez é uma aquisição então por exemplo vamos supor que a gente perdeu um cartão de crédito E aí sei lá eu moro aqui na cidade de Palmas Tocantins faça aquisições aqui mas sei lá de repente de manhã 8 horas eu fiz uma compra aqui e aí sei lá 10 horas ocorreu uma compra em
São Paulo né fica o sistema bancário pode a partir desses dados cruzar informações e verificar que não faz sentido sim 8 horas ele tava numa cidade duas horas está em outra e não é um local habitual do cliente está então isso já pode o algoritmo pode destacar isso aí como uma fraude né seria uma um Outlander é um ponto fora do padrão uma anomalia comportamental Beleza então o normal seria o quê se eu tô aqui na cidade eu Possivelmente eu tenho uma rota de consumo Até chegar na cidade tal então se o banco observa que
eu fui fazendo compras com cartão no meio do percurso ao longo de um tempo aí sim tem mais sentido né então Possivelmente nesse caso que eu acabei de retratar o sistema pode identificar um caso de clonagem de cartão por exemplo banco de dados autônomo também é outra aplicação Entre várias outras que vocês nem imaginam fundamentos básicos do aprendizado de máquina vamos compreender aqui primeira coisa a terminologia né as palavras inerentes a essa tecnologia então para conduzir uma um aprendizado de máquina eu tô chamando aqui de am para a gente abreviar primeiramente precisamos de dados legal
e nós temos aí o todo desses dados que entram que são analisados por algoritmo compõem o que a gente chama de conjunto de dados tá é um conjunto de registros onde cada um contém a descrição de um evento ou de objeto nesse exemplo que eu retratei para vocês a gente pode ter um como entrada de dados né um conjunto de dados ali com registros contendo informações a meu respeito a seu respeito então cada objeto desse que traz essas nossas informações é o que a gente chama aqui de um registro e faz parte de um conjunto
de dados ou desde sete um registro também pode ser chamado de Instância ou amostra Então eu tenho informações de consumo de todos os consumimos realizados realizados na cidade e tal tem uma empresa X então eu posso daquele todo daquele conjunto todo extrair algumas amostras para serem analisadas de acordo com a intenção do algoritmo o registro possui também atributos que descrevem o evento ou objeto então a gente vê também exemplos do tipo existem sistemas que armazenam um histórico do preço de um produto Então você tem ali Você pode ter ali um histórico de registros contendo informações
atributos acerca daquele produto e aí o que são os atributos é o nome do produto é o preço que ele teve no período tal então no ano de 2020 esse violão custava r$ 1000 atualmente esse violão custa sei lá r$ 2000 Então são atributos que você tem acerca do registro que foi armazenado que está sendo analisado pelo algoritmo outra coisa aprendizado e treinamento esse processo todo que que a gente está descrevendo aqui é o que a gente chama de aprendizado e treinamento processo de usar algoritmos para aprendizagem de máquina visando aí construir modelos a partir
de dados então você pode chamar isso de aprendizado ou de Treinamento dados de Treinamento são os dados utilizados na fase de Treinamento onde cada mostra é um exemplo de Treinamento todas as amostras formam um conjunto de Treinamento um conceito importante dentro do aprendizado de máquina é o conceito de hipótese e a hipótese nada mais é do que o resultado gerado pelo algoritmo tá então é uma das possibilidades ali que foram que foi gerada a partir do algoritmo de aprendizado de máquina então na maioria dos algoritmos de aprendizado de máquina supervisionado o objetivo é descobrir uma
possível hipótese a partir do espaço de hipóteses que poderia mapear as entradas para as saídas adequadas Então dentro desse conjunto de possibilidades na hora do algoritmo determinar um resultado ou prever um valor um número ou classificar alguma coisa é ele tem diversas possibilidades e aí o algoritmo ele vai escolher o que ele considera como sendo a melhor possibilidade a melhor hipótese para aquela situação ou seja aqui apresenta uma menor taxa de erros legal então isso é uma hipótese e é importante que vocês saibam que desse conjunto de hipótese do que ele chama que de espaço
de hipóteses o algoritmo vai escolher apenas um então o espaço de hipóteses representado como H maiúsculo aqui vou mostrar um gráfico para vocês ele é um conjunto de todas as hipóteses jurídicas possíveis e aqui o jurídicas entendam como como hipóteses válidas que estão de acordo com os critérios estabelecidos configurados para o algoritmo então algoritmo ele tem que escolher a melhor hipótese que descreve a função alvo ou os resultados almejados então o que que é uma hipótese uma hipótese pode ser compreendido também como uma fórmula ou função G que é obtida para aproximar a função alvo
Tá mas o que que é a função alvo a função alvo é uma função que tem um domínio x que são as entradas e os contra domínios Y que são as saídas para vocês entenderem melhor tem esse gráfico aqui essa imagem que que trata que da produção é de hipótese final né então o algoritmo ele recebe dados e ele vai ter que gerar uma hipótese ele vai ter que escolher né então por exemplo se um sistema ele recebeu um conjunto de dados ele um antivírus ele vai ter que classificar aqueles antivírus como sendo um vírus
ou não é um cavalo de tróia ou não é um cavalo de tróia então ele tem várias possibilidades na hora de classificar aqueles dados todos que chegaram tá então Ó nós temos aqui a chamada função alvo a qual me referir agora pouco então a função alvo ela é desconhecida ela tem x de entrada então x aqui representa a entrada os dados que vão ver né e com base nessa entrada essas informações vão ser analisadas pelo algoritmo e ele vai gerar a saída os dados de saída que são os dados classificados ó então do que chegou
aqui isso é vírus isso não é vírus que é representado aqui através do Y então x a entrada Y saída Então essa é a função alvo uma função lembra que a função é a mesma coisa também que hipótese é uma hipótese desconhecida tá função alvo que ainda quer desconhecida é o começo do algoritmo tá aí ele vai realizar diversos treinamentos lá dentro então com base nos dados ele vai efetuar vários testes por meio de metas estatísticos e outras e outros métodos ele vai aprender alguma coisa né então A ideia é o sistema aprender simulando o
comportamento humano né Como que você aprende como que eu aprendo é por tentativa ergo é fazendo muitas vezes sim né Então essa é uma das formas então então eu tento pelo caminho a resolver um cálculo não foi vou tentar pelo caminho B pelo um caminho C então eu tenho vários Treinamentos e de acordo com essas experiências obtidas no final eu vou chegar a uma hipótese uma conclusão que eu acho que é que é a correta que é a mais Certeira que a hipótese final tá então lembra disso você tem o algoritmo Inicial você tem entrada
dos dados você tem a etapa de treinamento de testes e depois o aprendizado né o algoritmo vai aprender e vai gerar a hipótese final bacana E aí você dentro dessa desse aprendizado Você tem o espaço de hipóteses que são todas as possibilidades para gerar um resultado vamos entender melhor ó eu tenho aqui uma essa imagem que traz aqui algumas representações vamos entender por exemplo como se fosse um sistema de e-mail em que ele tem que classificar se o e-mail é spam ou não então a gente poderia entender que o mais é spam e o menos
é meio normal não é esse pão e aí eu tenho aqui quatro elementos quatro dados que entraram que eu não sei o que eles são e eu vou ter que classificar eles né então a entrada e vou ter que gerar saída E aí eu já tenho algumas informações prévias aqui ó Isso aqui é um spam Então esse cara é ou não é então eu tenho várias possibilidades uma possibilidade ou hipótese né Tem várias hipóteses é essa de separar aqui nesse ponto os dados então daqui para esquerda por exemplo pode ser spam ou não e daqui
para direita pode ser não é spam né aqui a Espanha que não é spam E aí os valores aqui trocados pode ser falso negativo falso positivo mas Resumindo eu tenho uma possibilidade de classificação aqui eu tenho outra que é outra forma de delimitar esses dados separando aqui dois elementos à esquerda e dois à direita então todas essas possibilidades de separação na geração do resultado final é o que a gente chama de de espaço de hipóteses tá então o conjunto de todas essas hipóteses caracterizam o espaço de hipóteses e cada uma dessas linhas aqui representa uma
hipótese em especial tá então são formas diferentes de eu agrupar os dados os elementos que estão sendo considerados então voltando aqui ó a gente tem é a função né a função que é chamada de função G que a hipótese Inicial que ela obtida para aproximar a função alta ela vai buscar alcançar a função alvo e a função alvo é justamente aquela que a gente viu no gráfico né Essa aqui ó que vai ter uma entrada e vai gerar uma saída então quando ele fala aproximar aqui é tentar fazer com que o a hipótese final seja
mais Certeira possível Porque é importante a gente saber que nem sempre o resultado que é apontado pelo algoritmo É de fato o melhor resultado na prática tá então o algoritmo com base nas informações dele ou nas suas configurações e ele vai indicar alguma coisa para você né então a gente tem várias aplicações mas por exemplo na indicação de conteúdo ele tem que escolher esse se ele vai indicar um vídeo A ou B para você o YouTube por exemplo ele quer te agradar o máximo possível E aí ele tem que escolher cara qual será que ele
vai gostar mais é esse vídeo ou esse vídeo porque eu quero que ele fique mais tempo aqui então é pode ser que ele indique um que não seja o mais certeiro Então essa diferença do que de fato é o melhor e do que foi indicado ou de fé é o que chama de viés então a viés é a diferença ao quadrado da melhor função e da função Alfa diferença ao quadrado da melhor função e da função alvo Beleza então ó função alvo é o que se pretende é aquela hipótese Inicial bacana E aí a melhor
função é o que de fato representa ali o que realmente é melhor o melhor resultado possível o conjunto de hipóteses ele é tendencioso com relação à função alvo tá então toda a configuração os dados eles são direcionados para se buscar atender um objetivo Então você tem uma uma condução cientista de dado muitas vezes ele vai conduzir o sistema em um caminho a Pode ser que o sistema ele ele mude de direção né mas você tem ali uma tendência em cima do conjunto de hipóteses bacana E aí nós temos dois tipos de aprendizado duas classificações mas
reconhecidas tá que é o aprendizado supervisionado e o não supervisionado nós temos outras outros tipos de aprendizado também eu vou retratar inclusive mais um deles aqui mas é basicamente os amplamente divulgados e conhecidos são dois aprendizados supervisionado e não supervisionado o aprendizado supervisionado ele faz uso de um conjunto de dados rotulados para treinarem os algoritmos para fazer em classificações ou previsões ao longo da entrada de dados o modelo pode ter seus pesos ajustados foi aquilo que eu falei né então ó uma das características do aprendizado supervisionado é que ele tem como entrada dados já rotulados
ou seja já classificados então foi o que eu falei no começo da aula né do analista que teve que colocou como entrada dos dados do algoritmo dados já rotulados com informações contendo se o cliente já já era um bom cliente ou não então é um dado que ele já veio pré-classificado Bacana Então isso é o conceito principal ali na classificação de um algoritmo com aprendizado supervisionado bacana e é utilizado por exemplo na classificação de spam ok né Então você já tem ali ó você vai por exemplo oferecer para o sistema de e-mail já um conjunto
de dados já mostrando ó e-mail sistema se você por exemplo observar dados e Meios que seguem esses padrões você já tem aí um indício de spam Então são ou seja os dados que entram para esse algoritmo Eles já possuem uma classificação ele já tá falando ó Isso aqui é um spam se você ver algo semelhante já saiba que são spam e a gente já consegue observar que por exemplo sistemas de antivírus também a gente tem muito isso né as assinaturas de milhares de vírus conhecidos E aí essas assinaturas ou seja elas entram como dados E
aí os dados já estão classificando ó isso aqui esse tipo de dado já é um vírus já é um cavalo de tróia por exemplo Então já são Dados que já vem classificados então Isso define um aprendizado supervisionado tá eu vi algumas questões por exemplo tentando trazer ou confundir o confundir a gente no sentido de que a supervisão é basicamente ter a interação humana não necessariamente tá Pessoal esse não é o cerne da coisa o conceito principal aqui no aprendizado supervisionado você tem entrada de dados já rotulados já classificados tá o não supervisionado ele tem entrada
de dados mas não classificados ele vai ter que descobrir se aquilo por exemplo é um é um spam ou não seguindo o mesmo exemplo ok ele não tem ele já tem dados mas não tá dizendo o que é Como assim professor não entendi eu vi um exemplo muito bom na internet estudando que que é trazendo aí o contexto do da Educação do aprendizado infantil então por exemplo o aprendizado supervisionado seria eu pegar por exemplo uma uma página com diversas frutas e ali já tem o nome né já indicando então a criança vai ver ó Isso
aqui é uma maçã Olha isso aqui é uma laranja Isso aqui é uma melancia Então já tem uma classificação lá já tá dizendo que é então ó Isso aqui é fruta Isso aqui é uma fruta Isso aqui é uma fruta então isso já é classificado o aprendizado não supervisionado é quando por exemplo você tem os dados você tem aqueles elementos as frutas objetos mas não tá dizendo que é fruta E aí como é que a criança vai vai descobrir é olhando as características Então ela olhar e vai falar Ah isso aqui parece ser uma fruta
então Ah isso aqui isso aqui eu acho que é uma fruta a esse aqui Eu também acho que é uma fruta aí esse aqui eu acho que que é um que é um outro produto então ele já vai separar para o outro lado então ou seja são informações que não vieram rotulados E aí de acordo com as características ele foi lá e descobriu e classificou o segundo que ele o que ele tava levando em consideração legal então isso é aprendizado previsionado não vá nessa de que ah o supervisionado é quando tem interação humano e o
nosso previsionado é quando não tem interação humano não na realidade ambos Em algum momento vão carecer da interação humana até o mecanismo um aprendizado de máquina não supervisionado vai ter que em algum momento ser configurado ser ajustado ter seus pesos alterados ali por um cientista de dados métodos que são utilizados no aprendizado supervisionado nós temos redes neurais nave bayers você tem regressão linear regressão logísticas é logística Floresta aleatória eu suporte Vector Machine Mas a frente eu vou explicar para vocês alguns desses métodos aprendizado não supervisionado o aprendizado não supervisionado tem como característica a classificação A
análise de dados não rotulados então ele faz uso de algoritmos e apesar de máquina para analisar e agrupar dados mas esses dados eles não vem com nenhuma indicação prévia ele tem chega o dado para o algoritmo algoritmo vai analisar essas informações e a partir dos critérios considerados e do algoritmo vai gerar a classificação a previsão que ele considera como sendo a mais correta mais assertiva bacana não saiba disso aprendizado não supervisionado os dados de entrada não são rotulados aprendizados supervisionado os dados de entrada já vem do outro lado só lembrar desse exemplo do vírus né
do antivírus por exemplo então o algoritmo ele já recebe um conjunto de dados que já indicando ali alguns possíveis vírus então Ó esse tipo de dado isso aqui já é um vírus então o algoritmo usa isso como um parâmetro para comparação Ah então eu tenho um outro dado aqui já que esse aqui é um vírus Então esse que Possivelmente também é legal e aí o nosso pressionado ele vai ter que descobrir né então o que que é isso aí ele vai agrupar isso aqui é mais para classificação né então por isso que nesse caso do
antivírus é mais utilizado o supervisionado o não supervisionado a gente vai ver muito em classificações e sistemas para classificação de dados porque aí ele vai agrupar segundo critérios em comum né então ou seja fazem parte de uma mesma classe descobre padrões escondidos e agrupamento de dados sem a necessidade de intervenção humana Então por conta própria ele consegue descobrir isso né não precisa o humano indicar isso é tal coisa isso é tal coisa mas não se confunda não quer dizer que que não tenha que que de forma nenhuma tem intervenção humana que tá falando sem a
necessidade de intervenção mas não quer dizer que ou seja não precisa ele consegue se virar Mas pode ser que tenha às vezes é necessário a intervenção humana tá para por exemplo ajustar os pesos que vão ser considerados nesses dados então às vezes para falar algoritmo o que o que você tá indicando não é necessariamente o melhor né então pode ser pode ser necessário realizar alguns ajustes para que os resultados sejam mais certeiros vou descobrir se pode descobrir similaridades e diferenças entre informações e por conta disso é ideal para explorar estratégias de vendas segmentação de clientes
e reconhecimento de imagens e padrões Olha aí algumas das aplicações possíveis estratégias de vendas São essas como por exemplo eu citei de organizar produtos de uma forma lógica para que venda mais né então aquilo aquele Corredor no supermercado direto com caixa tem aqueles produtos ali mas não é de forma aleatória Eles já foram pensados para para o consumo métodos utilizados aí no aprendizado não supervisionado a gente tem o principal Company é análises nós temos o singular vela e decomposition redes neurais também ou seja as redes neurais podem ser utilizadas tanto no aprendizado supervisionado quanto no
aprendizado não supervisionado nós temos plasterização via o Caminhos tá esse caminho já vi já vi muita questão sobre ele então a gente vai ter mais aí na frente uma explicação melhor sobre o caminhos então caminhos é um método um algoritmo que opera dentro do aprendizado não supervisionar e métodos de costelização probabilísticos a título de conhecimento trouxe aqui para vocês o aprendizado por reforço o aprendizado por reforço ele é semelhante ao aprendizado supervisionado mas o algoritmo não é treinado com dados de amostras o aprendizado por reforço ele busca aprender através da tentativa e erro então de
acordo com as experiências que ele vai obtendo a partir dos resultados é ele vai ali ajustando o seu aprendizado mas como assim como onde que isso poderia ser aplicado por exemplo professor e como que ele vai saber se ele acertou ou se errou você já Possivelmente já se depararam com a questão depois de uma indicação de um conteúdo Ou seja no Google ou no YouTube o sistema te perguntando esse conteúdo é do seu gosto é isso mesmo você gostou da indicação Então nada disso é à toa né quando você responde não não gostei ou seja
ele vai entender como erroupra Opa o algoritmo indicou um conteúdo que não foi de agrado do cliente então ele errou na predição na previsão legal E aí ele vai tentar de novo por outro caminho com outra hipótese legal algoritmos de aprendizagem de máquina Então vamos lá galera eu tô trazendo aqui para vocês uma noção geral sobre os principais algoritmos você não vai ficar phd no algoritmo tá isso aqui para você dominar as redes neurais você você tem que é uma vida de estudo tá você tem que entrar de cabeça no estudo é da Matemática entre
outros elementos ali que são considerados aqui no caso das redes neurais também da biologia outras áreas de conhecimento estatística para você entender como isso funciona de fato é por baixo do pano mas a nossa ideia aqui é trazer uma noção Geral do que é e como funciona esses algoritmos que é o suficiente para gente conseguir responder as nossas questões aí nos concursos tá então o que são redes neurais ela simulam a forma como o cérebro humano funciona e pensa e como é estabelecendo ali diversas ligações entre os neurônios tá então nas redes neurais a gente
tem uma estrutura matemática que Visa simular uma uma célula biológica cerebral Ok então é uma tentativa de representar uma representação de uma célula biológica como ela é na realidade então possui um grande número de nós de processamento ligado são boas para reconhecer padrões e para aplicações como tradução de linguagem natural reconhecimento e criação de imagem eu trouxe aqui uma um gráfico uma imagem para vocês para facilitar a compreensão então nós temos ó entradas aqui quatro entradas para o algoritmo pesos que foram dados a essas entradas Bacana Então a gente já aprendeu que é possível você
alterar os pesos indicando o que é ou não mais relevante mais importante na busca E aí você tem descobertas intermediárias né os neurônios intermediários E aí por fim você tem os neurônios de saída que são representam o resultado do algoritmo legal as redes neurais elas são retratadas também como uma caixa preta então o que ocorre no centro dela às vezes é difícil de você controlar Então você tem as entradas você estabelece pesos para as informações para os dados que vão entrar nessa nesse algoritmo mas é como ele de fato funciona lá dentro é bem complexo
E é difícil às vezes de você mapear isso E aí o algoritmo vai gerar uma saída é x ou Y nós temos também a regressão linear que é o algoritmo utilizado para predizer valores numéricos Observe bem uma atenção especial para essas essas esses destaques que eu deixo aí no conteúdo para leitura tá então ó regressão linear para é para predizer valores numéricos não quer dizer que o único algoritmo mas ouviu falar de pré dizer valores numéricos a gente tem aí regressão linear como uma das principais alternativas é baseado no relacionamento linear entre dois valores diferentes
por exemplo pode ser utilizado para prever os preços de casas baseando-se no histórico de preços da área OK então Com base numa série de informações de dados históricos acerca por exemplo que das casas na região esse algoritmo pode ali prever o valor determinar estatisticamente né qual seria o valor mais apropriado para o imóvel naquela região regressão logística é o algoritmo de aprendizado supervisionado que faz previsões com base em variáveis de respostas categóricas e o que seriam isso são respostas do tipo sim ou não bacana são aquelas respostas que só tem um caminho a ou o
caminho B ou é ou não é pode ser utilizado em aplicações como classificação de spams e controle de qualidade em uma linha de produção então o produto tá saindo lá beleza em algum ponto vai olhar atende os critérios mínimos para comercialização sim ou não atende vai para um lado se não atende vai para outro lado spam né o algoritmo do sistema do e-mail vai ter que vai ter que decidir chegou o e-mail isso aqui é um spam não é é um vírus ou não é então ele vai olhar e por meio da regressão é logística
Ou seja é lembra que é um algoritmo de aprendizado supervisionado ou seja ele já tem uma entrada já tem uma amostra ali com dados já indicando o que seria cada coisa O que é o que não é né então por exemplo do spam né então ó e-mails com essas características já já são indicativo de spams então o dado que você está analisando Se assemelhar algum desses sim então é um spam vai para um lado não não é não não se assemelha Ah então Possivelmente não é o spam pode ter outros critérios né e ele também
pode aprender com as experiências próprias mas segundo esses critérios ele vai ter que escolher se é ou não é então isso é o que caracteriza a regressão logística eu tenho aqui um gráfico se vocês quiserem se aprofundar mais no estudo sobre esses métodos eu coloco aí ó na de onde Foi retirada a imagem Você pode pesquisar e estudar nós temos aí artigos bem bacanas para vocês irem mais fundo aí estudo Ok Então olha aí nós temos aqui um modelo que recebe três entradas com peso é igual para as três entradas representado ali a 1 2
e 3 né e gera vai ter que que decide se a saída é ele tá feliz ou não Ou tá triste tá feliz ou tá triste o algoritmo por exemplo pode escolher isso utilizar um sistema desse para indicar um produto um chocolate que pode amenizar sua dor que pode te trazer te trazer uma alegria momentânea né ou então é alguma outra coisa de acordo com a intenção do algoritmo né posterização é outro método importante é utilizado para basicamente fazer o que a gente chama de agrupamento de dados outra característica da clasterização é um é um
método de aprendizado não supervisionado então quando a gente fala de cluster separar em clusters é basicamente agrupar classificar Então eu tenho sei lá uma série de de alunos que chega numa escola e aí eu preciso agrupar eles em turmas diferentes então de acordo com alguns critérios eu posso falar não você vai por primeiro ano você vai para o segundo você vai para o terceiro então eu consigo ali com base na nesses dados de entrada agrupá-los por características e uma dessas características pode ser a idade pode ser o nível de conhecimento depende do do da função
algo do que se pretende alcançar tá então a clasterização é faz parte do aprendizado não supervisionado aí esse algoritmos podem identificar padrões em dados ó computadores podem ajudar os cientistas de dados identificando diferenças entre dados que humanos podem não perceber Essa é Outra vantagem né então o computador justamente para ele poder cruzar essa quantidade de informações absurdamente maior do que o cérebro humano pode comportar ele consegue visualizar e identificar coisas que nós enquanto humanos temos a limitação de fazê-lo então o sistema computacional ele é eficiente nessa forma e nós temos aí é ocorrer um bom
né ultimamente com lançamento do chat GPT creio que a maioria de vocês já ouviu falar sobre esse tema que é a uma ia que faz de tudo que compõem que compõem música que cria Artes cria quadros criar imagens já vi a aplicação da Iara por exemplo operacionalizando como um advogado defendendo um réu claro que numa situação bem específica ambiente controlado Mas você a gente já consegue imaginar o quanto isso poderia ser mais eficiente do que o ser humano né porque nesse caso por exemplo da advocacia um sistema desse ele consegue cruzar informações jurisprudências decisões é
uma escala global e muito mais Ampla e aprofundado do que o ser humano pode armazenar na cabeça Então essa é isso é uma demonstração do quanto aí há e o aprendizado de máquina dentro da ia né então cada vez mais presentes nas nossas vidas olha aqui um exemplo de castelização nós temos aqui ó um conjunto de dados não rotulados lembra né é aprendizado não supervisionado então o conjunto de dados é não rotulados é o que ele chama aqui de labeller né Professor mas é tudo em inglês faz parte da ti né quem tá estudando fazendo
uma graduação estudando na área de TI ou que quer prestar compostagem tem a compreensão do inglês é fundamental então tem termos que eu mantenho em inglês tá eu não faço questão de traduzir e muitas vezes a gente vê aplicar esses termos caindo nas provas em inglês também então não muita coisa não tem tradução então ó dados não rotulados como entrada e aí a partir do da pasteurização Você tem os dados já agrupados em clusters diferentes né O que ele classificou ali como verde azul e vermelho o algoritmo utilizado nesse exemplo aqui é o caminho então
a gente já já descobre que o caminho é um algoritmo de costerização logo ele é para aprendizado não supervisionado Beleza você não errar uma questão sobre o Caminhos normalmente cai algo mais especial então caminhos é o algoritmo de clusterização para aprendizado não supervisionado por quê Porque ele vai ter que descobrir e é agrupar esses dados E aí sim aplicar os rótulos de acordo com que ele descobriu árvore de decisões é outro método utilizado é utilizado tanto para prever valores numéricos né lá da regressão linear vocês lembra quanto para classificar dados em categorias utilizam uma sequência
de ramificações de decisões relacionadas são fáceis de validar e auditar Diferentemente da rede neural né Por conta daquilo que eu falei né identificado muitas vezes se referem a ele como uma caixa preta dada a não transparência por exemplo de um de uma árvore de decisões é mais fácil a gente visualizar o comportamento da árvore de decisões então árvore de decisões ela funciona dessa forma é simples ó ela é representada como se fosse uma árvore na estrutura de dados temos aí nossa aula de estrutura de dados também no canal então nós temos ali o nó que
é a raiz da árvore né E aí ela vai se ramificando em sub nós né e como é que funciona as árvores de decisões é que por exemplo ó é nessa pesquisa ele tá querendo saber se a pessoa ela é Fit ou não né ou seja se ela está em forma ou não está em forma aí tem aqui os critérios levados em consideração a idade é menor que 30 sim ou não então sim aí Pergunta come muita pizza Se sim então não está em forma senão está em forma aí no caso contrário tem aqui a
pessoa tem menos de 30 anos não pode ter 30 ou mais Então vem para cá faz exercícios de manhã sim então a pessoa é fit senão não faz né claro que isso aqui não necessariamente é o retrato da realidade que é apenas um exemplo que foi retirado dessa fonte mas só para a gente ver o funcionamento do algoritmo né então árvore de decisões funciona dessa forma E aí a gente tem as árvores aleatórias que ela junta várias árvores de decisões para a tomada de decisão tá Como assim professor ó ela prevê um valor uma categoria
combinando os resultados de um número de árvores de decisões Olha aqui eu tenho aqui por exemplo é três árvores de decisões que foram consideradas nesse algoritmo então tem uma árvore um árvore dois e a árvore 3 OK aí com base nessa nessas decisões o algoritmo verificou que na abre um Ele identificou que isso aqui é uma uma maçã com base na árvore 2 ele também a árvore dois identificou que isso que a entrada seria uma maçã abre três por sua vez identificou como uma banana a professor mas eu não tô conseguindo fazer uma relação com
algo prático é a gente pode voltar naqueles exemplos que eu que eu falei para vocês novamente né então o algoritmo vai ter que indicar se um e-mail é um spam não Ou se um arquivo é um vírus ou não é um vírus então ou com base na decisão do usuário por exemplo é o algoritmo vai ter que decidir qual conteúdo que eu vou exibir para ele né Aí ele tá na dúvida então é uma palavra com ambiguidade que tem dois sentidos então ele quer dizer um exemplo lá da cobra né ele tá pesquisando cobra enquanto
substantivo enquanto animal ou cobra enquanto o verbo cobrar então ele pode usar é experiências anteriores do próprio usuário então em um dado momento lá na primeira indicação do algoritmo o usuário falou que não de fato é isso que eu tô querendo o algoritmo foi lá e falou para ele ó é isso que você tá querendo ele foi lá e falou é Ah beleza a segunda vez o algoritmo recomendo outra coisa relacionada a esse conteúdo e aí ele falou não é o que eu tô querendo na terceira vez ele falou ele recomendou algo no mesmo sentido
e o usuário falou não não é isso que eu tô querendo então ele tem três árvores de decisões desse usuário acerca do conteúdo que tá sendo indicado pelo algoritmo E aí com base nessas três ele vai avaliar uma quarta vez aí ele vê não pelo histórico dele a gente Está acertando mais enterrando então Possivelmente É sim nesse caso aqui ele tá querendo classificar se é uma maçã ou não então nas duas experiências né iniciais um algoritmo identificou como uma maçã na terceira que foi uma banana então é pela maior pelo voto da maioria o algoritmo
entende aí que classificou na no final e como uma maçã mesmo então na árvore aleatória você tem isso a utilização de várias árvores de decisões como como critério na decisão final Vamos falar agora sobre processamento de linguagem natural é um ramo da EA focado em dar aos computadores a habilidade de entender textos e palavras ditas da mesma forma que um humano o processamento de linguagem natural Ele tá em nossas vidas de diversas formas mas o foco desse tipo de processamento é aproximar o comportamento do computador ao comportamento que um humano um humano teria em dado
a situação como por exemplo ao em um sistema de atendimento ao cliente por exemplo é comum a gente muitas vezes interagir com um computador com o sistema e isso por vezes pode incomodar o cliente mas se o sistema ela consegue dar ao computador um comportamento mais natural que se aproxima mais ao comportamento humano você pode Minimizar esse efeito negativo por parte do cliente então o cliente pode não se incomodar tanto e isso não vai prejudicar a imagem da empresa dá mais satisfação para o cliente com isso você fazendo com que o computador pense mais próximo
de um ser humano você consegue também proporcionar um comportamento mais humanizado digamos assim então muitas vezes por exemplo ao compreender a fala do cliente o que o cliente queria dizer para um computador pode ser mais complicado né às vezes não a gente sabe num país que nem o nosso com linguagens de diversificadas regionais existem muitas expressões que em um ponto significa ou uma coisa e outro ponto significa outra mas um ser humano pela experiência por conhecer os dois lados muitas vezes vai saber o que o que a pessoa quis dizer ou não mas o computador
nem sempre tem essa habilidade mas por meio da Inteligência Artificial você consegue dar essa essas informações para ele para que ele consiga entender ah você tá querendo dizer isso E aí você o computador Age de uma forma mais humanizada Mas mesmo por exemplo em veículos mais modernos e carros mais modernos a função de de comando por voz esses dias eu vi um exemplo que eu até achei engraçado o cara tava dentro de uma Mercedes E aí ele deu o seguinte comando para o carro Mercedes por favor colocar na temperatura máxima e segundo ele pela fala
dele a gente vê o que ele ele queria colocar no mais gelado ele falou temperatura máxima mas o sistema entendeu Da forma mais correta né mais tradicional então temperatura máxima seria maior temperatura então ele foi e colocou o carro na temperatura mais quente que tinha E aí o cara ele queria na verdade a temperatura máxima ele quis dizer com menor temperatura então o erro aí foi do do operador do sistema né então o sistemas computacionais tem que lidar com essas especificidades com essas diferenças que são inerentes ao ser humano e isso ocorre através do processamento
de linguagem natural Visa tornar realidade a ideia de conversar com uma máquina sem a preocupação de códigos combina computação linguística com estatística machine learning e Deep learning tarefas que um sistema de processamento de linguagem natural pode em que elas podem ser empregadas reconhecimento de discurso parte de marcação de discurso passem marcação de discurso é justamente identificar numa fala numa frase então não comando desse por exemplo que eu retratei para o computador o sistema em uma palavra que pode ser um verbo e um substantivo ao mesmo tempo o computador tentar descobrir o que ele tá querendo
dizer se é de acordo com a frase se aquilo é um verbo ou se é o substantivo e a partir dessa identificação ele vai tomar a decisão mais correta remover ambiguidade palavras dessa mesma linha reconhecimento de nomes de entidades então muitas vezes na fala não discurso na tradução de um texto o tradutor identificar que uma palavra remete a um nome né ao nome próprio ao nome de uma de uma entidade o nome de um órgão de alguma coisa que não demanda tradução por exemplo né então análise de sentimentos conseguisse aproximar mais do do dessa parte
emocional do ser humano compreender dar emoção né para o sistema geração de linguagem natural entre Outras aplicações eu trouxe aqui uma imagem que retrata diversas aplicações tá então aqui ó na tradução de linguagem no filtro de e-mail na análise de sentimentos em chatbots monitoramento de rede social sumarização automática predição textual buscas online análise de documento e a assistente de momento smartphone Então você tem diversas aplicações Pessoal esse conceito de processamento de linguagem natural ele é mais profundo ele demanda Eu entendo que ele demanda uma aula própria legal então em breve vou estar disponibilizando para vocês
se não já estiver na data desse vídeo uma aula própria sobre processamento de linguagem natural pessoal então é isso tá a nossa ideia aqui foi dar uma noção geral para vocês sobre o que é o aprendizado de máquina o machine learning você claro que você não vai virar um Expert uma aula com o tempo desse isso aqui demanda um estudo muito mais aprofundado mas para fins de concurso Primeiro passo é esse a gente tem uma compreensão geral sobre o tema E aí se você tiver tempo você aprofunda mais nos eixos naquelas matérias que você julga
ser mais importante ou tem mais dificuldade segundo os critérios que você está utilizando né E aí por sinal já pergunta Será que você utiliza os critérios corretos na hora de escolher o conteúdo a ser estudado o Machine learn pode te ajudar nessa linha tem posto alguma ferramenta que pode trazer por exemplo é dados estatísticos que vão te indicar de forma mais correta o que é mais importante ou não essa é uma aplicação Legal qualquer dúvida pode deixar o seu comentário aí no YouTube Valeu um grande abraço Bons estudos e até a próxima