Unknown

0 views23647 WordsCopy TextShare
Unknown
Video Transcript:
bom dia hoje o nosso objetivo é entender o que é uma rede neural tá entender porque talvez você não esteja aprendendo tem uma rede neural apesar de existirem outros materiais e na internet e aí talvez você tenha que cobrir uma base mesmo né matemática então Eu segui o conselho do mano Brau outra base entender o que está te faltando e vamos implementar coisa sem pai torta entender como é que funciona o pai Pilar em do pai torce né quando eu falo Empires Online você tem que pensar lá linha de produção é a forma de você
estruturar um programa para você construir redes neurais artificiais e realizar alguma tarefa Tá mas não vai fazer tarefas sofisticadas aqui hoje a gente não vai fazer diferente que estou a fazer visão computacional fazer nada disso eu vou fazer aqui um tipo de conteúdo que é muito difícil você encontrar como como estou te prometendo né da miniatura essa livre pai sorte em todos o pai torce e redes neurais como você nunca viu certo e você pode encontrar aí Cruzeiro vou te dar referências no final do dessa Live de outros materiais que você pode seguir pode usar
coisas materiais de visão computacional que você pode olhar o pro tutorial lado do pai corte e depois essa lá e você vai ter mais clareza de como você pode andar né por meio desse materiais e absorver o conhecimento Serra coisa que talvez eu tivesse na dificuldade de fazer você passa direto para eles agora show bom então eu vou começar compartilhando aqui esse notebook tá vendo então isso aqui é um notebook no Google colab Será se não rolar é um ambiente online é um ambiente na nuvem aí da Google que você consegue trabalhar é como se
fosse um Júpiter notebook né então você pode escrever aqui em Python e r em Julho a também dá para fazer né com todo Júpiter notebook mesmo e ele já tem muita coisa instalada aí né inclusive para tort site Horne várias coisas para trabalhar com dados machine learning e certa tá aqui cê usa muito Google colab aqui no nosso canal inclusive ela tem um vídeo se você pesquisar sobre Google colar Muito provavelmente vai bater no vídeo dela né então você botar aqui Google colab né abreviação de google.com laboratório na verdade nome completo do negócio e você
vai ver que tem aqui ó como usar o colar para analisar dados é o mesmo da 15 que te explica em menos de 15 minutos para quem gosta de coisa um belo saquinho você já saber transitar muito bem aqui no grupo lá perto então vou utilizar este ambiente que ele tem a vantagem de utilizar a nuvem da Google então pô não precisa não tem o computador muito bom para rodar redes a gastar esse negócio aqui é pesado não tem contado Muito bom Show de bola você usa só o browser para acessar essa nome da Google
e lá você vai ter acesso inclusive e a computadores com GPU né placas de vídeo muito poderosa é depois de tacna quando terminar eu vou poder disponibilizar esse link para vocês então vou colocar o link um repositório lá no vídeo hum minami tirar posou com barra programação de lá no nosso Leite Rubi de projetos eu vou colocar o link atualizar aqui na descrição dessa Live então depois você pode voltar aqui clicar nesse link você vai ter acesso a tudo que a gente vai construir aqui ao vivo Tudo belezinha aí e é show de bola então
e hoje o vídeo já tá aqui ó tem um filme inception até né então quando você tiver essas o material você vai ter acesso Inclusive a gravação desse vídeo para poder consultar algumas coisinhas e a gente vai começar então refletindo sobre o que é uma rede neural artificial né porque bomba rede neural a rede que tá na tua cabeça aí na rede de neurônios tá e quando a gente fala de rede e a rede é um outro termo é Tecnicamente tá um tem um similar ágrafo aquele na matemática a gente usa mais gráfico e aí
galera da Computação computação dele bem da matemática sem usa também bastante graça mas tem outras áreas conhecimento costumo utilizar crede Mas você pode pensar no tipo de representação similar em que você tem coisas e obrigações entre essas coisas tá no caso a gente vai ter neurônios artificiais e Conexões Entre esses neurônios artificiais é isso que a gente vai ter esse carro rede neural tá é Apesar apesar deste nome enganoso tá Inclusive eu fiquei bastante chateado de ver um material está sendo divulgado por propaganda no Instagram Essa semana tá Fiquei bastante chateado de ver o material
sendo divulgado propaganda que aparece na minha frente a semana falando com uma rede neural é um negócio que imitava o cérebro tá que assim fazia igual sério cara não faz vou sério tá não faz consegue no meu meu não faz mano não vai você sabe como é que saiu funciona Soubesse você tentar entender uma rede neural como algo que tá fazendo o quê o teu cérebro pais primeiro tá errado depois você não sabe o que eu saio do faz noite a gente não jogou nada então eu vou nada tá então assim eu diria que a
forma mais correta de você entender aqui é um modelo tá modelo aproximação modelo como você fala ouve modelo aproximação tá um modelo computacional ou seja uma aproximação que pode ser o cara ali no computador vai virar um programa certa modelo computacional que de fato foi inspirado inspirado Pelo certo Tá inspirado pela forma como o cérebro funciona EA respiração tá em que está no fato de que no cérebro nós temos neurônios e se conectam e se comunicam Então você vai ter um modelo em que as partes computacionais parte que fazem contas que se conectam e se
comunicam é aí tá é aí a gente não sabe como é que saíram funciona exatamente a gente não sabe é o quão longe essas coisas Realmente são parecidas beleza show de bola então vamos começar entendendo o que é o tal do neurônio artificial que é estado de nervo artificial Aqui tá um desenho Zinho que se você botar Mendes Morais na no Google assim olhar para imagens Provavelmente você vai bater alguma pessoa vai ter que isso aqui tá pode ser aqui é os meus resultados não são exatamente isso porque os meus resultados forma a gente vai
mostrar um grave completo assim um monte de conexão e tal mas eu amo você vai ver essa figurinha aqui e se você procurar Mais especificamente tem o neurônio artificial ou perception é o nome do modelo tá você vai certamente chegar nas que eu vim aqui ó bom então o percebe Tron ele é um modelo para o meu lá no hospital tá então aproximação que funciona da seguinte forma pensa nele como essa bolinha aqui tá essa bolinha e ela vai fazer duas coisas ela tem duas etapas no seu funcionamento tá a primeira etapa é ela vai
receber uma determinada quantidade de dados Então onde você tá lendo aqui um antes né traz um input é entrada então aqui é o teu dado tá vendo x 1 x 2 x 3 até xn quer dizer você pode ter um dado que é por exemplo um vetor né que tem uma determinada quantidade de elementos ali tá a gente vai começar a Condado bem simples hoje um lado que vai ser no não sei que você poderia ter um dado ali então o Victor ta o teu meu ano artificial teu pé certo ele tem é um outro
vetor dentro dele tá gente chama de pesos tá então aqui tá chamando de Waze Waze pelos tá sendo representada aqui para ser w Beleza o que ele faz é eu e Vai Multiplicar e para quem já viu aí álgebra linear vai fazer um produto escalar entre a tua entrada e o peso que ele tem tá que quer dizer isso pra quem não sabe que é pelo zucala então ele vai fazer e vai pegar a primeira posição do Peso é um vetor Aqui também tá aí Você quer um vetor 01 vetor não tem ele posições aqui
ele posições aqui ela pegar as coisas correspondentes a primeira aqui a primeira aqui a segunda aqui com a segunda aqui Vai Multiplicar vou esperar esse por esse nós pegar esse presente pega tudo depois soma Tá certo tá aqui Vai Multiplicar e somar tá E ele pode também somar e pós também somar que não passando representado aqui uma pena né Eu gostei das imagem mas ela falhou e não representar uma outra coisa que é bem comum de ter na obrigatório Mas é bem comum de ter que a gente chama de baias tá aí você vai precisar
de um bebezinho aqui que seria uma coisa que você soma e que não depende não depende da entrada aqui não Vai Multiplicar ninguém na entrada tá então assim tem os caras que multiplicam e se multiplicar e se muito a pena que se multiplica aí eu sou tudo e depois eu tomo mais um valor simplesmente somos mais um valor será que o valor que não Vai Multiplicar ninguém aqui esse valor a mais a gente eu vou de baias tá é um é um viés ver a tradução para o no português assim e faça tipo viés mesmo
que você segue ali no meu mano beleza então a primeira etapa do funcionamento desse negócio especial ele faz uma multiplicação é uma soma tá vou fazer uma multiplicação a soma eu e definindo uma função que tipo de condução é essa pode responder tempo eu vou ajudar vocês aqui pensa assim e eu tenho um único valor por exemplo um xizinho aqui é o meu único valor aí agora eu vou multiplicar esse x o único valor multiplica aqui por w e vou somar um outro valor isso aqui é o quê velho você sabe que é isso mano
você já viu se eu desenhasse isso aqui só parece um gráfico disso como é que seria a cara desse negócio ah ah é um polinômio é um tipo de polinômios por polinômio do 1º grau o juntar então aqui a tua resposta Gabriel com a resposta do Arthur ela se complementam né então é um polinômio de primeiro grau né que a gente sabe que é uma reta certo então em uma dimensão uma reta e imagem menções coisa tem duas dimensões seria um plano em mais do que duas dimensões alguém te chama de na verdade a reta
gente desenho duas dimensões é Apesar dela ser uma coisa de um a dimensão antes desenho em duas dimensões desenho do plano aí o plano A gente desenha em 3D né E se eu tivesse mais dimensões que a gente não consegue enxergar a gente chama de hiperplan show então isso aqui representa o Inter plano se você tiver um X que é um vetor tem x 1 x 2 até XL show de bola Ok por quê que o percepção não pode parar aí porque que o neurônio artificial e não pode pagar ele porque certamente e onde fake
do Barack Obama falando que programação dinâmica é o melhor canal que já existiu em toda a história da humanidade não vai ser criado por uma reta certo não vai ser um modelo tão simples como esse aqui vai criar esse de buffet e eu acho que mesmo sem saber toda matemática em por trás vocês tem muitos saúde aqui né Se fosse tão simples assim que a gente não fez isso há muito tempo atrás né Que que é isso agora a gente tem tecnologia para conseguir resolver esse problema tá então a gente precisa de uma segunda etapa
Então tudo isso aqui esse produto e é soma é a primeira etapa do que é realizado aqui no percebe Tron existe uma segunda etapa que a gente faz uma composição de funções tá então isso aqui já definir uma função essa que define uma função daquela função dado existe isso né é uma função por exemplo posso escrever como e é fdx e é igual isso aqui Tá certo então quando eu recebo x recebo um elemento de um conjunto eu vou multiplicar esse elemento que eu acabei de receber por um w e vou somar 1b é isso
uma função aquecer permite uma coisa aqui transforma e o evento de um conjunto em um outro elemento de outro conjunto Pode ser que seus conjuntos seja né do mesmo tipo do primeiro mas não precisa ser show de bola então vou fazer uma composição com uma outra função que ele chamou aqui de fi que é uma função mais complicada tá é uma função não-linear então a gente fala de coisas linear você vai pensar em produto e soma assim que vai ter representação ano e meio de uma linha né uma reta hiper pronto tá eu sou são
coisas que você vai associar combinar e eu sou é legal mas não é muito complexo e agora eu posso fazer coisas não lineares não tem uma coisa não me a por exemplo x ao quadrado p**** multiplicando xxl porta já vê que faz uma parábola negócio já ficou diferente entendeu por sendo o arco cosseno de x é um negócio não me ligar não é uma reta um negócio do país assim né enfim você vai ter uma função ali não linear tá possuem esperado no cérebro humano o convencionou-se chamar essa função de função de ativação o que
pegar lá observou eu não gosto da partir meu anjo fica Tá mas a parte histórica ainda que eu conheço que observou que os neurônios eles ignoram alguns sinais e deixam outros passar então assim o meu onde é que tem uma faixa de ativação para qual ele vai responder e transmitir aquele sinal e foi essa faixa e vai demorar o sinal tá então galera falou tá E vamos modelar isso aí né Vamos pensar então nosso modelo aqui a gente vai colocar uma função ali que a gente vai com um pouco essa primeira parte e essa função
ela vai ter essa característica de ignorar uma coisa e dizer olha beleza essa outra coisa que eu eu quero dar atenção para isso tá e é isso já é um negócio que está sendo discutido atualmente em termos de pesquisa eu tô trabalhando tá numa pesquisa agora nesse exato momento que não usa bem uma função de ativação da uma função que não é ignora na parte da coisa assim eu diminui muito é o resultado de uma parte e amplificar outra não tô dizendo uma coisa assim eu tô usando uma função que não linear mas que ela
tem uma característica assim mais tipo né cosseno centro tá bom então o que o neurônio faz no final das contas é aplicar a função firme utilizar uma outra coisa aqui para você fixar aplicar a função física a função f Tá certo e ir uma função de ativação muito utilizada que é que eu tinha que a gente vai utilizar hoje é uma função chamada reylo o rack Fire Line Unidos acho que é isso em inglês tá eu não tenho precisando ou se é e eu nem te vejo mas acho que ainda que ela faz o seguinte
ela tem a seguinte cara essa função e ela e ela é o valor a DX quando é positivo e zero se for negativo é muito simples noite simples mesmo Ou seja é uma coisa quase linear né Ela é linear por partes assim ela não linear mas é linear por partes porque depois no campo positivo a linear no campo negativo ela também é linear né mas ação linear Eu tenho minha amizade diferente tá e o só o fato de utilizar isso é surpreendente tá isso aqui que é surpreendente precisa dormir só falta utilizar isso já permitia
que você consiga construir redes que vão representar funções bem sofisticadas tá então é só isso mudou agora isso ele vai fazer um produto de valores que estão nele tá esses pesos são pesos do neurônio bom então vai fazer um produto de valores que estão neles pelo valor que tá chegando do dado entrado vai sua mão outro valor que tá nele gente chama de barras e depois aplicar uma função não-linear certo é só isso só isso que o negócio faz esse neurônio artificial o que é certo é tão simples que você mesmo poderia ter implementado você
mesmo poderia tentar você acha eu te falar assim aí para mim ver um negócio que faz isso aqui tá se você tem alguma experiência com programação ou com matemática Talvez um matemático que não tem a programado muito já começou aprender a programar selar esse mês mas já tem uma experiência uma tem mais que vai ter baixa fácil implementar isso aqui pode não fazer para mim tá ser mais eficiente mais cara você simplesmente precisa receber um vetor você tem um outro vetor E você Vai Multiplicar esses caras posições correspondentes você pode fazer isso com um só
já poderia fazer isso com pó e é depois você vai tomar um outro valor calma explicações toma e depois você não swith se for maior do que Zaga esse resultado eu dou ele mesmo se formando quiser eu do zero é preciso tá então é tão simples eu trouxe para vocês aqui uma implementação é um pouco mais complicada você conectar são aqui as classes as coisas e tal mas se você perceber a gente vai pegar o necta aqui das implementação vou pegar um néctar dela para você tá Se você prestar atenção no que está acontecendo aqui
você poderia implementar e desta forma perception Olá eu sou gente aqui pra que a gente até o momento eu não preciso de mais o que tá show é isso aí ó o show de bola então eu falei experimentar uma coisa dessa forma você tem pesos que você começou a inicializando como a quantidade de imputes mais um porque eu te falei que você tem um cara que você soma se multiplicar os outros certo e o resultado é você calcular este produto aqui que tá chamando d.net né pra instalar realmente aqui ou não pelo Doutor tenho uma
termo repara que ele está ignorando o índice zero né está pegando Só durmo até o final porque a quantidade de impostos que você tem aqui você faz esse produto e depois você soma o cara do zero pa e aí você vai ficar assim esse valor aqui foi o maior tu quiseres povoado quiser agora você ativou né então você meio que você quer retornar que ele botou um nas poderia retornar somado quiser você retorna a própria soma ir se for menor do que zero você recorta na água e a se não eu vou dizer aqui que
é assim eles o retorno aqui show cara é isso que faz esse bagulho e é isso aqui bota deixar suplementação aqui para você dar uma cidadinha depois tá já deixei a referência aqui se você quiser olhar depois o link da onde eu peguei mas assim eu não estou recomendando esse negócio aqui realmente coloquei na internet perception implementation um pai tem o primeiro link que apareceu olhei e falei cara é realmente isso aqui tá representando que eu queria mostrar pra galera ótimo tá só para não perder tempo escrevendo um negócio que o mesmo poderia ser show
legal então é pô deixei na tela aqui o primeiro grau ali um pequeno break pro ver que vocês tão fazendo posso cortar esse bem aqui também depois na Edson então se eu ver que você tá me perguntando aqui e acabou de pousar hoje usando eu fico pensando que as pessoas dizem gente especial Ah tá bom então uma boa pergunta aqui ó e o vetor de pesos é sempre do mesmo tamanho do vetor de entrada É sim mas alguém te pergunta e Tamar Gouveia assim né então você vai fazer produto escalar para você fazer para buscá-la
você precisa ter realmente a mesma dimensão né então tem nenhuma quantidade mesmo tamanho mesmo tá você veio aqui e botou uma mais porque eu integrou o Buzz Aline mas ele tá separando aqui tá vendo bom então tem que ter realmente é mesmo é um novo membro aqui Mateus António Muito obrigado Mateus postá-la membro do canal e apoiar o nosso trabalho muito obrigado e lembra de Matriz que você só podia me explicar é duas matrizes eu morrer de colunas de uma igual e Exatamente isso tá você pode pensar exatamente nisso pela pela perspectiva né pela Ótica
de matrizes né É como se tivesse um produto de uma matriz linha uma matriz coluna né então a atriz que é uma linha e n colunas ou uma outra Matriz que tem que ter em linhas e uma coluna mas no final você tem uma coisa que é um por um é o nome tá show de bola e é assim que funciona o meu olho artificial e é tem um livro legal chamado algoritmo mestre não sei se já encomendou não recomendo não bom valeu Então beleza vamos para parte 2 é uma parte 2 que entender agora
A rede Noel o show então entender o que é o nono artificial não entender o que é rede neural aí Joel nada mais é do que eu começar a juntar esses caras colocar eles em rede não formar um gráfico como eu vinha falando para vocês no começo tá então não gráfico computacional né então A ideia é que cada bolinha dessa aqui que você tá enxergando é é um perception tá se você quiser pensar e você pode pensar de outra forma Tá bom vamos mensagem aqui com o em cores diferentes Vamos pensar assim ó ó Ah
não desculpa vou pensar do jeito que eu tô pensando mesmo porque tem as setinhas aqui certinha estão ajudando tou tou sabendo o seguinte a pensa que eu tenho dado é que tem dois valores tá então tá aqui ó um valorzinho' invés de outro valor Zinho aqui um beijo também tá já estamos em dois valores do dado E aí aqui você tem cinco perceptions tá aqui vocês cinco pés então para quê que você vai fazer você pode lançar o teu dado quando é que tá o teu dado a cada um desses pepro tão reparaste que cada
um deles esse azulzinho aqui tá recebendo duas a estas duas conexões esse azul aqui também recebe do hoje conexões eu sou daqui também hoje conexão e assim vai tá então o que acontece aqui dentro tem que ter um WD que tamanho os dois se elas estão o w o vetor de pesos tem que ter tamanho 2 porque ele vai receber uma entrada e tem tamanho 22 valores eu posso multiplicar né w-11 pela entrada 1 W2 para mim para 2 e depois eu somo o Buzz cada um deles a fazer isso certo e aí depois de
cada um deles fizer isso cada um deles lança sua resposta para a próxima camada tá então já tô dando aqui nome de camada para as coisas então a gente tem uma camada de entrada que não é composta pelos neurônios é a sua entrada mesmo soldado aí tem uma camada de perception tá que a gente costuma chamar de camada escondida que ir tem a camada de saída que vai fazer aqui o mesmo tipo de conta então o que que vai acontecer aqui aqui na verdade tem uma diferença entre essa Quem muito pensa costuma acontecer entre essa
aqui e a outra tá que essa aqui ela vai fazer a combinação desses carnes como a gente viu multiplica soma e depois aplica a função não-linear no caso a gente usou a Rio tá aí eu joguei para cá quanto os carrinhos o w daqui tem que ter Oi tá entrando um dois três quatro cinco eu tenho que ter cinco pesos tá ou um vetor de peso com 5 entradas e aí eu consigo combinar tudo isso só como eles todos combinam eu vou ter um único valor tá Jair é essa camada final aqui você pode querer
aplicar uma não linearidade aqui ou não às vezes você vai realmente utilizar só aquele valor que você já somou combinei tem um valor tem um número é um negócio que eu quero ou não vou explicar que nome realidade também e depois que tiver o remo o resultado do Rio ou eu vou ter o resultado ou vou apertar mas não linearidade nada diferente eu apliquei rio aqui eu vou ficar uma outra coisa aqui tá então isso depende só varia com problema é que você tem que ter em mente é que e você vai fazer uma combinação
linear das coisas tá uma coisa que a gente chama na verdade de combinação afim porque é uma parte que você multiplica em uma coisa que você soma que não depende da entrada Tá eu vou fazer essa combinação ir a combinação disso aqui você combinasse só reta Aí perguntamos você ia ter só só retas tá função você conseguir representar essa reta você fizer a composição a fazer uma composição aqui de um uma reta aqui com outra que que vai acontecer a outra vai entrar aqui vou até a desenhar o até falei mesmo porque pode ser que
alguém esteja enxergando se tiver uma outra função tem essa cara aqui ó a cheias mas a cê tá eu fiz a composição de duas coisas que são lineares ou obter uma terceira coisa que é ganhar também ó no lugar do X aqui eu substituí essa outra função eu vou ter o w que multiplica AX mais cedo a + b bom então eu fico com uma coisa aqui que é w a às vezes se isso que é simplesmente 11 aí o que estava explicando x a como se fosse um outro w aqui tá onde o valor
estamos pecando x-mas wc a + b O que é tão bem né depois sou mais aqui também o mundo agora tá então isso aqui tem a mesma carga esse resultado ele tem exatamente a mesma carga já tinha antes tá então você ficar fazendo composição de ir ter planos né ou reta se você quiser olhar mais baixa dimensão Você não vai sair das retas é porque você precisa de um negócio não tá pode como você chega aqui no final você já trabalhou aqui no meio aqui no final você pode simplesmente peguei o salva hoje A directora
tá então vai acontecer diversas combinações tá uma das questões de pesquisa e de trabalho e variações que vão ter nas aplicações das dessas redes é justamente você entender qual que é melhor que tudo para resolver o teu problema continuamos eu vou colocar por aqui tem cinco Mas por que que eu não volto vocês que eu não boto 20 porque eu não porque tem uma camada só que não tem duas camadas eu poderia ter mais uma outra camada aqui de neurônios o que você colega então é prima tem um 30 camadas Então essas perguntas São perguntas
em aberto São perguntas ainda você não trabalha não temas de pesquisa a gente entende algumas arquiteturas com que elas funcionam assim a gente entende que algumas aqui tensores vão dar bons resultados para alguns problemas tá então isso a gente conseguiu mapear algum tipo de trocar Beleza eu quero fazer uma coisa aqui para gerar dpp Beleza então tem um tipo de arquitetura que eu sei que pode chegar lá e tem outro que eu sei que não vai dar em nada eu quero fazer um negócio que a gente vai fazer daqui a pouco que é realmente fazer
um uma representação de uma função específica tá beleza como é que a gente trabalha aí tá então essas coisas vão variar Tá mas a ideia base é exatamente frente parou de ver o show a pergunta é pertinente aqui se fosse colocar em termos mais simples então diria que isso é aplicação de funções compostas Com certeza agora o que é simples ou não depende de quem você é né Porque de fato eu poderia falar que simplesmente composição de funções e foi por conta disso que ontem no matemáticos não estava computação lá no Twitter às dezoito horas
é um projeto que a gente quinzenalmente da aula sobre matemática Hum Tem exatamente um tempo de aula sobre funções compostas e tem gente que tá aqui que Assistiu à aula de ontem Será que ela justamente preparação para a aula de hoje deixou Então a composição de funções Mas a questão de ser simples é subjetivo Porque para mim por exemplo é muito simples eu falar que uma rede neural é um modelo paramétrico de uma função e para a maioria das pessoas aqui eu acho que esse não diria nada a perceber que você comentou tem a ver
com o tamanho de baias carga talvez tem a ver diretamente assim eu não tô vendo nada a ver não tá eu não diria que tem mas talvez tenha em quantas camadas mínimas necessárias para análise de imagens por exemplo o que é análise de imagens Esse é um problema só tem diversos laminares imagens eu estava fazendo uma pergunta que é mau Costa Você tá em São Paulo não Oi mãe onde é que se tem mais perguntas pertinentes aqui eu saía 5xw de Flamengo esdrúxula é não sei receio aí de como você passa entendido isso me diz
aí se você entendeu realmente depois da explicação Ou você tem alguma dúvida Ainda com isso a ir a rã o show bom então vou seguir as dúvidas que não são relacionadas diretamente o que a gente tá falando aqui agora eu vou deixar para o final beleza galera eu vou seguir com a explicação aqui o show de bola Então chegou alguém aqui de Moçambique muito bem-vindo Junho Santo tá então você percebeu que a gente consegue fazer essa a conexão entre de lavar Serra onde processual ele já era uma composição entre uma parte linear e uma parte
não linear uma posição de funções uma rede neural ela é uma função que é resultado de uma composição de várias coisas né então eu tô representando aqui o mais simples mas se você colocar aqui no Google algo como rede neural artificial vão pesquisar se em português o que acontece imagens é uma delas essa aqui todas as imagens que eu peguei e coloquei ali no material são da Wikipédia que estão à venda em domínio público para responder otimizar sem problemas isso vai contar coisas que tem essa carga aqui você acha Então olha só Quantas camadas esquece
aqui tá legal de ver ó na sua conta as camadas e tem aqui ó Ah tá porque é camada de entrada dos dados e três camadas escondidas com 369 neurônios cada tá E essa que ainda uma rede pequena então o termo Deep learning média aprendizado profundo eu e foi cunhado à medida que o tamanho dessa gente cresceu tá gente começar a ficar profundas do tipo assim 16 camadas com 256 no ônibus cada por exemplo tá imagina só 16 canais com 6 56 neurônios da Ilha escondidos ali né então sem contar a entrada EA saída da
Guia 16 vezes 256 então 16 a 2 a quarta 12562 8º 2 elevado a 12 que é 1024 x 4 + 4.800 pagamos mais quatro mil e quinhentos mil homens reparamos todas as coisas a gente vai ver a 4mil e tantos neurônios nessa rede e ainda é pequena tá em relação a coisas que que podem ser feito então quando você ver uma coisa tipo GT3 que tá esperando o áudio e não sei o que tal várias pessoas falam se mexer três ainda no passado e aí se diz assim a gente três tem trilhões milhões não
sei quantos milhões de parâmetros carga mais rede muito grande Tá a gente que tem muito mas muito neurôni muito os vetores eles têm tamanhos muito grandes certo você pensar numa imagem por exemplo uma imagem de 256 por 256 tá é uma resolução bem pequena né hoje está falando aí de quatro cá é um negócio aqui tem né 3.000 não sei quantos por menos e quatro então dizer que se conhecer hoje tem quantos pixels 236 vezes tudo 66 Olha esse produto aí você vai ver tem que só pra caramba agora tu pega uma coisa e quatro
carros multiplica o tamanho que você E também o outro vai ver que tem um outro fixo muito pizza para você analisar e cada Pixel desse e pode ser interpretado como um dado certo cada pizza esse pode se deve tá do meu lado então sabe aquelas coisas elas crescem bastante e o custo computacional de fazer esses cálculos também quer Simões tá então temos Deep Lane vende isso de você conseguir fazer várias alguns dados mas não importa não importa o número de camadas que tenha uma rede neural vai continuar sendo a mesma coisa que é o que
uma função essa coisa mais importante que você tem para assimilar e Talvez seja isso que te impede de entender como que uma região a funciona como que você consegue trabalhar por que que você não consegue entender as coisas você tem que entender uma rede neural ela é uma função cada rede neural casa rede neural diferente e vai ser uma função diferente da rede neural ela é uma representação de uma função representação de uma função certo então as pessoas falem sobre o modelo Eu já falei modelo aproximação pode pensar em representação tá ela é um modelo
computacional uma representação de algo que você pode calcular no computador fazer contas em cima computacional de uma função Tá como assim Alisson cai uma função é o pessoal a função mas se você consegue pensar provavelmente uma reta Será que você poderia representar uma reta com uma rede neural pode Esse vai ser o primeiro a gente vai fazer hoje tá gente vai pegar é uma reto uma função que a gente vai escrever talvez aqui algo do tipo sei lá 2x mais 3 se vocês quiserem me dar uma outra reta diferente depois do Além da também e
você vai a gente vai apresentar Isso numa rede Noel e a gente vai fazer uma mineral para representar chamo não a gente vai fazer isso pode ver o resultado nossa primeira tarefa a gente vai ter que entender tem que entender coisa mais importante assim dele é com a Regional é uma função e aí um garras prende a gente vai entender no meio do caminho quando a gente precisar chegar ali beleza bom então e vamos começar a implementar as coisas E aí o top talk show me the code Como criar uma rede neural vamos lá bom
então a gente vai te avisar para o meu chamado paytoshi né uma biblioteca chamada o pai torch quem é ela já tá instalada aqui no ambiente do Google colab tá se você quiser instalar localmente na sua máquina que vai te curar documentação lá né pics tá ao Tosh tá vai ser Alguns alguns detalhes dependendo de como você vai utilizar essa biblioteca tá mas aqui no Gol quadrado e vocês tiverem pode começar importando Thor tá então é assim que você pensa essas coisas que estão definidas lá no cartório Import torch é a gente vai cair importar
mais uma coisa E aí eu vou ficar carregando anotação aqui que é é esse n n a poderia escrever torque convênio lá na frente vai entender mas eu vou importar assim tão carregado atração e eu acho que a gente pode importar mais uma coisinha aqui no começo Talvez seja um pai que a gente vai precisar dando um pai interessante tem um parque sem a gente precisar a gente já importou E aí eu sou bom então ele está conectando aqui o ambiente a travar conectando alguma máquina para mim lá no servidores da Google e e vai
executar executou o show de bola próxima saiu hoje código aqui vamos construir uma rede neural Então vamos começar tô construindo um modelo simples O que é para representar uma reta tá quantos milhões eu preciso para representar uma reta pergunta para vocês Tá certo quantas camadas e continuamos a preciso para representar uma reta E aí E aí E aí E aí 12 a suficiente dois a mais do que suficiente eu preciso de um só a gente não viu que o percebe Tron a primeira parte dele é justamente e representa uma reta primeira parte dele é o
Gui faz um produto né e uma soma Tá certo então único nome permite apresentar uma reta é a função mais importante pode tentar representar aqui certo então vamos fazer aqui uma uma rede neural que eu vou chamar de Line Network o tamanho da da letra da suficiente para vocês eu nem sei se eu consigo aumentar aqui e no colab o que de bom para mim aí e a consigo aqui de boa como é que tá o tamanho o tamanho da letra aumentar um pouquinho aqui de repente 24 não dá tá formatado oi para mim tá
bom mas eu tô no PC aí então galera que vem no celular de repente Deixa eu ver com 28 Vai ficar ruim tá suave eu vou estar 28 Então tá eu vou criar aqui uma uma classe que vai representar um pouco de bordado aqui para representar o nosso a nossa rede eu tô chamando aqui de Laine Network poderia ter dado o nome qualquer para ela certo e o importante aqui ela perde ela é verde e um módulo no By torrent e isso é importante ela tem que ter ajudado módulo Python arte ou então eu vou
ter que construir do zero na nossa objetivo certo tem que aproveitar tudo que já tá tava mais forte e aqui né se nesse módulo NN tem uma classe chamada modo de onde todas as redes deveriam dele Vá para trabalharem com pai torce tudo bem a gente vai ajudar nesse carro né E aí a gente precisa sobrescrever dois métodos né hum é o de inicialização comum assim quando recebe classes em em paz tá e o outro é um que se chama Power e esse Ford diz o que que a rede vai fazer com um dado que
entra se x é que eu dado que entra beleza eu não vou até colocar aqui em termos de comentários né inicialização mas ele ia ser óbvio né esse aqui me quem é e como que a rede computa E aí o show então para inicializar e que a gente precisa fazer alguma coisa que é especificidade aqui no pai corte é que a gente precisa reinicializar a classe base nessa classe mobdro e eles vão chamar o init dela tá é para quem trabalha com orientação objeto e outras linguagens já deve ter visto isso de você tá dentro
do Construtor de uma classe é mais mais abaixo na hierarquia E você tem que chamar o Construtor da classe base para fazer algumas operações são necessárias para construir aqui na então tem operação estão definidos ali que a gente não precisa saber quais são falando isso eles a gente mas casa precisam ser executados a gente vai pedir Então quem beleza Execute tudo que você precisa fazer para que você seja uma rede Noel beleza a outra coisa que a gente vai fazer é criar aqui uma variável que eu vou chamar de New year's para de camadas o
que vai ser da seguinte forma é uma sequência eu te meu ônibus os minerais a gente viu o que eles fazem aquela operação linha Tá eu vou receber e não receber um dado de entrado tu vai sair com uma coisa só porque eu tô pedindo aqui é a hora um nome para mim tá esse nononi ele tem um peso um valorzinho' de peso sol e vai receber um entrado tá E e aí você vai dar um valor para gente tá só tem um ano um bebezinho eu não precisei não precisaria fazer isso aqui vocês podem
encontrar talvez se encontre materiais que passam algo do tipo é selfie controlei é só o outro nome para a variável e faça diretamente isso aqui porque a nossa é muito simples Tá mas geralmente esse sequência aqui é bom que eu vi que você faltou online geralmente a sequência aqui é utilizado quando eu realmente vou fazer uma sequência de camadas Tá mas eu já tô colocando aqui no caso mais geral né porque depois a gente vai escrever uma outra um pouquinho maior Zinho do que essa aqui é a primeira que a gente vai fazer o show
então as nossas camadas são Na verdade uma única camada que tem um único que é certo e o que que a gente vai fazer então qualquer a saída Nossa Rede ela é simplesmente E aí a tag é e esse é o valor que a gente vai retornar tem uma camada aplica a camada né recebi um dado o nado esse aqui o cheiro aqui o lado tentando percebi o dado passa aqui para o PC pelo retorno esse resultado que já vai ser o único valor aqui show esse aqui é uma rede neural a mais que a
gente poderia pensar em fazer Ah tá não é uma rede neural profunda e tô suave so far so good dá uma olhadinha que vocês tão falando E aí é um levando é uma função sim o dragão a função não é um modelo de uma razão A Minha dificuldade é sempre com classificação principalmente a recomendação a gente pode discutir um pouquinho no final coisa sobre isso Oi Tá show de bola e vamos seguir eu vou rodar isso aqui temos a nossa lá em Médio já queriam tá já aqui ó agora como é que a gente pode
treinar uma rede neural bom preciso do dado né Eu quero conseguir representar uma reta notícia que eu preciso eu preciso de amostra e sobre essa reta certo como assim amostra hora e eu tenho a reta bom né Por exemplo 2x Eu acho que eu vou até fazer aos poucos aqui Embora esteja sem sem o meu a minha mesa é né O que faz com que não fique tão bom tão bom ver os desenhos mais uma não tem aqui 2x mais 3 tá o quê que vai ser o meu o meu dado eu quero representar essa
reta lá se vai ser o seguinte vai ser e eu amostrar os valores aqui no intervalo por exemplo posso pegar um intervalo aqui entre - 10 o e 10 Ah tá vamos dizer que eu vou amostrar é um ponto aqui no menos dez tá então quando X é menos dez Qual é o valor de y bom então quando X é menos dez eu tenho duas vezes - 10 - 20 mais três da menos 17 Então tem que marcar aqui é algo do tipo lá embaixo assim né ao menos 17 Oi e aí e esse ponto
aqui faz parte do meu dado Esse é um ponto - 10 - 17 aí sei lá vou mostrar agora um ponto em zero tá dentro do intervalo aqui não tava menos dez a dez é que eu paguei quando X é zero duas vezes eram mais três É três então Y é 3 bom então este ponto aqui podia ter marcado já em roxo esse ponto aqui faz parte do meu lado Ah e assim você aí assim você vai entender você vai pegar aqui sei lá quando X é 5 mais um as duas vezes 5 10 mais
três 13 Então você marca o treze aqui Oi e aí você tem um negócio tipo aqui assim Ah tá tô com a ideia se você mostrar vários pontos aqui né porque as vagas pontos aqui em cima aí passar pela função aí vê qual que é o resultado dele você vai ter uma reta aqui tá Então não vai ficar muito bom meu desenho provavelmente O treze devia tá mais pra cima aqui para dar certo mas aí você pegar uma ideia tá que é um negócio tipo a senha e o treze ele devia tá bebê ser um
cara 15 a a tag na área você. Aqui o marcar mesmo Ah beleza então eu posso representar é uma uma uma reta Se eu conseguir esses pontos tá então uma coisa que você vai fazer o meu pai torch é ter o teu conjunto de dado o e interessante que você tenha né palito aqui uma classe chamada nota 7 se comporte. Útil se eu acho preços Oi gente vai construir um j7 é o combate. Hoje não dá tá pronto deita-se importado Aí tá certo aí tá louco né eu já vou falar desse aqui Alguém falou né
Como construir um da Tá certo eu vou chamar de prata 7 algébrico porque a gente tá trabalhando com funções algébricas aqui direto na estrada na fórmula dela tá aí tem que ter invadido há 7 horas e eu vou implementar novamente aqui a inicialização nesse carne a capinha aqui para aumentar mais duas coisas mais duas funções é uma delas é para dizer quantos dados eu tenho no meu data 7 horas e a outra é para dizer como é que eu busco um dado um determinado índice um toque descontos dados tem essa ruim e aqui diz qual
dado que eu vou ter e quando dá um índice essa get tem tudo isso você vai encontrar a documentação do pai torque eu tô aqui te mostrando como fazer com um exemplo Bem Mais Simples O que que você vai encontrar a documentação mas depois né No final a gente vai pegar um exemplo de lá e vai ler e vai ver que exatamente a mesma coisa a gente tá aprendendo a fazer aqui tá só que é muito mais fácil você aprender a partir do básico né volta para base e depois você continuar construindo tem conhecimento Então
vamos lá o que que eu preciso para inicializar o meu conjunto de dados ou se eu vou representar uma função é preciso saber que a função essa tá se eu vou mostrar a função no intervalo como por exemplo de menos dez a dez eu preciso saber quem per valer beleza e quantos com quantos pontos eu botei no meu conjunto de dados preciso saber também a quantidade de amostras que eu vou comer tá aqui tá os pagando que eu preciso para inicializar tem alguma coisa que vai importar aqui a gente vai amostrar aleatoriamente. Nesse intervalo tá
então vou importar também uma coisa para fazer números aleatórios do pai torce Então a gente vai importar que fortes. Distributions o tempo a gente queria mostrar uniformemente tá ó e eu vou dar um nome mais compacto aqui e uniforme Venom torrent show então eu vou mostrar no eixo X ali né esses pontos aqui eu vou escolher eles uniformemente há entre menos dez e dez Beleza então meu X Ele vai ser e o rent.ie uniforme para mostrando pontos uniformemente entre o início do meu intervalo e o final do meu intervalo E aí então esse intervalo aqui
vai ser uma coisa que tem dois valores só o começo e o pin eu tô mostrando. Nesse nesse intervalo e quantos pontos eu vou mostrar Aquela quantidade de pontos está sendo passado ali Oi beleza bom então o meu conjunto de dados ele vai ter seguinte Caio vai ser uma lista de Paris né então o que a gente representa aqui com uma paga os ordenados para poder representar Nossa função mais uma lista de pares ordenados em que o primeiro elemento do par a gente vai Wear e aqui no a gente acabou de mostrar e o segundo
elemento ele é aplicar Nossa função f no primeiro Eu tô construindo com cidades ou coisa que eu já sei qual o tamanho do conjunto de dados né tamanho no começo de dados Zé o tamanho é nessa lista é a quantidade de pontos que eu mostrei isso toda vez que você me passar um índice eu vou te retornar e esse cara aqui E aí você me passou 23 eu vou te dar quem tá no índice três da minha lista deita que eu acabei de mostrar né uniformemente entre menos dez e dez que é o intervalo que
eu tô colocando aqui hipotético show e e e tem mais uma coisa que não Beleza então é isso aí por enquanto é isso que dá uma olhadinha aqui né fazer um bebezinho para vocês ver ver o que vocês estão fazendo tá lá um dúvida nenhuma dúvida tá suave E aí em pó Então vamos seguir Ah tá então eu tenho aqui uma classe que representa né que eu vou conseguir mostrar o meu conjunto de dados tá e eu tenho a classe que representa minha rede neural e eu vou poder participar etapa do treinamento agora tá uma
coisa que o pastor pede que a gente faça é que a gente tem uma forma de Rio nenhum dos nossos dados tá E ele já tipo fornece uma classe que que vida com isso que eu chamo de deita older tá então old de carregar né deita de dado Então deita older é o carregador dos dados tá então se você tiver um deita 7 construído é sobre essa interface do pai torce que nem a gente fez aqui com deita 7 né Tá vendo o nosso Aí tá certo que deriva do Deita 7 papai torch e é
muito fácil você construiu deitar outra então eu não construir o nosso deita 7 o treinamento e vai ser simplesmente o Rogério que nem tá certo passando uma função aí tem um pé função ainda né vamos construir a função Então a nossa função eu vou chamar aqui delaine perto de reta ela tem a seguinte cara é as duas vezes x + 3 a beleza essa nova função deixar mais feliz o que estão as coisas por aqui não é a promessa aqui a nossa função eu vou passar ela aqui ó online é UEFI o intervalo o cavalo
= - 10 10 a minha quantidade de amostras o rival salvar e não algum e bota assim vem quem é é apreen senples pegar mil amostras está a outra onde precisa de mil pontos sobre uma reta na próxima amazon É tem pra teste eu vou a prova mostrar aqui o meu e eu vou fazer uma coisa parecida peste é a mesma função o mesmo intervalo só que vou mostrar menos né porque alguém e a e agora que eu tenho o Data Set eu acho que vou te amar terminou cassete longe data e vai fazer o
usar da 7:00 eu posso eu consigo criar veio para Wonders tá trabalhar com pai torta não vem para o mês de Treinamento ou seja quem vai me dar os dados ao longo do treinamento e vai ser bem pagou da E aí quando bota aquele já me disse que eu tenho que tá você que dar um jeito às 7:00 bethsaide que eu vou dizer o que é eu vou chance ou não tomam da tenta acerto vai ser eu prendi prendi deita 7 o frete sai já vou te explicar o que é shampoo igual a turma tá
olha só a gente tem um conjunto de dados que é bem simples tal os dados são coisas pequenas né Cada dado da gente o que é um ponto um par a ler a um valor então a gente pode olhar o nosso conjunto de dados todos uma vez mas se você tiver trabalhando para reservar vou trabalhar com visão computacional eu vou trabalhar com o áudio e tal cara o teu dado é uma coisa grande né Cada imagem já ocupa bastante espaço certo cada imagem tem Há muitos dados na verdade né Assim você pensa numa imagem e
você quer passar lá para rede Se você olhar para os Picos você for lá para os pixels né com a gente como eu falei não sei o que vocês fizeram foi desenhos tem uma baixa resolução já te dar pizza para caramba Então tu não vai conseguir olhar outro conjunto de dados todos de uma vez poder trabalhar no treinamento tá entendeu por conta disso existe um parâmetro aqui chamado best size o sabonete aqui com isso o extenso aqui para lembrar antecipação chamado best size que é Ok eu vou ler eu vou te dar na verdade ela
tá só está aprendendo assim ó eu vou construir Então deita louder sobre o que ele processo de treinamento e eu vou te dar os dados aos pouquinhos nessa quantidade certa estamos na verdade é um pouquinho essa quantidade geralmente a gente usa uma quantidade pequena ali na polícia tem condições não daquela série de imagens que tem 100.000 imagem Mas tu vai lendo de 64 64 de cento e pouquinho e cento e pouquinho entendeu porque é é muito muito densa aquele data muito grande a gente vai conseguir ler tudo de uma vez show então essa essa ideia
do negócio e tu pode também ter O Peste deita louder e o que signo Eu também vai passar GPS o tolo é menor do que o da cassete de olho mesmo tá esse último pagamento aqui é o seguinte é o treinar a gente vai ter que olhar o com os dados várias vezes tá E aí tá me perguntando o seguinte se eu passar tro aí no chão né embaralhar Champion embargar a toda vez que eu terminar de passar pelo meu conjunto de dados completo é fiz uma passagem completa pelo gosto de dados para treinar minha
rede agora eu vou embaralhar os dados e vou fazer a próxima passagem barata de novo para salvar uma passagem assim vai tá aí só precisar de embaralhar aqui para o nosso exemplo mas eu vou enganar por quem jogava antes de mais nada nessa trabalhar com Naja Ok então você em geral sem pagar então assim é poderia até escutar o nosso caso mas nossa casa muito simples tem que vai dar certo o show então não eu esse aqui a parte de preparação do os dados tá eu acho que eu vou até colocar aqui ó como criar
uma rede neural ela tá criada aí Isso aqui já tá na parte de como treinar Ah tá então como treinar tem a ver com os dados e eu vou colocar aqui aqui na verdade a parte 3.1 e ela é a infraestrutura os dados a preparar impressor prejuízos preparando a intenção de unidades a gente fez aqui foi preparar a partir de dados para poder terminar o até diminui aqui show terminamos aqui de preparar a parte de dados que a gente poder treinar E aí venha a próxima parte aqui é E aí os parâmetros ou hiperparâmetros a
utilização bate Eco ditar como que a rede atende aí aqui que muita gente pode ter dificuldade eu coloquei no desenho aqui que para mim que faz todo sentido para muita gente pode não fazer ainda mas eu vou explicar como é que como é que é tá então beleza se você aprendeu que a rede uma função e não é porque ela vai ser um uma composição de comissões tive tem parte linear disso homem multiplicação parte não linear Beleza se prepara a gente aprendeu aqui aprendemos que percebe não funciona assim e consequência disso é que a tua
rede a tua rede representa uma função uma única função a tua rede Depois tem nada que estava única função tá então a rede é um modelo computacional e para a gente poder aplicar tal mas ela não é um modelo qualquer ela é um modelo paramétrico de uma função o que que ele quer dizer quer dizer que ela tem parâmetros O que são parâmetros são valores que a gente pode ajustar perto estamos falhando o que são valores que a gente pode ajustar e isso é muito poderoso Isso faz parte é parte essencial de porque o negócio
funciona Tá bom então esse w aqui até agora está falando ela tem um w ali tem um valor é o número que chama explicar tá beleza mas quem não é esse como é que começa esse cara tá é dois a três a cinco pontos 5 ep é elevado a 22 kilos nesse tá então é E aí se não sabe Tais não sabe e essa que a graça assim a graça que esse número é esse w ele é um parâmetro é cada da blusinha daquele é um parâmetro quer dizer a um número que a gente pode
ajudar tá então que vai começar com uma coisa que a gente não sabe qual é e ele vai ser ajustado aos pouquinhos até chegar no número ideal certo então tem umas é o que a gente tem aqui né a gente tem um modelo Aqui tem só a parte linear e a gente quer aproximar uma reta Então idealmente a gente quer que o w vive 2 bom e que o bebê né o Bayern big3 idealmente a isso que a gente quer que a rede aprenda que o W tem que ser dois e que o bebê tem
que ser três certo mas ela não sabe disso a gente não sabe né assim a priori é só não sabe eu tô usando um exemplo que a gente construiu então a gente sabe pra gente poder testar e aprender Mas na vida real que vai saber tem uns lá que não sabe qual da onde que veio tá beleza masturbar é isso que ela aprende quando a gente passa a ficar a rede vai aprender o que não aprende é isso galera muita coisa que eu aprendi a única coisa ela aprende é ajustar esses números é uma vez
que trem aí cara quando você entende isso mas de acaba entendeu assim tudo bem Tem uma parte ainda legal você pensa se por legal ver um negócio funcionando maneira que tal só que eu vejo a galera às vezes pegando e a porque a GT3 vai roubar o meu emprego e vai escrever o código não sei o que então a única coisa que você bagulho tá fazendo é ajustar esses números vinhos vários desses passos para ter uma função a única coisa que tá fazendo hoje as taxas e como ajusta como ajusta então e é para ajustar
você que saber que tá errado certo e assim como é que como é que sabe tá errado você recebe um feedback alguém te dizer que tá errado né tá fazendo alguma coisa que de repente não é bom para empresa lá o cara tem que ter nenhuma seu chefe está fui ver agora acho que isso aqui não é assim que se devia fazer no teu trabalho tu não recebeu o feedback que tu vai fazer do jeito que tá fazendo né porque você se você não for lá pessoa você vai fazer as coisas achando que tá fazendo
certo beleza então você precisa ter uma forma de medir o conserto você tá e uma forma de dizer olha tá errado você precisa andar para a direção certa o pai dois três duas coisas uma é saber qual é o certo Oi e a outra é como que eu ando de onde eu estou até o certo certo se eu tô errando como é que eu faço certo duas pra gente precisa ver essas duas quem vai definir agora legal então para saber se tá certo ou não você precisa de uma função de perda tá geralmente é utilizado
esse termo loss function uma função de perda ela que te diz se você Tá acertando os seus enterrando né ou e o quanto que você tá errando Ah beleza então isso é um critério uma coisa que a gente métrica testam tem se você tiver uma métrica uma forma de medir o com perto ou longe você está na verdade tá que a gente vai chamar de função de perda você vai ter um baú Ah beleza então essa primeira parte seja uma função de perda é E como que você bolaria vamos lá antes de eu te dar
a resposta aqui vamos dizer aqui A rede tá com os parâmetros representados por essa função Opa por essa reta azul aqui beleza Como que você a borracharia uma métrica uma função de perda para dizer o Quão distante você tá do que é correto e pode responder aí E aí eu estava gelado terminou agora mas pelo menos era destinado a E aí E aí a nossa magia acabou mesmo mas é muito legal ainda é vai continuar sendo legal variando o ângulo é algo poderia ser uma forma quem é como medir a distância do real e tem
que trabalhar um pouquinho mais aí para entender o coeficiente angular legal o chuta Essas são alguns falar algumas coisas que vão na direção interessante e o hi hi Ya o Edi Alex falou uma coisa aqui que vai na direção do que é feito mesmo tá mas eu gostei eu gostei bastante do que vocês me falaram nós pegar você falar sem isso e é algo que poderia ser feito tá então alguns de vocês falaram para pensar no ângulo se algum de vocês parar para pensar no ângulo a pensar neste ângulo aqui por exemplo tá é vamos
ver que seja teto Por exemplo Tá e isso é uma boa forma de pensar por quê Porque você sabe que se o seu peta por zelo Oi amor tu tá tá certo é quanto maior né quanto mais distante de reserva postou reta ep ó tá certo mas existe um outro caso na verdade você tem que ter que imitar o teu pé tá ao intervalo 10 e a epe né 180 aberto porque se tiver investido né se você chegou e ficou invertido com a reta É mesmo né então suave então essa meio da interessante assim gostei
que vocês falaram isso é acho que foi bem na intuição mas vocês falaram é uma coisa bem correta Tá qual que é o problema nesse negócio é que só funcionaria para esse caso não que eu já tô eu tô assumindo que a coisa uma reta certo eu assumindo que existe uma reta e que eu vou tentar medir a distância para essa reta e assim para calcular esse ângulo Eu precisaria saber que reta é essa tá bom então assim esse cara aí se poderia fazer isso para fingir da tipo assim eu não vou fazer mas pode
ser um exercício interessante você quiser depois você tá entendendo as coisas perguntar isso só aqui não generaliza tá se eu quiser depois mudar para uma função mais complicada pela uma parábola puxando vai conseguir fazer tá e mais do que isso você precisa realmente utilizar se a pessoa utilizar a expressão da função aqui para poder calcular essa esse ângulo tá então ela não é legal porque não generaliza para tu tipo de função e precisa utilizar a verdade se eu soubesse Qual é verdade não tem porque eu tô usando o modelo né a a a premissa que
eu não sei qual é a verdade é esse é esse 2x mais 3 está escondido de mim é algo que tá lá nos dados que eu não sei eu tô usando o modelo para tentar aprender para mim tá mas legal a outra ideia que a gente pode ter a seguinte eu não tenho é reta mas eu tenho os dados que eu tenho o valor dos dados eu posso vir aqui ó em cima desse valor porque eu tenho um dado a mostrado aqui isso certo e aí eu vejo olha aqui E é aonde eu tô predizendo
o valor que eu tô predizendo né com o termo que a gente eu te aviso vou com a minha rede está dizendo o que é a função que a minha rede representa diz que quando eu tô nesse ponto verde aqui no x eu deveria estar dando esse resultado vermelho aqui ó sobre o azul o resultado negativo não é pouco negativo aí nessa ensinar menos meio menos um enquanto o soldado tá dizendo que eu tô lá em cima sei lá em cinco seis sete entendeu e eu posso calcular essa distância e eu posso fazer isso para
todos os dados certo posso vir aqui a Trindade aqui também ó quando eu tô aqui a minha rede está dizendo que deveria ser este ponto Olha só distância que tem aqui entre um e outro cálculo essa diferença quando eu tô aqui a minha rede está dizendo que eu tô nesse ponto mas o meu dado disse que eu tô aqui olha só a diferença então cálculo todas as distâncias né de um é a diferença de um para o outro aqui T2 é de três de todos os dados tá somo Na verdade uma possibilidade seria somar e
pele e o meu a minha a distância Total se arrastam essa isso aí a minha médica tá é uma possibilidade realmente somar todos eles uma outra possibilidade que a gente vai aplicar É somar na verdade né fazer o cálculo Na verdade é um E como eu posso dizer para vocês e assim ó eu vou pegar essas distâncias vou levar o quadrado E aí E aí Ah tá então de 1 ao quadrado mais de dois quadrados mas esteja quadrado e Vou extrair a raiz quadrada Ah tá então isso é uma médica também aqui você somar poderia
ser Tá mas essa médica que tem uma outra outras propriedades são mais interessantes e geralmente ela mais aplicada nesse caso ela é chamada de erro quadrático médio o erro quadrático médio tô com cerveja quadradinho médio minha Squared error vai ser esse cara aí estou simplesmente pegando essas diferenças levando quadrados eu mando tudo se extraindo a raiz quadrada depois beleza E então quem estiver a utilizar como função de distância vai ser o erro quadrático médio então você poderia implementar isso está vendo que as coisas elas são básicas assim no fim das contas né a gente viu
que a gente poderia ter feito perception aqui e cadê Aqui no começo né você poderia te fazer também a sua função de é de distância aí tá mas existe algumas complicações a mais no caminho que eu falo está indo aqui nem peguei um dificultar você ter o seu negócio funcionam Além do fato de que esse aqui tudo que foi prestado tal uma boa prática se não rainha da Rosa bola a função de distância aqui que vou chamar de várias Fontes mesmo nossa médico passou limpeza ela vai ser o erro quadrático médio e vai fazendo aqui
me Squared error was a limpeza e em Las fotos Son em mim para pior o PSE disso é erro quadratico o médio show Então essa é uma coisa que a gente tem que definir isso varia com problema tá se você tiver um problema de classificação eu quero saber se tem gato não tem gato na imagem você não vai conseguir fazer a coisa dessas resolver o problema dessa forma tá aí já tem uma outra função de perda Mas o que você tem que pegar nessa primeira meu contato que a gente tá vendo com Dipirona é cara
eu tenho uma rede que é conexões entre meu anos artificiais que são coisas que têm pesos que vamos explicar o soldado e somar esses pesos eu posso ajustar a gente aprenda como ajustar agora vou ter vários deles eles se conectam para fazer sempre a mesma coisa multiplicação a passar por uma função não-linear que deixa a coisa mais complicada para poder representar funções quaisquer Sé Oi e eu tenho que ter uma forma de saber se eu tô acertando se eu tô errado essa forma vai ser medida pela minha função de perda para o problema em questão
que a gente tá fazendo com um programa chamado de regressão eu estou tentando representar exatamente eu ir aquela reta uma regressão daquela essa reta uma regressão linear para este caso em particular eu posso utilizar o erro quadrático médio Beleza então essa primeira parte do problema saber que eu estou saber se eu estou acertando os eu estou errado e o quanto que eu tô sentindo quando eu tô errado a segunda parte é que tem a ver com essa figurinha aqui que é beleza eu tô errado mas como é que eu conserto agora né é de base
eu posso chegar para tu falar cara Essa é a presidente recebe o feedback assim de vocês assim sei lá a podia fazer de tal forma podia falar mais natural Ok identificou uma coisa que jogou erro podia falar mais natural mas como é que eu faço agora para falar mais natural entendeu então tem a segunda parte que tá tô errando mas como é que eu acerto lá como é que eu faço para acertar então [Música] vamos fazer um outro desenho aqui para tentar entender isso e para quem já viu o cálculo numérico e eu vou utilizar
um tempo depois que vai fazer mais sentido mas por enquanto eu vou abrir pra isso tá alguma coisa que você certamente viu na escola foi Apagar bula eu quero a gente viu na escola na Paraíba certo E você também teve na escola pagar água né uma coisa do tipo x ao quadrado e na verdade eu vou fazer a versão mais geral dela aqui né a x 2 + BX a mais e apaga é um bom exemplo o nosso caso porque o nosso a nossa função de perda é quadrática né Ela é só mais o quadrado
das coisas e está é raiz depois tá apagar agora uma coisa interessante orar beleza vamos dizer que o nosso erro e tal quanto a gente está errando e ele tem essa cara ele tem cara de parar Boa Ah tá como assim e Como assim tem cara de parábola vamos dizer que os valores tem que pode assumir os valores que eles podem pode assumir Dependendo de qual é a que me w da tua rede e de qual é o teu dado né cuidado tá fixo ali eu tenho usado que tu pode mudar o pagamento da rede
Então vamos dizer que uh-huh erro vai variar a medida que você muda o pai anos da rede ele pode variar em cima de uma parábola como essa né o erro a função acabou de ver que ele tem essa expressão ali de quadrado das coisas não sei que é uma função certo eu abrir vai fazer assim que quem é e pronto aqui então isso aqui é uma função então a função tem um gráfico gráfico poderia ser uma parábola aí que nem a gente tá vendo aqui beleza todo mundo dizer que seja uma parábola e vamos dizer
que você tá aqui se você botou você tem um parâmetro que eu tô pagando o salão do esse erro aqui tá vou botar os eixos para facilitar a gente ver e as coisas ah ah ah tá aqui tá os eixos o teu erro tá aqui se o teu eu vou tá aqui qual que é o valor dele e o valor deu e é é o valor que tu tiver vendo aqui certo sei lá 150 eu joguei aqui tá então quando teu pai lá dentro tá aqui Bru para o dado que tu tem e tal e
a rede que tu tem o erro ele tá aqui nesse momento beleza 150 a primeira pergunta que eu vou te fazer antes de te mostrar como é que a rede aprende a melhorar esse parâmetro não dá tempo de fazer a seguinte Onde está o menor erro possível que eu posso ter para esses dados olhando para esse gráfico que te disse isso aqui é o gráfico que diz como que o erro vai variar com o teu dado que tá fixado e o parâmetro da rede que você consegue mudar é só isso que você vai mudar a
página da rede que a coisa que está sendo aprendido e onde está o menor erro possível que você pode ter para esse problema e olha aí e no ponto de mínimo e no ponto de mínimo no vale o ponto mais baixo no vértice É isso mesmo Exatamente isso então você ficou lá na 7ª 8ª série tá vendo ensino médio enfim dependendo de corpo a escola onde estudou as pessoas ficavam caçoando falando nunca vou utilizar a matemática para nada para que eu vou prender o x do vértice não sei que do vértice babado vértice para isso
tá para resolver problemas salvar vidas e muitas coisas mais no limite para interpretar o mundo aqui está o menor erro que você pode ter preso problema a questão é que você vai ter que esperar beleza Ah tá então a gente já sabe onde é que tá agora eu sei onde ele tá eu sei onde eu tô Oi tá na verdade assim Teoricamente eu sei onde ele tá Teoricamente você não deve tar na Prática eu sei onde eu tô Beleza e como que eu faço é o lugar que eu tô né como eu faço o caminhar
na prática eu quero resolver o problema como posso caminhar daqui para cá certo então você vai utilizar o conselho tudo de Gradiente o gradiente ou simplesmente a derivada E aí mais altas dimensões porque a gente trabalha com vetores não sei que tal é o grande a derivada que a gente aprende aqui é uma coisa é eu tenho uma variável só que tinha um valorzinho' só eles apresentar a derivada a gente vai mostrar aqui com bauzinho só porque dá para desenhar legal mas pensando uma função muito louca que pode estar um espaços nem consegue enxergar tá
gente pode pensar em Gradiente o conceito tem a mesma ideia tá a derivada nesse ponto aqui ela vai te dar a ratinha né o crescente o buraco aqui ó da reta tangente certo e naquele. Beleza Oi ok e ir você vai poder então andar ela já fiz uma coisa assim um pouco diferente a conversa mais tá vamos dizer que nesse caso aqui se eu tiver esse valor da derivada aqui tá eu posso andar nessa direção Ah tá eu posso mandar nessa dimensão bom então assim o gradiente e da função a de perda ele vai dar
para gente a direção para onde a função de perda está crescendo Ah tá o gradiente lá olhando para usar em vai dar para gente direção para onde a função de pena tá crescendo o que eu quero é uma dá para sentido contrário né p**** manda para cá vai aumentar o meu erro bom eu vou para lá Ah beleza então estiver a utilizar um ingrediente para andar no sentido contrário Ah e quanto mais eu me aproximar desse cara aqui o mais fraco vai ficar o gradiente tá menor vai ficar quando quando eu tô no mínimo mesmo
né Ele é cego né o ponto crítico o mínimo ele tem zero a gente não vai chegar domingo enfrentei algumas questões nas funções de otimização aí que eu tava extraindo um pouco mas a intuição essa tá e quando qualquer instituição você consegue entender esse desenho esse desenho aqui é um desenho que você consegue ver se você colocar no Google aí sobre ele Gradiente descendente tal tipo de algoritmo utilizado que você vai encontrar na literatura e sobre esse legais Gradiente descendente nada mais é do que o método de Newton para a solução de sistemas um método
guloso de utilização é guloso porque a cada momento você tenta andar para a direção que vai te levar mais perto do teu objetivo se eu tenho objetivo é diminuir o erro e o erro tem essa carga a cada momento você vai tentar andar na direção que o erro é menor se o teu ela tem essa carne Tu tá no morrinho aqui em cima do cálculo Gradiente o que a gente vai te dizer olha o cume do morro é para lá tá crescendo erro para lá vai falar carga não quero ir para lugar que cresce vou
colocar como trabalho eu vou dizer eu quero dizer e tu faz isso aquela pasta tu vai descendo descendo descendo até que vai chegar no momento que para mais difícil de descer porque tá lá embaixo Ah entendeu então tu cálculo um erro aí já sabe como calcular ou eu tem a função de perda aqui erro quadrático Médio agora eu vou andar otimizando é um Gradiente descendente E aí bom então sgd o estocástico Hidden recentes tá o gradiente e descendente estocástico eu ouvi o nome assim né que assusta e calça hoje é mas é o que eu
te expliquei como um detalhe a mais esse detalhe estocástico não falei tá bom e eu vou dar eu vou dar uma ideia rápida também a gente possa explorar no outro no outro vídeo talvez universo discreto ou que já tenha falado mais sobre sobre isso né então a estocástico porque lembra que eu falei aqui e quando você tá lidando com um conjunto de dados grandes na hora que a gente frio aqui o deita louder eu falei do bétis ai que se estiver me dando um conjunto de dados que grande uma imagem uma coisa que não consegue
trabalhar com todo dado né ao mesmo tempo o deitar olhar tem que te dar os dados aos pouquinhos e você pede então você diz a Roberto Saes não é o tamanho desse agrupamento né Bete é o tamanho do grupamento é de celular 64 imagens Então é eu não vou conseguir calcular o erro de uma vez né não consigo arrumar o erro para o conjunto inteiro eu calculo o meu erro de cálculo o erro para esse agrupamento pequeno tá então eu não vou ter é é a minha função de perda total assim de uma vez eu
vou ter uma função de pedra que foi construída em cima de um uma parte de daquele conjunto de dados tá só que eu vou utilizar isso como se fosse a minha verdade do momento do mesmo jeito tá isso isso tem mais implicações assim vai ser um certo ruído na direção que você vai andar é como você tipo assim tu não sabe direta Diga aí tu não sabe perfeitamente que qual é a direção que tá aumentando a coisa trabalhar mais ou menos para lá então mandar mais ou menos para cá né vou tentar mais ou menos
para cá para me distanciar de onde o erro tá aumentando Então tem um certo ruído tá e a polícia é chamada de estoque cacho você não vou entrar em detalhes a questão probabilística em processos estocásticos em cima disso tá mas você pensa que é a consequência da gente anda baseado apenas em pequenos fragmentos ósseos utilizados é o quê o Mack a coisa de estocagem Beleza então so far so much É isso aí então vou fazer mais um bebezinho para olhar que vocês estão fazendo aqui e vocês tão falando para gente tirar dúvida E aí E
aí e a e olha eu chão Gonçalves se lembrou de cálculo numérico né uma análise numérica de galo sido para diminuir eu galo sido Girls ideal para a solução de um sistema linear né aqui a gente quer resolver as coisas não lineares dá mais a ver com um tipo newton-raphson essas coisas E aí a gente tem que a gente não percebes estão no mínimo local ou Global verdade ele é um método guloso Mas a gente não vai entrar nesse detalhe hoje já está aqui há duas horas e aqui ó o cara Ele te respondeu Ele
escreveu antes de você aperto porque tem um ponto que não consegue chegar é na parte mais baixa tem a ver com isso que o Rodrigo falou aqui que o gradiente descendente não sabe tipo assim você chegou não vale né Por exemplo e é se eu tô Hoje eu tô aqui agora eu vou com uma praia não sei lá uma praia e eu penso que eu tô no nível do mar ali por exemplo mas eu não sei se eu tô no nível mais baixo possível da terra né quando eu olho ao redor eu vejo montanhas aqui
no Rio de Janeiro será que pelos morro e talvez de Porto no lugar baixo mas eu vou dar um todo lugar mais baixo que eu poderia estar aqui no Brasil nem muito menos na terra tá o projeto mento ali ainda está recebendo inscrições eu e nem abriu ainda meu querido você entra lá no nosso grupo no telegram que tá anunciado lá no power 2 para você preencher o formulário de interesse Mas a gente vai abrir na primeira semana de outubro eu já dei o spoiler hein E aí E aí e é por causa do tamanho
do Betty acontece até a possibilidade da função pagar no mínimo local não mesmo que você conseguisse utilizar o médico do tamanho total né se tu conseguisse utilizar o o teu dado tô congelados inteiro você ainda ia conseguir pagar você iria pagar no mínimo local Possivelmente tá é o método de otimização mesmo que é tem essa fraqueza né o fato de você tem um método guloso que a cada momento você tá andando um pouquinho na direção é que mais melhor né o teu teu problema tá Ah beleza então vamos seguir então aqui pra instanciar esse otimizador
a gente precisa passar alguns parâmetros estávamos argumentos aqui então primeiro argumento que ele tá pedindo o são os parâmetros que eu quero utilizar só o pagamento da rede são os dados que eu vou querer pendurar certo então eu tenho arca preciso da rede a gente não criou ainda e olha só não vou querer a rede então então vou chamar a rede aqui the model as morreu a gente vai instanciar o nosso linear me o design Network e é isso aqui é o meu modelo eu vou lançar ele o cara então assim agora a gente discutiu
bastante a ciência né eu vou falar um pouco essa de engenharia da coisa né então a gente gosta de treinar modelos em placas gráficas na GPU ou enfim razões diversas a principal delas é o fato de que a gente consegue fazer muitas contas a gente tem fazer várias pequenas contas e a gente consegue para realizar essas contas na GPU né que tem múltiplos novo para poder fazer esse sal e aí aqui uma forma a gente Sondar se a gente já tem acesso a essa GPU para trabalhar é a gente fazer uma coisa que você pode
encontrar em outro notebook nessa formas tá então você verifica se E ai disponível né então próprio Pastor se consegue verificar para você se tá disponível uma GPU um Puna é da NVidia se tiver a gente disse que o nosso debaixo de trabalho vai ser cuida caso comprar e vai ser a CPU tá e você pode botar aqui por exemplo lá a rodando na e a CPU or GPU vamos descobrir Beleza então aqui como eu não mexi em nada tá rodando na CPU para o nosso modelo que é bem básico aqui tá tudo bem não vou
dispensar né pedir para o Rua Calma GPU para mim só para gente fazer uma coisa correta Tá mas é para trabalhar com laje modelos né na vida real a gente vai trabalhar na GPU porque senão vai demorar muito tá muito mais negócio em cima de virtude mas não seu tá então a gente vai lançar o nosso o modelo de baixo se a gente tiver trabalhando eu já eu GPU e CPU e eu preciso dizer então que eu quero otimizar os parâmetros peixe modelo se eu cruzar mais uma coisa uma coisa que ele chama de taxa
de aprendizado lá então zaniratti E aí a taxa de aprendizado é assim ué velocidade que eu vou andar para tentar descer o morrinho Ah beleza eu sei a direção que eu vou andar aprendi com calculando Gradiente que a gente não uma rua mas vai ser calculado agora com que velocidade uma para certo Qual que é o passo que eu tenho que dar naquela direção tem isso a gente específica aqui também eu vou dizer que a gente vai andar 0.001 show o definimos aqui e preparamos de utilização Vamos então para parte de Treinamento a fazer uma
função aqui pra gente treinar e ela vai receber o nosso modelo ela vai receber a nossa função de perda e ela vai receber o nosso utilizador em março eu preciso os dados né mas até mais importante aqui ó bom então essa função Extra mesmo que que eu vou fazer para treinar eu vou que a gente que o modelo Oscar é preparado para treinar Ah tá porque já porque eu vou explicar mas na frente não entender porque nisso então vou garantir que o modelo tá trabalhado para treinar E aí eu vou pegar dados o número deitar
louder Oi Jaque vai solicitar o mesmo treinar Então esse cara aqui não vem para Uber vai carregar para gente os dados de treinamentos aqui x e y porque eu tenho nem apagues de o dado que eu vou utilizar de fato essa aqui é um dado de fato isso aqui é a resposta né então esse aqui é o dado de fato para web no x e y é a resposta é o como é que ele como é que ele tinha um rótulo né é a verdade que eu quero aprender aprendi ser certo é então que eu
vou ter que fazer eu vou fazer o seguinte uma coisa quem quiser fazer lançar esse carga bruta e vai se também aí você que tá no mesmo no mesmo debaixo né outro se o modelo está na GPU o dado tem que estar na GPU também poder botar CPU Ela tem que dar CPU também então isso é uma coisa que a gente vai querer fazer com certeza e a outra coisa que a gente quer fazer o seguinte se você olhar para os dados que a gente tem agora e ele vai ser pois é pessoal como é
que a gente tem Oi gente tem 10 amostras tá Seria um vetor Zão com mais 10 juntas tá isso aqui uma coisa com essa cara tia a desenhar para vocês Se tem uma coisa assim 1357 vamos fazer com quatro só tá só que não é isso que eu quero cada valor ali dentro é um dado tá cada valor ali dentro um dado só que o meu Bete tem tamanho 1100 weverton me passa o motorzão assim tá então que eu vou fazer é uma operação meu pai torce para ter um vetor dessa forma tá eu vou
parar de utilizar o nome vetor e vou passar utilizar tenso e depois que é um tensor dessa forma então embaixo a dimensão a gente pode utilizar esses nomes de maneira intercambiável assim vetor tensor tal mais intenso e é uma generalização tá e uma realização do de Torres então você pode pensar o vetor é assim né Aí você gosta de usar o nome Matriz para falar de coisas que tem duas dimensões assim e se tivesse mais de duas dimensões os netos uma matriz multidimensional Aí você chama de pensou show prova que ele é um pensou que
tem essa cara para fazer isso a gente usa essa operação aqui o pão 15 in e lá dimensão aqui ó eu não dou S1 aqui na 10 porque senão fica assim ele pode colocar e os caras dessa forma que eu não quero entendeu você passar fizeram isso ele é isso ou dessa forma aqui né que a forma eu quero Ah tá e vai fechar isso dentro de outras outros colchetes só quero que seja dessa forma e não desse aqui tá então a preocupação dos países um e tem mais uma coisa que é específica do nosso
exemplo aqui que é converter para frot é um trote de 32 bits como está criando assim os números ali na com funções e tal dependendo da função que a gente usa o pai trocou o carro parou de de 64-bits num BOL assim e o pai tu acha que para diferença nisso tá ele vai treinar aqui para trabalhar sempre com projeto de duas vezes nesse caso você pode identificar mas a gente vai trabalhar que compor seus beijos são eu vou fazer isso então isso aqui é uma coisa que eu vou fazer aí é o que eu
vou fazer agora eu quero passar e o meu modelo para salgados modelo para obter minhas três missões O legal é o calcular a minha perna o pão errado eu tô com a minha função de perda a minha função de perda para saber o que o errado eu tô ela precisa saber o que que eu prendi ES e ir qualquer a verdade Oi beleza você vai tossiu com errado por que eu tenho que lembrar para o lado certo então não dá para o lado certo a gente tem que fazer o seguinte e a gente tem que
fazer nosso ponto é que o Art é isso aqui vai fazer o cálculo dos gradientes tá beleza me chama de backwards porque é feito por um processo chamado back-propagation tá então eu também não vou entrar no detalhe aqui no bom e todo o processo de funcionamento mas a ideia e por quê que é Becky não é à toa Quebec lá e aqui é forte tá então de frente e trás não é à toa isso a ideia seguinte quando você aplica o teu modelo né ao dado tu faz o forte tu anda mesmo modelo computacional aqui
nesse grafo né aqui da esquerda para direita você vem cuidado passou para cá vai passando por todas as camadas que tiverem até dar um resultado do final quando você quer calcular a Gradiente você vai calcular o gradiente é da frente né de trás para frente então como isso aqui são composições de funções você vai aplicar a regra da cadeia e você vai utilizar a estrutura de grafo da rede para propagar a regra da cadeia viu o time calcular utilizando a regra da cadeia propagando os gradientes de uma camada para outra tá doente não vai fazer
esse cálculo está implementado aqui a intuição é essa se você sabe de cálculo é show você pode pegar S10 ano mais de carro ou uma pena é um pouco mais difícil de entender mas fica aí um assunto para você poder estudar né mas antes de estudar cálculo volta para a base estuda funções bom então isso aqui é uma coisa que ele quer fazer tá é Então essa é a parte ciência à parte engenharia era eu preciso a fazer isso aqui sempre sempre sempre sempre antes de rodar esse voz backwards o que o pai porte ele
Vai acumulando os gradientes das operações que você vai realizando no teu gráfico computacional né Avenida que você vai trabalhando em parede da acumulando os gradientes e você não quer acumular aqui no treinamento só tem aquelas que você que você quer acumular né mas em geral aqui para ensinamentos não quer acumular Então você vai zerar antes de calcular o mesmo Gradiente para não acumular e agora que você tem o gradiente Você sabe qual é a direção você tem que andar e esse step é mangá ou então aqui você zera os grade em acumulados aqui você se
calcula o computa os gradientes e aqui você anda de fato e na direção e na direção o que reduz o erro local é tudo igual E aí beleza e só treinamento que pode inserir mais uma coisinha aqui que a tipo tem um erro cumulativo em Santa Maria o nosso Dragon Oi e aí eu eu vou somar o urso massa essa perda aqui e vai ser pontuais tem aqui porque o Adam pensou E aí pensou que tem um valor só o item para obter hoje E aí depois é só lá acumulei aqui a o valor de
piano eu posso por exemplo retornar aqui na minha função hoje em treinamento Qual foi a perda é dividido aqui por quantas vezes eu esperei né com certeza foi acumulando esse negócio aí vou ter uma média E aí o show viu o teste eu vou fazer algo parecido E ai simples amizade teste e não para testar eu não preciso otimizar hoje eu vou colocar o modelo e a a forma de ser avaliado eu não caio que eu e assim agora que eu expliquei essa parte né de acumular gradientes e tal aqui eu boto nesse nessa essa
forma de treinamento aqui justamente para o México eu quero né acumulação as coisas tá e olhamos grande em um show aqui eu tô botando na forma de avaliação Para Abril ele eu pego só é Rodar aqui o meu modelo e e e eu não vou acumular gradientes e tem a como A Gradiente a gente ir roda isso aqui Oi Marli Aparecida colheita hoje vai ser diferente agora né Vou passar ali para outro gente teste e olha só que eu quero fazer não precisa utilizar não preciso mais nada isso aqui ó e vai sempre né o
alto bom então agora finalmente nós estamos chegando no moldado no momento que vai rodar o que a gente vai corrigir os erros né então é bom treinar eu liguei não vou ver você sem dúvida aí E aí G1 o show Oi posso mexer subestimei o tamanho dessa rede essa Live né achei que a gente ia conseguir terminar aqui com água época Mas enfim cachorro e a a regra da cadeia sim sim sim e pode mudar você pode mudar o step size do Gradiente descendente usando esse método do pai do Arte pode pode tem um argumento
aqui do o TSE utilizador ou de outros utilizadores também né Eu tô usando um específico aqui nessa tocar tiver 17 aqui ou Manila trocar acho que ainda sente né mas tem mais parâmetros aqui que você pode definir que vai mudando que tem como chama há uns inércia a inércia do pena né mas que coisa vai mudando com o tempo assim se pode definir isso é E aí o show Ah tá beleza então vou seguir aqui bom então pra treinar que a gente vai fazer a gente vai definir Quantas vezes a gente vai rodar o treinamento
oi lá E aí vezes colocar aqui 113 arrumou da treinamentos quantidade de vezes é aí para e às vezes e a gente treino e o meu deu e com o deitar Wonder Oi gente pega a Bianca é a função de peso que a gente já definiu o otimizador que a gente já definiu e no final a gente pesca bom então vou ter um erro aqui no treinamento vou ter um erro aqui de teste já já eu posso acompanhar isso sei lá a cada Ben 10 os 10 passos eu posso de repente exibir é é é
é o número da da época né e quantas quantas pregações eu já fiz a ver qual era o erro né E aí e no final posta me exibir aqui o erro do Pet ah ah sim a boca né E aí Oi filha garante conseguir visualizar né é bom como eu preparei esse exemplo antes eu vou puxar aqui para mais protweb né até vídeo aqui no canal daqui explicando coisa mais próximo e você quiser aprender é mas eu vou puxar essa função aqui para não gastar tempo tentando acertar os baianos todos e tal o pão eu
vou achar aqui o que que eu tava fazendo Ah tá eu tava definir aqui uma coisa para visualizar e aqui tem uma função para gente poder comprar alguns um recebe a função de Fato né que a gente tem o nosso 2x mais 3 lá o modelo o intervalo que a gente vai mostrar quantas a morte a gente vai fazer isso pelo ralo E aí aqui opção configurações mais próximo aí pra gente poder ver um gráfico que eu quero mostrar o Como é que chama os eixos né ali coordenados aí eu fazer a mostra aqui a
toalha 10 10 valores coloca o modelo na forma de avaliação né não vou calcular Gradiente você promete passar aqui para predizer os valores das amostras eu sou eu vou perguntar tá dois duas Graças então um deles vai ser uma linha mesmo o outro vai ser é umas bolinhas pra gente poder comparar essas bolinhas é o que é de Fato né a reta de fato que a gente tá esperando e a a linha vai ser o que o modelo tá prendendo tá então com essa função aqui e a gente pode além de botar esse print a
gente pode se comparar tô passando aqui a nossa função que eu acho que eu escrevi aqui em cima com o nome dele né é a função que a gente quer aproximar e cadê aqui a gente quer passar a função o modelo e o intervalo de menos dez a dez número de amostras deve tá bom tá bom usar os padrões eu vou aqui mesmo vamos rodar esse negócio aqui e ver como a gente acontece treinamento agora É de fato bom então deu ruim aqui tá dizendo que trem daí tá o Uber não tá definir Será que
eu não rodei aqui o e eu não rodei essa essa coisa aqui ó Way e é bom que a gente vê um erro até agora então a trem sem pois não está definido é que rodarte então aí aqui o trem e simples na verdade teste e simples é engraçado aqui eu errei aqui e acertei embaixo bom então agora foi isso aqui é isso aqui isso aqui o sol o show vamos rodar isso aqui de novo pronto vamos ver para rodar de novo esse aqui o LP não está definido ou então porque eu fiz essa função
aqui aqui o uso mais protweb eu tenho que importar mais pela sua Bíblia E aí E aí o pão de novo é só bom então quanto isso eu vejo que vocês estão postando aqui mas já foi já foi bem rápido é uma das ó vou molhar aqui como é que tava o desenho no começo só no começo e a rede estava Mais afastada a tabela é até parecido com que a gente fez aqui né então esse pagando isso aqui no começo ele é inicializada aleatoriamente tá gente e eu não conheço o pagamento da rede foi
inicializada aleatoriamente ela não batia com a reta que a gente tinha o Dair aos poucos ela vai aproximando e com 101 épocas né 101 passagens em cima dos nossos dados de todos os nossos a gente conseguiu aproximar bem o coeficiente angular você vê que ela tá aqui é bem né paralela ao nosso graus truques né a verdade viu mas o outro coeficiente linear e ainda não chegou a gente precisaria treinar mais a gente pode até continuar aqui por exemplo tem lado aqui um pouco mais mais 200 nenhuma aí agora você vai ver que vai começar
da onde ele já tá ali né já já perto é porque eu não reinicializei o modelo então você vê que a perda começa aqui já baixa 2.65 e vai aos pouquinhos a próximo né 2.35 Tá vendo Dá carinho aos pouquinhos a perda não ver como é que foi lá no final bom então ó caiu para um ponto 22 isso a gente continuar treinando mais aí a gente vai conseguir realmente é aproximar Exatamente Essa reto Ah tá e agora vou fazer algumas discussões com vocês a gente fazer um outro exemplo então eu fazer mais dois exemplos
mais rápido do que esse né porque a gente já construiu infraestrutura aqui para discutir algumas coisas e alguns Alguns algumas diferenças entre o que a gente faz aqui né nesse nesse exemplo aqui mostrando o porquê né queimar rede é uma função e como você pode atender a coisa e o que a gente faz alguns outros exemplos encher não quer exatamente isso aqui que seja algo chamado Over Feet beleza e a muita gente já perguntou aqui se ela vai ficar salva vai ficar salvo assim como sei como escolher a quantidade de épocas Então é só uma
pergunta outra cidade de épocas quanto e assim gostar de épocas vamos ver mais o que a gente escolheu aqui tem várias coisas que a gente escolheu aqui na no olho vamos assim dizer né no chute então uma delas foi gostar de época a outra e foi aqui ó a taxa de aprendizado foi uma coisa também que a gente né pegou meio no chute assim a outra foi a função de perda e o próprio utilizador existem outras opções aqui tá algumas dessas não são tão chutes assim porque por exemplo E no caso em questão que a
gente vai fazer uma reversão é bem bem razoável mesmo pensar que eu quero fazer uma coisa com ele quadrático médio ou algo parecido tá Gradiente descendente estocástico Ok poderia querer olhar alguns utilizadores que tem algumas variações ali tá taxa de aprendizado Realmente parece um short aqui tá essas coisas que você tem que especificar assim é e com a sua experiência em nosso dizer a gente chama de hiperparâmetro Então agora você já consegue entender esse nome que eu dei aqui né preparando otimização tá isso é um pouco empírico mesmo tá mas você pode utilizar algumas coisas
para se guiar por exemplo e você pode fazer um gráfico né que a gente não fez eu não vou fazer aqui mas poderia fazer um gráfico para ver como que essa função de perda é o resultado da perda tá de crescendo ao longo das épocas casa poder fazer esse braço e esse gráfico ele vai te dar a interpretação desse gráfico não pode tirar algumas situações então assim é uma coisa que a gente fala muito aqui no canal eu vou insistir tem que aparecer nessa Live aqui quem aprende como um robô pode ser substituído por um
robô certo Às vezes a gente vê as pessoas querendo decorar as coisas estabelecer protocolos e seguiremos à risca nesse grupo frases arrisca copiar coisas e tal e cara se você pode fazer um negócio sem pensar a máquina também pode É só uma questão de tempo para ela fazer exatamente isso que está fazendo e você não tem mais a serventia Tá certo então você tem que realmente parar interpretar a coisa e otimizar todo seu repertório todo o conhecimento que você tem como lado para entender o que eu então uma coisa que pode te dar indícios de
que as coisas devem mudar por exemplo você fez muitas é que olhou para o gráfico da função de perda e viu que o ano já no comecinho do gráfico reduziu muito apertado lá embaixo a perda e depois foi reduzindo um pouco volto talvez você possa diminuir então a quantidade de é porque você vai treinar Serra ou o gráfico mostrei no pouco e tá tendo um indício de que ele tá aproximando mais seu irmão então talvez eu pudesse treinar um pouco mais só que aí você pode cair num erro né que para o nosso caso em
questão aqui por exemplo não é um erro mas muita gente pode falar com essa que a mente sobre um erro de aprendizado de máquina que é overfitting então quando você tem os dados em gel você não quer que o teu modelo e ele tem te passar exatamente sobre os dados ele tem que fazer coisas muito loucas que só modelo isso já simples tá porque você não conhece você quer ir generalize né você tem alguns dados mas escreve utilizarem dados que você nunca viu e esses dados que você nunca viu eles estão perto né Tem muito
pode ser ele tá perto do dado que você utilizou para treinar mas ele não é exatamente o dados utiliza para treinar então se não quer que o seu modelo faça o máximo para passar em cima dos dados que você usou para treinar você quer que faça uma coisa mais suave esteja ali perto né para poder fazer classificação de coisas novas ou regressão mesmo dinheiro no arroz de Novos Valores tá então o que a gente está tentando fazer aqui é overfeat em que a gente foi para mostrar pra vocês que a rede Noel ela é uma
função ela representa como usar um cada rede representa uma função mas isso é uma outra coisa que levar em consideração para decidir número direto mas porque se você treinou tanto que o erro tá bem baixo Ah mas o teu dado a tua rede tá faltava simulando né Tá representando uma função que tá passando ali em cima dos dados talvez que tem problema tu não quer isso É talvez que o problema isso eu realmente seja um caso é problemático and Over Feet tá então isso é mais uma coisa para você pensar que não tem essa regra
uma coisa que você quer alisar porque eu tô trabalhando no um problema de pesquisa mesmo que eu quero fazer o Perfect tá não é à toa que eu tô mostrando para você decidir por exemplo aqui tá esse um negócio que faz parte de algo que eu tava fazendo realmente porque no meu caso em questão eu quero representar sendo as três dele eu não quero que a minha rede Faça algo parecido com a cena O que é o que ela faça a cena de pá entendeu se eu tiver representando a o Buzz Lightyear do Toy Story
eu quero que a rede represente o Buzz Lightyear do Toy Story não algo parecido com o site da sua história Tá mas é de repente você pode que eu ia fazer uma rede que vai não representar o boy site mas Essa é a curso que se parecem com boas atingir uma coisa tipo magan aí realmente já uma outra coisa então cada caso vai ter um negócio que você precisa analisar certo eu queria fazer uma rede neural do zero absoluto para aprender como ela funciona por trás dos panos cara a gente praticamente fez isso aqui ó
eu acho que a gente fez isso é assim se você quiser realmente fazer a conta de Beto propagation tá oito vai ter mais bem mais trabalho né mas a gente eu te aviso mínimo aqui do pai torce para criar toda a infraestrutura do pai torce assim é só uma estrutura da base que você pode utilizar para problemas mais complexos e Inclusive a gente vai ver daqui a pouco mais assim essa aqui é a região é o mais simples que poderia fazer um barco lancha é né foi a gente viu que a gente poderia criar isso
inclusive dessa forma né show é hahahaha certo então vou seguir aqui e com mais um exemplo e a gente fixar e nesse mesmo estilo tá então agora vamos supor tensa que é aproximar uma outra função mais complicada com uma reta Então uma reta a gente sabia que a gente poderia aproximar com uma rede de um único neurônio né bom e mas agora a gente vai passar uma coisa mais complicada então a gente pode voltar aqui uma outra beijo tá estou sem nome aqui se ideia de nome para essa rede pela por encontro de networking eu
não sei ainda o comentário que qual que seria o nome legal para essa rede aqui a gente vai repetir o mesmo procedimento Carvalho a mesma coisa e o inicializar o e comercializar a classe base ou será que ela faça o que é necessário para construir esse módulo né o módulo Wagner Meu Pai forte show só que agora eu vou ter mais camadas ah ah não fazer uma rede aqui mais complicado fazer uma rede que ela tem uma camada Inicial enviar e vai receber um valor também tá o aproximar uma função alternativa o cosseno de alguma
coisa tá só que agora ela responde esse único valor em mais balões tá a gente pode escolher aí a quantidade de valores que a gente quiser se tem alguma sugestão vamos lá de 128 lá hoje é Oi e aí depois ela vai aplicar uma não linearidade porque agora não pega para cima uma reta né utilizar uma rede neural converse uma reta é um ovo estilo né tem muitos modelos de propagação linear inclusive aqueles abordou aqui no canal nessa série de aprendizado de máquina né Tem várias vezes modelos aqui que tem separação linear por exemplo svm
eu cai na cristalização acho que aqui ela falou também nesse nesse o nesse aqui ela falou de um outro modelo linear que não é USB em vez classificador aqui um classificador linear também Ah tá então tem vários modelos que estão vamos aplicar funções na linha É verdade aqui eu vou construir a próxima camada é essa aqui ó então entrou um vai entrar um único valor eu quero quero aproximar cosseno de x sobre 2 entre o único valor de 128 128 neurônios na próxima camada eu tenho que conseguir colocar sim o que 28 valores Mas eu
posso agregar eles por exemplo em 64 E aí eu aplico mais uma nome minha idade Oi e aí na próxima camada entram 64 Eu Posso reduzir de repente para 32 é mais uma não linearidade até a próxima camada entram 32 in e eu vou reduzir para 8 é mais uma não é verdade e no final eu tenho a resposta há 18 horas G1 Ah beleza então esse aqui é uma rede neural bem mais complicada você ver que ela tem uma duas três quatro camadas escondidas bom então é isso um lado havia uma camada de 128
uma camada de 64 32 mais de 8 4 camadas escondidos e venha uma camada de saída sou forma de funcionar parecida com a outra o recebe o dado que que eu faço com esse dado a passo e lá e pelas camadas Pois boa talvez dar um nome aqui para rede não linear multi-network a multilayer multilayer continue a aparecer no ENEM legal pode Multilaser e eu cortei a Network obrigado o pão de cães tem que fazer agora em geral nosso conjunto de dados a gente já tem a função lá para jogar na frente aí tá sete
vai ser o nosso algebrique deita 7 passa uma função Qual a função do carro próximo Araguaia Nossa função vai ser um e comece Import cosseno é Nossa função vai ser o seno de x sobre 2 mesmo G1 oi ou então passa a função que eu quero mostrar o intervalo pode se pode manter o mesmo né os cavalos menos dez a dez o número de amostras também pode ser mesmo que a gente tinha lá mil lá o som então aqui que eu peço a mesma coisa é uma coisa para criar os dois para longas né trem
brita louder G1 eu faça o quê Tu ainda está 7 o pack size é o tamanho Eu posso passar por meio da para 7 completo Oi e a gente vai sim embaralhar G1 E aí o pão protests parecido E aí O legal é o meu aqui de erro f não está definido por um rodeio o show de bola show de bola então quê que eu vou fazer aqui ó e a gente precisa do da função de perda passei a mesma utilizador em função da perda e vai ser o erro quadratico o velho o otimizador vai
ser o cacique graders The Sims também e a vamos pagamos que eu vou passar é do modelo que ainda não construiu né então vamos construir aqui o modelo O que é multi móvel multi-model igual a multi-layer Network vamos passar aí para o The Voice e agora eu vou mudar o meu ambiente de execução aqui e para a GPU Ah tá agora a gente vai fazer mais conta é Ah beleza então vou ter que rodar tudo de novo e felizmente tem isso eu vou pedir já para rodar tudo que vem e é antes né até aqui
assim o aumento execução Executar tudo antes bom então multi-model tá aqui pa épocas vamos treinar por mais agora acho que só de bastante mais pra próxima coisa aqui sei lá velho E por incrível que pareça fazer aproximação de funções assim é é mais difícil do que fazer algumas outras tarefas que podem aparecer mais complicadas tá eu também não tenho tempo para explicar por que a que hoje é mas eu vou precisar de bastante época vou jogar aqui sei lá 30 mil velho 20000/20 meu bom então para piercings em jerem Venom and Apps o que a
gente faz treina treina quem o modelo multi-model porta tudo construído Agora chega bem mais rápido né vem deitar louder é a função de perda o utilizador e aqui no final vou testar assim integralmente o mesmo no código aqui né E aí E aí rodou aqui 200 épocas e ficou com esse erro aqui né que a gente tinha acumulado ou na outra vez sem mais 200 não é sim só que eu tenho que trocar o módulo aqui por multi-model Oi gente Manteve o nome das variáveis eu vou eu vou exibir aguarda apenas a casa sem não
a cada dez Vai ter muito gráfico o multi-model não me deixa esquecer algum modo eu aqui se não mandei errado né a gente copiar as coisas é uma luzinha né saiu muito grande então eu coloquei aqui online pelo efe o modo por último o teu é o modo eu pelo multimodo e a [Música] e pode repicar aqui época sim ou não é legal então vamos rodar aqui O opa e aqui ó no nariz financiar o otimizador eu tenho que passar os parâmetros do multi móvel e eu tenho que passar né a taxa de aprendizado Oi
e aí tá usando o 10. eu pego. 01 nós não vamos voltar para treinar e conversar porque vai levar um tempinho esse aqui né mas olha só nós vai jogar a gente observar aqui como vai vai treinando você vê aqui no começo eu tinha uma coisa tipo quase uma reta assim né e é pó o desenho Tá ruim aqui não vou pagar o treinamento vou rodar de novo Tá a gente vai se o numa coisa aqui para visualizar para pegar eu vou reiniciar aqui ó então ele vai response aleatório ou modelo tá eu quero mostrar
para vocês o seguinte a gente tava amostrando só 10 pontos para uma reta é legal de ver né só 10 pontos mas olha aqui pro cosseno não dá para entender direito gostando aqui né só com 10 pontos então aqui na hora de pilotar comparação e o Claro que o número de amostras você já sei lá 40 50 uma coisa maior né a gente conseguir ver bem melhor as coisas para escola e e agora sim ontem a carga da do Siena aqui Oi e a gente vai poder ver o processo ou a próximo ano Ah tá
e lá vai aprendendo aos poucos ajustar que eu espalhamos vamos ver que vocês estão falando aqui e as nova né e Seria bacana um polinômio e após ter se arrumou o nome também e assim cocielo tem bastante variação né que nem um polinômio por exemplo se pegasse aqui um x a quarta e o mais assim já pode dar um negócio desse tipo né bom então ela quando ele vai aprendendo aprendendo você consegue ver a bóia aqui é vai ajustando os parâmetros bom né aqueles WC os beijinhos até ficar mais perto e vamos ver como é
que tá lá no final e já tá quase hein e aqui 11.700 época já tá E ajustado bem E que tal treinar rede para entender as funções lógicas and ou é só uma sugestão de exemplo você pode ficar à vontade de usar esse código aqui para tentar fazer isso o Segall belong filho cara seria mesmo né e é deixa eu ver aqui se eu pego algum código lá tá pedindo para gente fazer um refri para gente ver um dia então eu Atualmente trabalha com coisas que vida com três de nessa Inclusive eu já fiz vídeo
aqui no canal falando sobre a próxima Fronteira né e a próxima Fronteira pedir para o ano e deixa o Marcelo aqui em que eu chamo de diário de pesquisa que eu falo sobre coisas que eu faço lá no doutorado e nessa que eu falo sobre utilizar redes neurais para aprender dar os 3 de né Então as músicas que eu tenho estudado E aí tem essa outra biblioteca aqui o pai tocha 3D Que Eu Já Fiz alguns trabalhos nela e eu sei que aqui tem um tutorial que ele faz um gif é de uma chaleira e
deixa eu ver se eu consigo jogar o código aí para gente poder que usar uma outra P ID Figure câmbio e tal tá eu vou ficar devendo esse ficar esse negócio aí que eu não gostei muito mais a Live eu não quero mostrar um exemplo que você vai poder fazer no pai torch lá tá então vou de ver esse carinho aí para gente Tá bom mais bem caminho aí se você quiser modificar depois do código você vai lá no palito ache três erros e olha essa coisinha aí como é que eles fizeram gif utilizando imagina
eu eu vou deixar eu não vou deixar aqui não eu quero deixar um negócio aqui redondinho para quem for olhar o código depois tá verão Mas a gente pode ver aqui no final né eu posso dar uma passada rápida aqui pela pelas imagens para gente ver a diferença de Como foi o processo Olha só no começo a gente tinha isso oi e ela vai aos poucos e ajustando a bom então tem muita imagem aqui minha frente tem muita época é mas ela foi ajustando ajustando ajustando ajustando é a mesma depois de passar cinco mil vezes
sobre os dados ainda ainda não tinha a cara tô coçando ali né assim tinha a parte mais Central ajustou então aprender o primeiro a parte mais próxima do zero ele foi aprendendo depois a parte mais afastada né então eu vou aqui ó há 8 mil épocas mais ou menos para começar a curva ali na frente o show está assim a e a gente pagou o curso né de ter muito mais neurônios mas essa e essa rede representa uma única função na casa da rede única função mas aquela mesma arquitetura ou seja ela mesma quantidade de
meu ônibus Abrir poderia ter sido utilizada para treinar para outro problema dá para resolver outro tipo de problema com a mesma estrutura talvez até com menos neurônios ela já consegui resolver isso aqui bebêzinha em uma rede neural treinada com dados representados por gráficos pode ser utilizados Nos programas 3D pode tem um outro vídeo que eu falei também sobre e o poder nas redes lugares de graça aí que a gente pega 20 nova urgente que não tá vendo os nossos vídeos tô fazendo Jabá Neste vídeo aqui eu pago um pouco sobre isso sobre um curso de
senha forte focado imagine lá em cima de graça tá Ah beleza então lição mais importante para hoje é uma rede neural é modelo paramétrico em uma função ou seja ela representa uma função e já tem parâmetros valores que podem ser ajustados o aprendizado nada mais é do que consegui ajustar o parâmetro e para que o resultado dado pela função que a rede representa se aproxime do resultado do seu dado para isso você precisa tem uma forma de medir o com distante você tá desse resultado e tem uma forma de andar para mais perto dele a
medição aí dada pela função de perda Existem várias funções de pedra que poderia ser utilizado tive um aqui o erro quadrático médio Oi e o processo de andar na direção do diminuiu o erro geralmente geralmente vai ser esse Gradiente descendente tô cacho com algumas variações tá tenho tem vários utilizadores a ver você poderia estar se aqui nessa linha do pai torce né do opte mais e nos dinheiro mas em geral eles vão ser variações do Gradiente descendente estocástico e enfim fazem fazer alguma coisa mais mirabolante para tentar evitar aquele problema é que alguém do Outono
gif O que é o problema de você ficar preso um mínimo local é um problema onde você não chegar né aqui seria teu solução Mas de repente porque tu começou aqui trocar em um lugar que não que é melhor do que Onde você tava mas não é tão bom assim certo então é tem muita coisa aí a gente tá assim arranhando a pontinha do iceberg aqui tá arranhando acometidas bem aqui mesmo mesmo a gente tem que passar daqui mais de duas horas Quase três horas aqui juntos tá o que eu vou fazer para gente poder
encerrar mostrar para você onde você pode estudar mais e um mostrar ele realmente um exemplo com você que é diferente né não é com esses dados fabricado que a gente tem algum outro tipo de dado que é é uma imagem de fato tá nós para você ver que é bem parecido né Bem bem alguma coisa que a gente tá fazendo ele para você conseguir entender que você guarda É capaz né desenvolver sua autonomia a seguir é estudam então primeiro para dar algumas recomendações recomendações saíram se você olhar a Playlist machine learning com python que tem
aqui no canal várias vezes da 15 porque tem vários conceitos que estão relacionados né Deep Lane é uma forma de uma cerimónia aprendizado de máquina com um modelo bem específico que é o essa rede neural né profunda tá então termos terá 15 a juíza nesse nessa série aqui sobre programa de agressão de classificação Matriz de confusão antes era tudo isso vai estar relacionado eu acho importante subir é outros dois canais aqui no YouTube canal peixe Label no canal universo discreto então no peixe Label Inclusive tem um vídeo e da Mila se programando uma rede em
10 minutos tá então assim é um bom vídeo para você ter um overview no tema assim as meninas do peixe Label Neto tá meio a conta bebê som é muito boas e também muito capacitados né também a vivia Doutora e professora a Mila também é doutoranda assim como eu tô aqui assim Claro que não tem como vocês pegar em 13 14 minutos o que a gente pegou aqui né em horas né então pode fazer fazer com vocês por ter mais tempo um passo a passo maior e eu escolhi também um exemplo que você realmente não
não encontra assim né É mas para que você possa pegar toda a intuição Então eu acho que você assistir esse vídeo agora da mesma por exemplo você vai ter um outro olhar sobre a coisa e vai vai ser bem bem legal o outro vídeo interessante né e canal também interessante que você acompanhar que fala sobre isso o canal universo desperta do Lucas também o autor professor do IFMG e nesse vídeo aqui em particular e eu e fala do Fashion início a onda tá certo que a gente vai ver daqui a pouquinho um exemplo do pai
torch tá ele tá utilizando tensorflow Pode até ser interessante para vocês fazer algumas comparações entenderem que em alto nível o processo é o mesmo né em outro nível processo é bem parecido Mas é claro que apelido de cada biblioteca vai ser modificada mas é que até a terminologia que a gente tá vendo Aparecida Alberti size mesmo tamanho do Betty épocas otimizador tá vendo tudo isso bem parecido Pois é se tu quer pegar se você já tem o a bagagem uma base matemática Mas você já tem uma base matemática e quer entender essas coisas Deep ordem
tem o livro do ângulo de ferro que é o criador né de das grandes redes neurais adversários né a e final irão muito bom tem que dar parte aqui inicial de revisão de probabilidades álgebra linear etc e maiôs das coisas aqui sobre depilar em algumas arquiteturas bem conhecida as coisas de alguém concorda certo tá outra coisa interessante é o curso do ímpar não é o Instituto Nacional de matemática pura e apli casa onde eu faço doutorado inclusive neste momento está rolando a outra edição nessa aqui a gravação do curso do ano passado nesse momento tá
rolando a edição deste ano eu sou o assistente do Porto bom então é um curso de fundamentos e tendências em visão e pensamento de imagens tá é como eu falei assim já que é uma certa base aí para você entender mas eu sugiro você dar uma olhadinha aí ver que que você acha das coisas né talvez você passa por algumas aulas e tal mas que uma ideia de algumas paradas e o curso no passado teve uma parte prática que o Daniel que tá terminando o doutorado da Glória meu amigo Daniel muito gente boa mas a
gente tá participando uma pesquisa junto eu e ele deu aulas de laboratório então aqui também tem ali aplicações para poder ver alguns exercícios resolvidos com pais forte e o tema do vídeo o tema do posto no passado foi Deep vídeo então tem muita coisa voltar dali para vídeo para que trabalhar com o vídeo entendeu pouco mais sobre isso tá o tema do curso desse ano né que eu tô participando eu mudei hoje negativos então está focando aí entender gás e coisas mais além né é o tema do curso muda porque é um curso de fundamentos
e tendências das coisas não tem a ver com as coisas que tá rolando em pesquisa e o nossos interesses a no laboratório desgraça também né claro que tem a Playlist de água de pesquisa que eu já comentei aqui mostrei né Por exemplo esse vídeo aqui pode dar Regina lá de graça Então essa é uma playlist mais acessível no sentido de que ela não ela não tem código assim é uma coisa que o relato algumas coisas Potencial em algumas coisas e realizam enquanto o doutorado na área tá ir Claro tudo Aliás o próprio site do pai
tu acha que a gente vai ver um deles agora certo então se você vier aqui no site do pai torch na parte de kickstart né então você viu início rápido você vai ter acesso a várias coisas né uma delas aqui é este é um problema de classificação e no Data Set Fashion o início mesmo da sete do vídeo lá do Lucas universo dica então aqui ó em cima tá vendo tem um ranking colega né Hum hum Google Colégio você pode clicar nesse cara ó e vai abrir o Google Colégio para você trabalhar e a gente
vai ler esse Google colega aí uai e juntos Belezinha é eu vou trocar aqui só vão negócio cheguei não vai liberar para mim uma segunda máquina tá então ele vai fechar provavelmente a minha execução desse aqui mas a gente já terminou aqui tá legal eu vou disponibilizar o código que a gente construiu hoje né depois você volta aqui mas tá na descrição dessa lá então Olha só tudo começa a gente tá aí fazendo a importação de coisas básicas que nem fez isso show eu vou botar aqui na chapeo para rodar mais rápido e apesar Desse
exemplo aqui é aí não tá não tá me dando uma GPU porque a outra tá aberta lá beleza eu acho que fechar logo e a E aí o pai engraçado já tem duas E aí Oi ok bom então vamos rodar aqui E aí olha só aqui ele tá achando o Data Set do fecha início Então esse é um j7 que a outra set clássico tá feminist o atacante foi criado pela união é com que hoje é professor da New na universidade de Nova York também o chefe de pesquisa do Facebook e o emissor j7 de
dígitos tá se voltar aqui no início o primeiro está Oi Jonata sete dígitos a mão né que tinha que ser reconhecidos Então como né uma coisa que ele poderia ser escrita no computador e o fashion-mnist eu e é um j7 e e assim tem 10 classes também né assim aqui tem 19 das coisas dessa casa também ele foi construído assim meio que levou tomando por base o início vou me ver tá não tô entrando na casa de fácil de me dar e isso tá sete clássicos eles existem nesse outro pacote chamado torch virjão tá então
você pode falar isso aí não vou colar de existe e bora puxar várias j7 clássicos de lá tem alguns que são mais complicados e tal então a disponíveis lá você primeiro pede para baixar aqui ele tava achando dado de teste lado de Treinamento E aí aqui que tá definindo aquilo que eu falei para vocês o backside 64 quer dizer tem imagem que eu não vou conseguir olhar uma dessas completo uma vez né você complicado para calcular o gradiente dessa forma vamos fazer para mim trocar fica olhando aqui 64 ele passou aqui ó não está embaralhando
o j7 a cada a cada momento mas a mesmo processo tá vendo daí tá ó né passo o data 7:00 batize j7 para Embaixada aqui show se você não utilizar um j7 pronto que nem esse aqui você tem que fazer o processo que a gente fez aqui então já te dei o caminho mais geral até Ah tá tem alguns tutoriais do pacote que vamos ensinar a fazer isso também que é o seguinte ó e quando você tem as suas próprias imagens você vai ter que criar uma classe porque o da sete horas e aqui dentro
você vai ter que carregar as duas imagens vai olhar lá qual é a parte aqui tá carregar e tal aí vai dizer qual o tamanho né quantas imagens você tem que dar da sete trazer com a imagem que tu vai retornar quando eu passar um índice por jogar tá certo entendeu Esse é o mínimo que tem que construir para ter um datacert que você vai para o lugar ali no deitam ler tá então a gente fez aqui uma coisa simples se você tivesse uma imagem você ia mudar o código aqui ficar mais complicado esse óleo
aqui Talvez os outros né mas ele já ganhou esses aqui tem essa casa dela né E aí beleza a criar um aqui eu usei para Londres tá me dizendo aqui que o bex64 para não sei que legal E aí vai passar os modelos aqui para GPU se tiver você vê que o modelo dele até menor que o nosso fazer pode ser maior que tem 512 aqui mas tem menos camadas é menos profundo como que a gente fez e aí tem um detalhe que a gente não tem não acho que é importante para lidar com imagens
esse fla tem aqui tá vendo Então era só ele tem uma sequência linear é de entrada 28 x 28 porque 28 308 porque as imagens do conjunto de dados são de 28 pixels por 28 fixos tá a dimensão dela é essa 2828 e ele tá utilizando aqui a cada Pixel como se fosse um dado isolado Ah entendeu cada pizza como se fosse um dado isolado então 2828 de entrada 512 expandiu Manteve aqui 512 512 a nova realidade na realidade depois viu de 1512 para 10 porque 10 o que é diferente da função que a gente
tinha ali que era sei lá um cosseno recebe um x ou y tu quer uma função agora te recebe essa quantidade de pixels e te diz qual que é a probabilidade de estar em cada uma das classes já tenho 10 possíveis classes vou te dizer qual é a probabilidade de estar em cada uma delas e aí você né Depois pegar Ademar pela habilidade para resolver problemas classificação certo então por isso que sai dessa ali para continua sendo a função Entendeu o meu a função do r28 por 28 onde é que é isso a 28 x
28 é uma função do espaço R 784 no espaço R10 é isso é uma função onde múltiplas variáveis a beleza aí aqui no ford ele usa aquele Flash tem que é o seguinte e a imagem ao atriz eu quero eu quero abrir um vetor para poder dar aqui como entrada né a gente viu que a rede recebe vetor é a rede ela tem essa carinha aí e ela vai receber o Show antes eu ouço os x 1 x 2 dizendo aqui então não pode dar Matriz aumentou Então é isso que o flash tem vai fazer
show Ah mas eu vi a rede convulsional não sei que tá calma pagar lá a gente vai chegar lá já existem outras arquiteturas que você pode dar o uso e os formatos de arquivos tá ótimo aqui na última ajudado mas esse aqui é o mesmo tipo de arquitetura que a gente tá vendo aqui né não p**** primeira lá e a gente não vai conseguir Victor Então beleza e recebeu aqui a resposta né planificou passou pela rede recebeu a resposta retornou tá ó distanciou modelo exatamente como a gente fez tudo demais vamos rodar Oi tá usando
o c* da legal função de perda né como é que eu sei que eu tô errando não dá uma função de perda tá aqui não é não é a função que a gente usou pro nosso programa geração que não há problema de redução tá então você aquela função chamada de entropia cruzada não vai pegar essa função hoje tá uma função que usar logs e outras coisas por acaso até estou usando esse tipo de coisa agora e teoria da informação tá mas é uma função de Pedro uma porção que a gente tirou com essas tá errado
em relação autoclassificação hoje o utilizador pode o mesmo que a gente usou show até mesmo parâmetro é mesmo taxa de meio e pagando aqui ele taxa de aprendizagem tá treinamento cara meu still cara mesmo chega no Face mesmo seu né aqui não precisou fazer aqui uns quis e o plot porque o dado já veio formatado tudo bem mas passou aqui para os demais show o teste mesma coisa só que o teste aqui é um pouco diferente no sentido de que o meu problema de classificação a métrica o quanto né a forma que que a entender
se está indo bem ou não não é bem né só um um erro assim valor que nem a caça uma Quem estava tendo ele quer entender sei lá colar acha né enfim outras metas que eu também não vou entrar aqui no caso mas aqui já falou sobre métricas classificação acho que eu pensei aqui ó aqui ele falou sobre métricas de avaliação de classificadores para dar uma olhada na segunda depois tá então o que a gente tem que tomar cuidado aqui é de calcular Essa é a minha filha correta para entender como é que tá o
teste beleza e vamos rodar isso aqui né ver como é que vai dar E aí tá pedindo aqui para treinar por cinco épocas a gente pode até treinar por mais natural 0 e eu tenho uma coisinha mais aqui que ensina salvar o modelo enfim depois a gente vai poder usar o modelo Oi e eu só que certamente você tem condição de entender se você sabe programar né o casamento ele trouxe rede neural mas dá para entender isso aqui a chamando atenção para o nível tal que e é belezinha galera é só saber que vocês tão
falando aqui quando mudei o treino E aí E aí e a uma boa pergunta aqui Ah tá a mesma Manoel tá só pergunta dele é o seguinte é porque existem vários tipos de rede neural e o que diferencia realmente não tem várias coisas que podem diferenciar é uma coisa que diferencia uma da outra é a arquitetura que eu quero dizer que o arquiteto João quantos neurônios tem quantas camadas tem quantas gramas tem cada camada isso é uma coisa tá se existe uma coisa um pouco mais profunda assim dizer na arquitetura que diferencia que é o
seguinte o tipo de rede que a gente viu hoje é chamado de multilayer perceptron percepção multi-camada essa mas teria bem específica e ela tem essa cara completamente conectada a gente viu aqui tá E como você vai vir aqui quem é bom para trabalhar com imagens e e o multilayer perceptron a gente precisou fazer aquele flash em tal não sei o quê e mesmo assim eu vou dar um resultado tão bom é só acurácia de setenta por cento 71 por cento nesse conjunto de dados que é bem assim tá então essa aqui não é a rede
mais indicada para gente trabalhar com imagens que eu não leva em consideração né Ela não ela não se ajuda utilizando propriedades e as imagens têm então aqui no canal tem também uma série de vídeos sobre processamento de imagem e eu pago sobre propriedades das imagens e Inclusive eu falo sobre e como operação a gente vai querer fazer a partir dos Filtros aqui né para construir filtros que a convolução nas imagens tá em frente para construir filtros demais aqui essas três vídeos virou esse tipo de coisa tá então assim todo o material ali por trás as
pessoas já resolvi já resolveram esse problema antes da gente naturais utilizando convulsão tá eu e ela é com o mesmo cara que criou o início mesmo carro aqui é o chefe do no Facebook professor de energia Vital Ele criou esse essa Arquitetura de Rede neural convolucional que realiza convoluções leva em consideração algumas coisas importantes as imagens tá é interessante sua imagem você consegue fazer operações que são lineares e invariantes por translações né Por exemplo consegui detectar que um gato é um gato seja eu estão doendo e no canto superior esquerdo no meio da imagem no
canto inferior direito tá é o garfo mesmo jeito então esse não é não é para resolver esse tipo de problemas pessoas não tem que pensar em coisa mais ela base entendeu ah não tá dando para resolver coisa aqui não tá sendo muito bom ou tá tomando muito tempo gastando muito recurso não dá para acertar unicamente uma rede que nem essa aqui pode resolver tudo mas na prática não resolva entendeu então por conta disso você tem que a pensar no problema que você tem e conseguindo eu precisava de um elaborando formas de embutir na rede propriedades
de dos problemas que estão em questão a Então galera de MRP por exemplo uso as redes residuais eu abri fugiu Norma seja residual mesmo nome tá mas é uma rede aqui ela tem umas coisas que volta sem porque na linguagem você quer entender com o texto né então você não olha só pra frente você quer olhar também a parte de trás então casa domínio assim pode se beneficiar de adição de informação Extra né que pode ser embutido ali na rede de uma forma inteligente então esses são problemas de pesquisa tentando resolver Ah beleza então show
de bola o recorrente show de bola muito obrigado hohoemi um tão grande e na DP usa sei dizer correntes residuais é uma outra coisa que inclusive eu uso a imagem também um chow chow chow eu vou gravar Então isso eu queria mostrar para vocês hoje
Copyright © 2025. Made with ♥ in London by YTScribe.com