Redes Neurais - Introdução às Redes Neurais

6.71k views2908 WordsCopy TextShare
UNIVESP
Nesta videoaula, o professor Marcos G. Quiles introduz a disciplina, o histórico e a evolução das Re...
Video Transcript:
[Música] Olá bem-vindos a primeira aula do curso de redes neurais eu sou Marcos killes e serei o professor responsável por essa disciplina ao longo do próximo bimestre as redes neurais artificiais elas representam uma sub área da grande área de Inteligência Artificial e também representa o coração de uma nova área denominada aprendizado profundo sempre Que Nós pensamos em a é comum a gente associar a conceitos apresentados em filmes como robôs inteligentes ou unidades virtuais inteligentes que apresentam comportamento ou igual ou mesmo superior dos seres humanos nós podemos lembrar lá da Skynet na década de 80 do
filme Exterminador do Futuro onde a Scarlett era uma rede de Inteligência Artificial que queria dominar a humanidade só que nós temos diversos sistemas mais próximos da nossa realidade como robôs em indústrias como dispositivos domésticos como Alexa relógios inteligentes que também fazem uso de sistema Inteligência Artificial e também de redes neurais artificiais assim como a gente vai ver ao longo desse desse curso aqui são os tópicos que eu vou apresentar nessa primeira aula primeiro fazer uma revisão é relembrar o que que é inteligência artificial introduzir as redes neurais artificiais conhecer o histórico da área saber onde
estamos hoje o estado da arte e por fim apresentarei algumas ilustrações de problemas de forma abstrata Nos quais as redes neurais podem fazer parte da solução bom que uma definição de um dicionário sobre o que que é inteligência artificial fala é o ramo de pesquisa da Ciência da Computação que tem como objetivo desenvolver tecnologias que simulam a inteligência humana como raciocínio aprendizagem linguagem inferência e criatividade é importante sacar que eles têm diversas definições na literatura sobre o que que é inteligência artificial mas todas elas têm em comum conceitos relacionados à cognição Que Nós seres humanos
aprendizagem é inferência raciocínio então independente da definição que a gente adotar essas palavras sempre vão estar relacionadas a isso um teste bastante importante até do ponto de vista histórico é o teste de turing para avaliar se uma dada máquina possui Inteligência Artificial ou não qualquer ideia nós temos um robô Desculpa um ser humano aqui um entrevistador representado pela letra C E esse entrevistador humano Ele vai entrevistar uma máquina um computador e um ser humano a máquina representada por ar e um ser humano representado por B se algum momento Essa entrevistador não conseguir distinguir quem que
é a máquina e quem que é humano nós afirmamos que a máquina representada por a ela possui algum comportamento inteligente porque ela tá enganando o entrevistador ser alguns aspectos relacionados à área de Inteligência Artificial nós temos sistemas capazes de perceber o ambiente no qual o sistema sincero sistemas capazes de raciocinar em cima de uma base de conhecimentos é previamente armazenada nós temos sistemas para atuar no ambiente no qual robô no qual o sistema está inserido e por fim nós temos também a capacidade de aprendizado sendo essa uma das mais importantes dentro da área de A
até por isso que na mídia é bastante comum a gente associar o termo de forma como se fosse em sinônimos a área de Inteligência Artificial e aprendizado de máquina mas na verdade a área de aprendizado de máquina é um subconjunto da grande área de interesse artificial responsável pelos métodos capazes de ensinar os modelos de aprendizado de máquina seja aqueles métodos que vão treinar os modelos fazer com que eles sejam capazes de aprender a partir da experiência com o meio e dentro da área de aprendizado de máquina nós temos uma sobre a área de aprendizado profundo
que será abordado em outras disciplinas bom uma definição de aprendizado de máquina proposta pelo atualmente em 1997 que fala o seguinte um programa é considerado um sistema de aprendizado de máquina se ele é capaz de aprender com experiência aí com respeito uma classe de tarefas T se a sua performance medida por P melhora com experiência aí aqui por tarefa a gente poderia pensar por exemplo um sistema de classificação de imagens onde eu recebo uma imagem e eu quero classificar essa imagem como sendo um gato ou um cachorro a experiência poderia ser um conjunto de dados
no qual especialista já fez a rotulação já falou essa imagem a é um gato essa imagem B é um cachorro e a performance poderia ser acurácia desse sistema na classificação dessas imagens Então se ao longo do contato com os dados ao longo da experiência o sistema ele consegue melhorar a performance nessa tarefa ter a gente afirma que nós temos um sistema de aprendizado de máquina existem diversas abordagens na literatura relacionados à área de aprendizado de máquina por exemplo árvores de decisão sistemas baseados em regras métodos probabilísticos método simbólicos e também as redes neurais artificiais que
serão que é o escopo desse curso dessa disciplina bom então qualquer ideia nós temos o cérebro no cérebro o cérebro dos Animais em geral e nós sabemos que o cérebro é capaz de realizar diversas tarefas complexas como raciocínio lógico como memória armazenar muita informação então será que a gente não consegue emular de alguma forma o que que acontece dentro do cérebro num sistema artificial Será que nós não conseguimos criar modelos artificiais capazes de simular aquilo que a gente observa no cérebro por exemplo memória sociativa e assim por diante então tentando responder essas questões surge a
área de redes neurais artificiais então o que que são as redes neurais artificiais são modelos computacionais ou redes neurais inspirados na estrutura e no funcionamento do sistema nervoso e algumas características desses modelos é o seguinte nós temos que o conhecimento ele adquirido a partir do processo de aprendizagem Ou seja a partir da experiência com o meio e o conhecimento armazenado nos pesos da rede é que é importante sacar que existem redes neurais sem pesos mas no escopo dessa dessa disciplina a gente vai adotar sempre que o conhecimento ele é armazenado nos pesos da rede Então
as redes neurais elas podem ser vistas como a estrutura uma rede uma grande rede composta por diversas unidades os neurônios artificiais que eu chamei aqui de simples embora existem redes neurais cujos neurônios não são tão simples mas vamos pensar que eu tenho um conjunto de unidades interligados numa rede e essas unidades por si só de forma isolada elas são simplificadas e o comportamento inteligente ele não vende apenas uma de um neurônio de um pequeno conjunto de neurônios mas sim é um comportamento que ele é merge da rede por isso que a gente fala que é
um comportamento e existem diversos tipos de redes neurais na literatura bom falar um pouquinho sobre história como que ela se desenvolveu primeiro a origem de desenvolvimento da área como ela surgiu como ela evoluiu e onde estamos alguns aspectos pré-históricos da área de redes neurais primeiro descoberto microscópio algo fundamental Senão nós não conseguimos visualizar as células aconteceu mais ou menos 1590 a descoberta da célula 1665 a célula comunidade constituinte dos seres vivos mais ou menos 1840 E aí em 1894 o pesquisador neurocientista espanhol Santiago ramoney caial descobriu a estrutura do neurônio do presente no cérebro dos
diversos animais o Professor Santiago pesquisador Santiago a Mônica e água considerada um dos Pais da neurociência bom uma vez que nós conhecemos Então a estrutura de um neurônio a ideia geral proposta lá pelo Santiago Ramon Michael como que nós começamos de fato a criar a área de redes neurais artificiais o primeiro modelo o primeiro a primeira aspecto artificial tentando simular o modelo biológico surgiu em 1943 com trabalho do mccollet do Pitz onde eles propuseram o primeiro neurônio denominado neurônio MCP para tentar representar uma porta lógica a partir de uma estrutura artificial de um neurônio aí
em 1949 Donald rap propôs o primeiro trabalho sobre aprendizagem importante destacar que esse trabalho não tinha a ver com modelos artificiais e sim como modelo biológico Porém esse trabalho esse essa teoria do rap foi utilizada posteriormente para para fazer para criar modelos rotinas de aprendizado para aprendizagem artificiais aí o Miss que quer quem tá na foto constrói o primeiro neurocomputador em 1952 O missky importante destacar também que é um dos Pais da própria Inteligência Artificial ele mais alguns pesquisadores na década de 50 cunharam um termo Inteligência Artificial e ele é um dos fundadores do laboratório
de Inteligência Artificial do aí na sequência em 1958 rosemblar apresentou o percentual que basicamente era uma rede formada por neurônios unidades MCP só que com agregadas a algoritmo de aprendizagem capaz de classificar padrões de dados aí em 1960 o hidroen hoffice são os senhores nessa foto apresentaram a regra de aprendizagem baseada no Gradiente descendente também conhecida como regra Delta que a base do modelo da Line que a gente vai ver daqui algumas aulas e também é base do algoritmo de retropropagação que é um dos algoritmos mais importantes da área de redes neurais aí em 1962
o rosenblade mostrou o teorema de convergência do percentual esse teorema ele fala o seguinte se nós temos um problema que ele é linearmente separado ou seja nós conseguimos separar as classes utilizando uma fronteira de separação linear uma reta um plano hiperplano o percentual sempre vai convergir com erro zero aí nós temos o primeiro problema o mesmo mesc responsável pelo pela pelo começo da área de redes orais juntamente com o papete em 1969 eles trouxeram um problema bastante relevante para a comunidade eles falaram que o perceptro não era capaz de resolver problema simples como chora e
mesmo se nós acrescentássemos múltiplas camadas nessa rede não necessariamente nós conseguiríamos resolver então uma vez que uma pessoa uma autoridade da área apresenta pra gente uma falha uma limitação dos modelos nós temos o fim das verbas e o desentos e asma pela pesquisa do tema então ao longo da década de 70 nós tivemos o primeiro inverno da área de redes neurais artificiais nessa década basicamente nós temos uma escassez de trabalhos embora alguns pesquisadores continuaram trabalhando no tema como revela Alexander na Inglaterra o conecchicochima que aqui aparece na foto desenvolvendo a base das redes convolucionais muito
utilizadas as reduções que a gente também vai ver ao longo dessa disciplina então em 1900 na década de 80 nós temos que o Rockfield um físico Ele demonstrou a relação entre redes recorrentes sistemas físicos mostrando que esses sistemas eram capazes de criar memórias para armazenar conteúdos então despertou falou para existem como existem maneiras de criar redes neurais que podem ser úteis para problemas mais complexos um pouco aí em 1986 o melhor eles propuseram algoritmo de propagação mostrando que aquele pessimismo do Miss que do papete de 1969 não era válido nós poderíamos nós podemos utilizar sem
redes com multiplas para resolver problemas não lineares e problemas complexos bom a década de 90 então é nós tínhamos diversas aplicações muito bem sucedidas primeiros veículos autônomos por exemplo aqui nós temos o Alvin do pomerô em 1995 ele era capaz de ajustar a trajetória dele ao longo do percurso de forma bastante autônoma eh redes neurais capazes de reconhecer dígitos nós temos a linete que na década de 90 foi responsável por reconhecimento dos dígitos manuscritos de cheques dentro dos Estados Unidos porém no final da década de 90 começo do século XX nós tínhamos uma espécie de
segundo inverno uma certa estagnação da área é especial pelo avanço das outras áreas outras técnicas de aprendizado de máquina e também pela limitação de recursos computacionais ou seja nós não tínhamos condições computacionais para treinar modelos com muitos parâmetros e a escassez de dados aí a do meio da primeira década do Século 21 em diante nós começamos ter resultados bastante importantes é em especial dado ao grande avanço nas gpus nas máquinas computação paralela como todo e a grande oferta de dados então nessa nesse começo do século 21 nós temos as duas coisas que faltavam na década
de 90 que era muito usados e sistemas computacionais capaz de treinar redes com grande quantidade de parâmetros aí alguns exemplos nós temos Alex net em 2012 que era uma rede convolucional que foi capaz de superar numa competição no Imaginext é diversos modelos tradicionais de visão computacional com uma grande imagem ou seja mostrou uma acurácia muito superior a modelos de estado da arte até então os primeiros modelos generativos como usar acionais as redes Gun e o alfago que em 2016 venceu o principal jogador do jogo gol mostrando que de fato o computador as redes neurais eram
bastante eficientes e conseguiriam resolver problemas bastante complexos e em função disso hoje nós temos basicamente em todas as áreas do conhecimento nós temos algum tipo de aplicação de redes neurais artificiais e uma característica importante a ser destacada que é o seguinte quando nós aumentamos a quantidade de dados ou seja nós estamos aumentando a quantidade de dados aqui as técnicas tradicionais elas tendem a atingir um certo platô Ou seja a partir daquele ponto não adianta colocar mais dados que não necessariamente elas vão melhorar sua performance quando a gente considera aprendizado profundo essa limitação ela basicamente rompida
ou seja quanto mais dados o fornecendo para o modelo maior a chance que eu tenho de criar modelos com melhores com melhor performance bom algumas aplicações Gerais de redes neurais primeiro nós temos diversas arquiteturas e técnicas específicas que podem ser utilizadas para problemas específicos como a gente vai ver ao longo dessa disciplina E como eu já comentei nós vamos ver diversos modelos para tarefas específicas primeiro Associação de padrões aqui nós queremos associar um padrão X é um padrão Y poderia ser por exemplo uma pessoa e seu respectivo gosto por um filme então a pessoa x
ela pode ou não gostar de um filme y a pessoa x ela comprou um livro Y elas poderiam ter uma espécie de associação desses padrões poderia ser um alto Associação como a gente vai ver na rede de hop filtro de lá na frente onde eu tô associando o padrão X ao próprio padrão x e utiliza-se essa auto-associação para criar memória essa associativas de padrões recuperadas por conteúdo Então nesse processo aqui nesse nessa rede neural a gente pode considerar diversos modelos para criar essa Associação de padrões diversas técnicas de tintas reconhecimento de padrões aqui é uma
área bastante geral como eu falei uma ilustração abstrata de problemas é nós temos os dados representados aqui pela entrada esses dados podem ser num primeiro momento dados brutos então nós podemos ser diversas técnicas de rede diversos modelos utilizados para fazer a extração de características desses dados brutos uma vez características e gera um vetor de característica que representa aquele dado bruto esse Vetor pode alimentar uma rede neural aqui na nossa é nosso quadradinho representado por classificação de dados e aqui também nós podemos utilizar diversos modelos de redes neurais artificiais para fazer classificação regressão e diversas outras
tarefas uma outra tarefa bastante importante no qual as redes neurais são muito utilizadas é na aproximação de funções pensem o seguinte eu tenho uma função f de X Só que essa função f em alguns momentos ela não é conhecida ou mesmo sendo conhecido o custo computacional dela é muito elevado às vezes neurais como aproximadores universais de funções podem ser treinadas então para tentar aproximar essa função f então a gente pode gerar uma função f maiúscula aqui que aproxima a função f de x considerando apenas alguns dados daquele processo então nós temos aqui nesse gráfico os
dados de x e a respectivo valor de y desses pontos que representam aquelas informações que eu tenho de um experimento computacional de um experimento em laboratório e assim por diante então a rede normal ela pode tentar aproximar essa função que mapeia o X em Y Além disso nós temos aplicações em diversas outras áreas como filtragem adaptativa é tradução também utiliza modelos detecção de fraudes geração de moléculas em problemas de design de novos materiais concepção de veículos autônomos hoje está sendo bastante utilizado para nos carros autônomos modelos redes neurais para fazer o processo de administração da
condução desse carro e visão computacional dentro de diversas outras tarefas que podem fazer uso de redes neurais artificiais bom o que que nós vimos nessa primeira aula nós revisitamos o conceito o que que é inteligência artificial o que que é aprendizado de máquina nós introduzimos O que são as redes neurais artificiais só Relembrando só modelos inspirados na estrutura e no funcionamento do sistema nervoso ou Mais especificamente do cérebro nós conhecemos de maneira bastante rápida o histórico da área desde o surgimento dos primeiros modelos como modelo MCP até o estado da arte que representa os redes
Profundas entendemos algumas possíveis aplicações ainda que de forma abstrata das redes neurais artificiais na próxima aula a gente vai revisitar o cérebro aquilo alguns conceitos que a gente aprende lá no ensino fundamental no ensino médio desculpa revisitar o neurônio biológico lembrar Quais são as partes que compõem o neurônio biológico e apresentar como que esse neurônio modelado para criação de um modelo artificial como que a gente cria um modelo matemático é para representar uma unidade artificial que vai ser especificamente neurônio MCP que a gente vai visualizar nessa aprender nessa próxima aula bom agradeço a atenção de
todos e até a próxima aula [Música] [Música]
Copyright © 2024. Made with ♥ in London by YTScribe.com