O que é Data Mining e como funciona?

9.91k views2218 WordsCopy TextShare
Brincando com Ideias
💡 NÃO FIQUE QUEBRANDO A CABEÇA! https://cursodearduino.net/ 💡 Curso de Arduino para Principiantes...
Video Transcript:
E aí [Música] se você já falou obrigado por da tamanho hoje é o da tua mãe ajuda muito a sua vida mesmo que você não saiba onde ele está que que ele é trata mãe ou traduzido mineração de dados é algo muito importante nos dias de hoje onde temos cada vez mais informações circulando pela internet nesse vídeo você vai entender o que é esse tal de da tamanha Por que que ele é tão importante sejam muito bem-vindos ao canal brincando com ideias aqui você aprende sobre novas tecnologias e forma fácil e divertida o que nós
quebramos a cabeça por vocês mastigamos tudo aquilo que a complicado difícil de entender e trazemos tudo simplificado para te ajudar aprender e se divertir hoje vamos fazer isso com datamar com parceria com a Petrobras estamos trazendo essa série Super Legal chamada caça ao tesouro tecnológico Power a cada vídeo você fica sabendo sobre uma tecnologia revolucionária Procura pelo código Petrobras que fica escondido em algum lugar aqui desse vídeo se você ainda não sabe sobre o super prêmio de verdade para os primeiros cabreiro em o baú do tesouro aqui em cima Olha vou deixar um link do
primeiro vídeo da série Toda a explicação eu sou Flávio Guimarães apaixonado por tecnologia e a minha missão é incentivar e facilitar o aprendizado da tecnologia para que todos possam conhecer criar inventar com as ideias por isso eu creio o canal brincando com ideias e os cursos arduino.net e robótica. Net Olha tem dessa mãe no site que você navega na companhia de energia elétrica na empresa de seguros tudo isso para te ajudar a entender porque vamos conhecer sobre mais essa tecnologia revolucionária vem comigo é E aí E aí quem sabe aquele meio perigoso que cai na
sua caixa de spam tem data mais nem ali sabe o pessoal da empresa de energia fazendo manutenção o datamine também pode ajudar a identificar anomalias na rede e apontar a necessidade de manutenção preventiva e quando você faz um seguro de carro a seguradora também pode utilizar o da tamanho para calcular as probabilidades dos riscos e assim fazer o melhor preço para você eu falei no começo do vídeo que o da tua mãe está presente em muitas coisas que fazemos e nem notamos é mesmo depois entre o mais comum é o uso do da tamanho em
sites de vendas vendas online e nas propagandas que aparecem para você já não aconteceu com você você pesquisa ali por celular e depois começa a receber várias propagandas sobre celular pois é um algoritmo com data mining é utilizado nesses e para identificar um padrão dentro do público-alvo e fazer com que a campanha funcione melhor né segurança digital além de identificar spam no e-mail é possível que uma mudança no padrão de um login seja identificada no login de uma rede social por exemplo E com isso é possível indicar um possível hacker Tentando invadir o seu perfil
ainda insegurança mas no setor financeiro o da tamanho e ajuda a prevenir fraudes com cartões de crédito essa tecnologia também é utilizada em empresas como ferramentas de crises internas e para transformar os dados em informação para que ajude nas tomadas de decisão no setor de saúde e da tamanho pode identificar os padrões de doenças e auxiliar em exames estudos médicos e assim mesmo alertar sobre uma piora em pacientes que estão em isso aí muda tamanho é composto por um o número de técnicas que utilizam fórmulas estatísticas para encontrar padrões relações entre os dados anomalias e
outras coisas de acordo com os critérios programados é como se fosse uma peneira o programada para receber muitos dados e deixar passar apenas aqueles que tiverem os padrões que a gente queira essa possibilidade de encontrar padrões é a base do machine learning Machine Burn traduzido para o português significa aprendizado de máquina essa máquina nada mais é do que o computador e aqui na série educação tesouro nós ainda teremos um vídeos então sobre essa tecnologia e forma bem resumida podemos dizer que o da também em é a principal ferramenta do machine learning para que o computador
Aprenda uma das coisas que ele faz é mineira dados então voltando para o data mining e para essa peneira de dados Sabe aqueles padrões que podem ser identificados quando o computador identificar parte de um padrão ele pode entender que o restante do padrão é esperado como o próximo passo mais calma vamos entender como que tudo isso funciona então vamos fazer uma pesquisa por panetone em um desses sites de vendas online você pode brincar aí também eu acho legal e olha eu entrei aqui nesse site de forma aleatória foi o primeiro que veio na minha cabeça
e eu não conheço não tem nenhuma opinião sobre tá você pode fazer o teste em qualquer outro site que você quiser então vamos lá vamos digitar panetone Ok e olha eu achei esses resultados entrando nenhum dos produtos site já capturou a informação de que eu estou buscando por o planeta essa informação já foi trabalhada pelo Mach Lane que aprendeu através do da tua mãe que o panetone tem as mesmas características que o uso dos produtos e esses padrões podem ser por exemplo alimento produtos Natalino produto mais comprado por mais mais de bebês se a gente
descer um pouquinho a página nós vamos ver os resultados do da tá mais aqui em produtos patrocinados temos alguns produtos que aparentemente não tem nenhuma relação com panetone com o banco de dar cheio de informação os programas de Mach Lane no site também Descobriram que algumas das pessoas que apenas visitaram o anúncio desse panetone acabaram comprando outros produtos que são indicados aqui para nós logo aqui em quem viu este produto viu estes também tá vendo mesmo que você esteja a vida de comprar o panetone o site com data mãe já te dá mais opções antes
de Que você desista e saia dele e não para por aqui descendo a página mais um pouco encontramos mais uma informação gerada pelo da tamanho em produtos similares Essa é mais uma oportunidade do cliente se decidir comparando com outros produtos ainda no mesmo site aumentando a chance de vendas e mais um trabalho do datamine ao descer a página mais um pouco também temos outro padrão encontrado produtos mais buscados na semana estranho que esteja mostrando o kit de fraldas milho em conserva da mesma Esse site é mais conhecido por vender televisões celulares eletrodomésticos mas aqui o
site usou o tamanho para encontrar os produtos mais procurados pelas pessoas que compraram panetone a seleção feita através dos padrões encontrados nas compras dos milhares dos clientes mais uma indicação do datamine é feita quando colocamos o produto na sacola ó tá vendo olha vai abrir e aqui em cima Aproveite e compre junto é mais um exemplo de da também pessoal quem é que gosta de uvas passas no arroz da ceia de Natal no panetone uvas passas são polêmicas no São não você gosta dela Olha eu vou fazer aqui uma analogia para exemplificar a relação que
o data mining tem com o machine learning e também com outra tecnologia quer Inteligência Artificial inclusive já temos um vídeo falando só sobre a inteligência artificial aqui na série educação tesouro vamos lá a uva passa está dentro daquele panetone que nós vimos certo Então nesse caso a uva passa está para o da tamanho em assim como o panetone está para uma sheilane a inteligência artificial Ela seria a ceia de natal o que eu quero te explicar aqui é que um faz parte do outro são tecnologias específicas Porém uma faz parte da outra a inteligência artificial
de forma resumida é habilidade de um computador realizar tarefas com um certo nível de inteligência o computador é uma máquina certo quando esse computador chega ao ponto de aprender e agir como uma pessoa ou até mesmo melhor que uma pessoa nós temos a definição de Inteligência Artificial dada por Alan turing na década de 40 mas para que a máquina tenha essa inteligência ela precisa aprender assim como uma pessoa então temos um Mach Lane ou aprendizado de máquina que conta com um pacote de tecnologia para tornar possível a inteligência o hino masha enorme a máquina faça
por um processo semelhante ao que nós seres humanos passamos para aprender inclusive algumas das lógicas de programação foram inspiradas na dinâmica dos nossos neurônios por isso esse tipo de algoritmo é chamado de redes neurais artificiais a questão é que o computador diferente do ser humano não é tão eficiente para aprender um dos motivos é que nossas redes neurais são naturais e nosso cérebro foi feito biologicamente para função de encontrar padrões de aprender e o outro motivo é que o algoritmo é desenvolvido por um programador ou seja um ser humano que usou o cérebro para programar
algo parecido com cérebro seria muito da hora se fosse possível dar um control c control V para copiar o que temos no cérebro para funcionar no computador se você não acha não mas eu acho que isso ainda está bem longe de acontecer tá Então pessoal rindo neurais artificiais não é um conceito recente primeiros artigos sobre esse assunto são na década de 40 Como a tecnologia da época não estava preparada para processar o algoritmo tão complexo Demorou bastante até se tornar viável hoje vemos que irá machine learning e redes neurais artificiais tem ganhado cada vez mais
destaque por causa da evolução da tecnologia um exemplo dessa evolução são as placas de vídeo atuais com a capacidade de processar a informação de maneira paralela gerando um poder computacional muito maior do que o imaginado lá no século passado agora vamos entender um Pouco Mais especificamente sobre o data mais sobre É uva passa certo vamos ver é de Tapas dele para que a gente tenha os resultados que esperamos a primeira etapa é um de Fazemos o planejamento estratégico Ou seja é onde definimos um objetivo e um problema será solucionado antes de começar o processo de
mineração de dados precisamos entender o objetivo que queremos com aquelas informações esse objetivo pode ser determinado por um cientista de dados ou também pela Inteligência Artificial que foi programada para utilizar datamark em um exemplo que vimos no site o objetivo é identificar padrões que identifiquem a categoria de um produto padrões que identifique os melhores produtos a serem vendidos e também padrões que indiquem as melhores opções e combinações para o público e mais pesquisa por aquele produto a segunda etapa é capturar as informações não tem como minerar e se não tivermos dados certo no caso do
nosso exemplo do panetone a captura é feita pelo site enquanto navegamos nele é feita ao criar uma conta ao realizar uma compra cada momento estamos gerando informação pro data marca a terceira é etapa de organização e limpeza dos dados nessa etapa é feita uma avaliação Para retirar informações que podem estar erradas ou duplicadas e também garantindo que estejam padronizados de forma que o algoritmo de da tamanho consiga avaliar todas as informações para garantir essa padronização uma das técnicas utilizadas é a generalização por exemplo a informação Contendo a idade dos clientes pode ser generalizada e distribuída
entre grupos de faixa etária Depois que temos as informações tratadas a amizade vem a etapa da mineração nessa etapa é que entrou em Ação os algoritmos que vão analisar todos esses dados e transformar em informação útil tem as principais técnicas utilizadas nessa etapa são as seguintes primeiro redes neurais elas funcionam através do processamento da informação e dezenas e centenas de vez simulando o funcionamento do cérebro humano identificando padrões a segunda técnica é a análise estatística que são cálculos para descobrir padrões EA terceira técnica é a árvore de decisão que é uma técnica que classifica os
resultados tudo isso de uma forma muito rápida Você tem alguma dúvida de que o da tua mãe tem sido uma revolução no tratamento dos dados em grande volume e com ele é possível se obter informações muito vai a questões de segundos e olha pessoal uma linguagem muito usada para programação Duda tá online é o Python aqui na série caça ao tesouro nós já fizemos o vídeo falando só sobre essa fantástica a linguagem de programação temos várias dicas de bibliotecas que você pode usar para programar machine learning e você lembra machine learning é o panetone do
da tamanho não lembra não deixe de assistir o vídeo sobre pai aí o código da Petrobras em conseguiu pegar e anotar e não conseguiu volta o vídeo e não perde nenhum código tá bom esse aqui pessoal é o quarto vídeo na segunda temporada da série nele você encontra o código Petrobras de número quatorze aí anotando todos os códigos tá bom aí no final da primeira temporada nós já entregamos o primeiro mapa do tesouro para você descriptor e os 10 primeiros códigos Petrobras só lembrando em que os três primeiros que abrem o baú do tesouro vão
ganhar super prêmios Obrigado pela sua participação um forte abraço e até o próximo vídeo tchau tchau tchau
Related Videos
Aprenda como a tecnologia Blockchain funciona!
26:06
Aprenda como a tecnologia Blockchain funci...
Brincando com Ideias
17,939 views
O que é e como começar uma Startup
18:31
O que é e como começar uma Startup
Brincando com Ideias
5,503 views
ARRESTIME të reja, ja kush e ka rradhën! - Zone e Lire
46:26
ARRESTIME të reja, ja kush e ka rradhën! -...
Zone e Lire
30,532 views
Eliminates All Negative Energy, Tibetan Healing Flute, Increases Mental Strength
3:58:39
Eliminates All Negative Energy, Tibetan He...
Inner Peace and Meditation
2,723,373 views
A Grande Crise dos Semicondutores
13:47
A Grande Crise dos Semicondutores
Elementar
165,407 views
LoRa - A Tecnologia Da Comunicação Ponto a Ponto
24:24
LoRa - A Tecnologia Da Comunicação Ponto a...
Brincando com Ideias
75,331 views
Feeling Good Mix - Emma Péters, Carla Morrison
50:42
Feeling Good Mix - Emma Péters, Carla Morr...
Nonstop Music
51,211,482 views
Uma AULA sobre DATA SCIENCE
14:42
Uma AULA sobre DATA SCIENCE
Cortes do Ciência Sem Fim [OFICIAL]
132,336 views
Inteligência Artificial em nossas vidas já é realidade? Precisamos nos preocupar?
25:46
Inteligência Artificial em nossas vidas já...
Brincando com Ideias
9,009 views
Classical Music for Brain Power, Studying and Concentration - Mozart Effect
1:55:11
Classical Music for Brain Power, Studying ...
Classical Mastermind
1,120,705 views
IoT: O que é Internet das Coisas. Você precisa saber!
23:50
IoT: O que é Internet das Coisas. Você pre...
Brincando com Ideias
16,519 views
Makroni i ‘shpall luftë’ Rusisë?! Çfarë po ndodh? | Ilir Kulla- Zone e Lire
34:00
Makroni i ‘shpall luftë’ Rusisë?! Çfarë po...
Zone e Lire
68,950 views
Ibiza Summer Mix 2024 💎 Best Of Tropical Deep House Music Chill Out Mix 2024 💎 Chillout Lounge #023
4:03:44
Ibiza Summer Mix 2024 💎 Best Of Tropical ...
Deep Diamond
6,642,885 views
What is SEMICONDUCTOR? HOW DO SEMICONDUCTORS WORK? Understand the SEMICONDUCTOR CRISIS!
11:49
What is SEMICONDUCTOR? HOW DO SEMICONDUCTO...
Engenharia Detalhada
100,861 views
【R&B Relax 4】Cozy Playlist / for Chill / Work / Indie / Ballad / Relax / Coffee
1:07:03
【R&B Relax 4】Cozy Playlist / for Chill / W...
Soul Stories Daily
847,485 views
What Does the AI Boom Really Mean for Humanity? | The Future With Hannah Fry
24:02
What Does the AI Boom Really Mean for Huma...
Bloomberg Originals
1,179,265 views
E vërteta e sherrit Trump - Zhelenski! | E premte, 8 pa 5
1:33:59
E vërteta e sherrit Trump - Zhelenski! | E...
Dritare TV
7,076 views
The Best of Mozart
1:56:02
The Best of Mozart
HALIDONMUSIC
269,135,913 views
O que é DATA WAREHOUSE? Você precisa de um?
13:35
O que é DATA WAREHOUSE? Você precisa de um?
DBA PRO
102,418 views
Para que serve o Python?
26:28
Para que serve o Python?
Brincando com Ideias
34,716 views
Copyright © 2025. Made with ♥ in London by YTScribe.com