[Música] Olá pessoal bem-vindos a nossa disciplina de estatística e probabilidade da Univesp ps300 meu nome é José Ricardo sou professor José Ricardo sou professor da USP e vou estar com vocês aqui esse bimestre estudando estatística e probabilidade para estudar estatística e probabilidade a gente tem que entender os termos básicos as ideias que fazem parte dessa disciplina como vocês devem imaginar estatística e probabilidade são intimamente relacionadas principalmente estatística que se usa de muitas ferramentas probabilísticas então no nosso curso a gente vai ver um pouco de cada coisa a gente começa com estatística vamos incorrer em um
pouco de probabilidade aprender algumas coisas que a gente vai precisar aprender para estudar mais estatística na segunda metade da disciplina então na aula de hoje a gente vai passear pelos principais termos os conceitos de estatística que a gente vai precisar usar ao longo do bimestre na nossa disciplina e como formação também né estatística é uma disciplina importante ajuda a gente a pensar tá bom então bem-vindos a disciplina vamos lá a gente vai começar tentando entender o que é estatística bom estatística é a ciência que emprega métodos bem definidos não podem ser métodos a doc são
métodos que são bem fundamentados para tentar entender dados Então a gente tem o objetivo de coletar dados existem técnicas para coletar esses dados para fazer com que esses dados sejam significativos porque eles possam responder as perguntas que a gente tá tentando responder organizar esses dados porque como a gente vai ver mais para frente no curso um conjunto de dados simplesmente anotados não significa nada e a gente quer depois de coletar e organizar a gente quer apresentar esses dados de tal maneira que a apresentação ajude a gente a responder as questões que a gente tá tentando
responder extrair informação desses dados não é fácil mas também não é difícil a estatística acumulou ao longo dos últimos 200 anos uma série de técnicas que permite a gente fazer isso tá bom e base com base nessa informação que a gente tem a partir dos dados a gente toma decisões Então tá resumido aí nesse slide então alguns exemplos de estatística são por exemplo eu quero determinar o efeito de impostos sobre cigarros no consumo desse cigarros seu aumento os impostos aumenta o preço do cigarro o consumo diminui é uma relação de causalidade a estatística ela existe
essa relação ou não a estatística ajuda a gente a tentar a entender isso outros exemplos estão aí determinados doenças que possuem um fator genético selecionar métodos os melhores métodos então a gente põe métodos competindo para concluir alguma coisa ou para prever alguma coisa estatística nos fornece ferramentas que permite selecionar esses métodos depois tá bom usos da palavra estatística a palavra estatística é usada de duas maneiras diferentes pelo menos num sentido ela denota a disciplina matemática então a gente fala em estatística descritiva que vai ser o nosso objeto nas próximas aulas a gente fala de estatística
inferencial a gente fala de estatística computacional a gente fala de estatística paramétrica não paramétrica isso a gente tá quando a gente fala estatística nesse sentido a gente está se referindo a disciplina mas a gente também fala de estatísticas de emprego estatísticas de acidentes de trânsito então a estatística também quando a gente fala estatística a gente pode também estar se referindo a um número que descreve um certo conjunto de dados tá bom é importante entender que às vezes a gente fala estatística se referindo à disciplina Às vezes a gente fala estatística se referindo a um número
ou a um conjunto de dados tá legal a estatística possui dois ramos principais a estatística descritiva que a gente vai ver bastante nessas primeiras aulas que se preocupem descrever os dados uma massa de dados é incompreensível na maior parte das vezes você olha uma tabela com mil números não significa nada se eu anotar mil alturas de alunos da Univesp eu não vou conseguir responder coisa simples como Qual é a altura média existe um número representativo tipicamente Qual a altura dos da Universo não consigo olhando para uma tabela de mil números Então eu tenho que descrever
isso em termos de medidas resumo do tipo média que todo mundo conhece né média aritmética simples existem outras e também apresentando esses essas esses dados graficamente tá bom e temos também a estatística inferencial que busca inferir descobrir estimar da melhor maneira possível parâmetros da população com base em dados que eu tenho de uma amostra a gente já vai falar o que que a gente entende por população e amostra então eu quero descobrir Ah qual que é a distribuição das alturas da população brasileira não tem como a mostrar a população inteira no senso a gente tenta
fazer isso mas ainda assim não é perfeito então eu pego uma pequena amostra e falo baseado na minha amostra o melhor que eu posso fazer E aí a estatística vai nos dizer o que que a gente pode fazer de melhor é inferir que a altura média cidadão brasileiro independentemente de cor raça gênero é um metro e 68 Então essa é o objetivo da estatística inferencial nós veremos também nesse curso mais para o final tá bom então vamos lá objetivos da estatística descritiva que é por onde a gente vai começar basicamente a estatística descritiva pode ser
resumida em Três Palavrinhas tá bom organizar Como eu disse você tem uma massa grande de dados fica difícil olhar para eles e tentar extrair qualquer tipo de informação a gente tem que organizar esses dados a gente pode ordená-los de menor para maior a gente pode separar eles em classes em números parecidos a gente pode contar quantas quantas dados tem o mesmo valor então organizar os dados é uma etapa importante da estatística descritiva é a primeira coisa que a gente faz quando a gente tem uma massa de dados para analisar a gente quer também resumir esses
dados uma vez que eu tenho organizado bom Eles continuam sendo mil números numa tabela Ah mas está em ordem crescente não tem problema vai me ajudar porque eu sei quem é o menor eu sei quem é o maior eu sei quem tá no meio Eu sei algumas outras coisas sobre esse conjunto de humildades de mil valores uma vez que eles tenham sido organizados Mas eu continuo sem ter uma visão geral macroscópica né Global da coisa isso eu consigo através das medidas resumo eu pego esses dados e resumo eles Como o próprio nome diz e um
certo número pequeno de números mas que tem um significado Claro a gente sabe que ele significa a gente sabe o que significa uma média aritmética a média é um ponto de equilíbrio é um ponto que está representando todos os valores que estão ali naquela amostra igualmente e existem outras medidas resume e o terceiro objetivo é apresentar uma vez que a gente tem a organizado e extraído algumas medidas resumo desses dados eu quero apresentá-los porque a gente tende a compreender melhor figuras não se a figura for bem feita se ela tiver uma lógica interna se ela
tem um método e a gente sabe que método foi usado para produzir essa figura quando ela é apresentada você já instantaneamente talvez não instantaneamente mas rapidamente você consegue ver falar então aqui ó tem poucos valores muito grandes tem poucos valores muito pequenos a maioria tá concentrado no meio você faz uma figura um histograma um gráfico de barras um diagrama de setores que a gente chama de diagrama de pizza né Então essa apresentação dos dados é uma coisa importante na estatística descritiva a gente vai ver também principalmente histogramas na nossa disciplina tá bom pessoal então organizar
resumir e apresentar São esses os objetivos da estatística descritiva tá bom três conceitos importantes então três métodos três objetivos organizar resumir e apresentar três conceitos importantes na estatística dados dados é o que você mede quando você quer saber uma coisa sobre um determinado fenômeno seja ele um fenômeno social tecnológico ou uma medida física você vai medir você vai colocar uma você vai extrair dados o termo é medir mesmo a gente fala medir mesmo que falar vou medir se a pessoa é fumante ou não Sim é uma medição Você pergunta e obter uma resposta sim ou
não isso são dados tá bom são dados são informações provenientes das observações Como tá aí um outro conceito de população população aqui a gente tem que entender que não é uma população humana necessariamente quando eu tô perguntando a aluna a altura dos alunos de determinada disciplina na universp a minha população São aqueles alunos mas quando eu tô por exemplo medindo a largura da nadadeira caudal de um peixinho que tem numa determinada passiva hidrográfica a minha população é aquele peixinho Mais especificamente a minha população é a nadadeira caudal daqueles Peixinhos porque eu não tô interessada no
resto do Peixe Eu Tô interessado só nas nadadeiras caudais então a população é o conjunto universo daquilo que eu tô querendo medir Depende do que você tá querendo medir às vezes uma coisa população às vezes é amostra e amostra é um subconjunto dessa população veja se eu quiser saber por exemplo a largura média da nadadeira caudal de um peixinho eu não vou conseguir coletar todos os Peixinhos eu nem sei quantos Peixinhos tem a gente pode até estimar mas jamais vai conseguir medir todos então vou pegar um subconjunto ah Peguei lá dois mil peixinhos e medir
esses dois essas duas mil medidas são a minha amostra é uma amostra da população tá lá enorme mas eu não consigo medi-la eu consigo só olhar para uma amostra Então os conceitos de dados de população e de amostra tem que estar bem claro para gente também porque a gente vai usar esses termos bastante na nossa disciplina tá bom exemplos por exemplo as notas finais dos alunos da Univesp na disciplina ps300 que é essa nossa disciplina aqui eu posso querer saber Quais foram as notas finais para caracterizar em média quantos alunos tiram tem muita gente indo
muito mal tem muita gente tirando 10 São indicativos a partir desses dados eu posso tomar conclusões ó tá todo mundo colando e não tá todo mundo Estudando muito ou então Puxa vida disciplina foi dada no intervalo muito curto o pessoal não foi tão bem então esses dados é isso que a gente quer da estatística a gente quer colher dados analisá-los para depois tomar conclusões para aprender alguma coisa extrair informações Esse é um exemplo de dados população São todos os alunos da Universidade porque já cursaram essa disciplina e amostra são até uma subconjunto desse então de
todos os alunos que já cursaram essa disciplina desde 2012 até hoje eu posso olhar para as notas finais de todos eles aí eu estaria analisando a população inteira mas não vou pegar só de 2022 e vou dizer que essa amostra de 2022 é representativa da população toda o que nos leva ao nosso próximo conceito quando que uma amostra representativa da população tá bom tem uma observação aí que é a seguinte o que é população em que amostra pode variar conforme objeto de pesquisa se eu tô falando se o meu objetivo é responder é analisar as
notas finais dos alunos da Univesp na disciplina ps300 de 2022 Então essa é passa a ser minha população porque especifiquei o ano de 22 o que era amostra antes agora virou população e Deus 500 alunos que fizeram eu vou pegar sua senha aí são 100 alunos do total de daqueles que em 2022 cursaram ps300 então a população em amostra você tem que especificar porque uma pode ser população às vezes para uns pode ser amostra para outros tá bom é só uma observação importante tipos de amostras bom uma mostra um subconjunto da população muito bem eu
quero que essa amostra represente a população e eu posso basicamente Existem várias técnicas de amostragens existem vários tipos de amostragem mas a gente vai ter interessado em duas dois amostras principalmente essas a gente tem que entender uma amostra aleatória simples frequentemente abreviada de AAS igual o comprimido lá para dor de cabeça uma AAS é uma amostra que você toma da população e depois que você obtém esse dado você devolve aquele sujeito seja o peixinho Ou seja a pessoa ou seja o boletim do aluno para a população e vai lá embaralha de novo e pega de
novo então você tá mostrando n itens se eu quero uma amostra de tamanho n da população onde todos os conjuntos de ni tem são igualmente prováveis então só é uma amostragem simples com reposição a gente chama isso já mostra aleatória simples mostra uma outra mostra muito importante e amostra estratificada porque às vezes a população ela é estratificada por exemplo se eu tô estudando a nadadeira caudal do peixinho lá os Peixinhos machos tem uma causadeira maior uma nadadeira né maior do que os Peixinhos fêmea Então essa população tem um extrato Eu posso misturar elas e falar
não vou ignorar esse valor Ou posso representá-los fala olha não eu vou colher 500 Peixinhos machos 500 Peixinhos fêmeas Porque daí eu vou ter uma representação maior da população supondo que a população de peixinhos metade é macho metade é fêmea eu não quero que na minha amostra tenha 70% de fêmeas 20 30% de machos ou vice-versa eu quero que a minha amostra represente a estrutura da população isso já aplica tudo por exemplo estrutura etária estrutura social e também estrutura espacial né Se eu pegar e fizer uma pesquisa de opinião num bairro abastado os resultados provavelmente
serão diferentes se eu fizer a mesma pesquisa as mesmas perguntas num bairro menos abastado Então quem é minha população minha população é todo mundo então tem que pegar uma parte daqui e outra parte dali Esse é o conceito de amostra estratificada por exemplo a pirâmide etária vou fazer uma pesquisa de opinião do brasileiro quem é o brasileiro o brasileiro é o brasileiro que tem 18 anos o brasileiro é o brasileiro que tem 25 anos o brasileiro é o brasileiro tem 60 anos o brasileiro é o brasileiro que tem 90 anos então se eu pegar uma
amostra de 100 pessoas eu quero que 3% tenham entre 80 e 85 anos eu quero que 30% tenham entre 30 e 35 anos e assim por diante porque daí essa mostra vai ser uma mini populaçãozinha brasileira eu vou ter lá uma representação do que eu encontro na população vou ter na minha amostra uma representação da população tá bom são as duas amostras que a gente vai mais usar que são as mais usadas em particular no nosso curso como ele é introdutório a gente vai fazer uso bastante simples da Matemática a gente vai falar principalmente de
amostragem aleatória simples Tá legal variáveis estatísticas variáveis são nomes Nos quais a gente registra os dados tá bom esses nomes podem podem registrar atributos podem ser variáveis qualitativas e podem ser variadas quantitativas o próprio nome já diz variável qualitativa você registra nessa variável um atributo ou uma coisa que não é numérica quero fazer uma pesquisa Se as pessoas são fumantes ou não a resposta é do tipo sim ou não Você é fumante sim não dá para fazer uma média assim mas não dividido por 2 dá quanto não existe Então essa variável que armazena essa resposta
que registra a resposta que eu obtive ela é qualitativa agora eu posso pedir também perguntar a altura da pessoa por qual sua altura 1,78 m no meu caso Esse é um número então eu armazena invariáveis quantitativas quantidades e qualidades tá bom Por exemplo cor dos olhos preferência de consumo estado civil são variáveis qualitativas variáveis quantitativas são medidas físicas anos de instrução qualquer coisa que pode ser representada em termos de números né as variáveis qualitativas elas podem ser nominais ou ordinais nominal é aquela que não tem embutido em cima noção de ordem ela é simplesmente registra
por exemplo Você é fumante sim não não vou responder poderiam ser as três respostas possíveis sim não e o sim vem antes do não não tem uma ordem intrínseca entre as possíveis respostas que eu tô registrando na minha pesquisa por outro lado eu posso ter variáveis que são qualitativas não estão associadas a números mas que guardam entre si uma noção de ordem ou precedência por exemplo você usa camiseta tamanho pequeno médio ou grande eu posso então eu vou registrar pmg não dá para somar p + m dividir por 2 não dá para fazer uma média
aritmética das respostas perdas respostas úmidas respostas de no entanto eu posso supor que P vem antes do M que vem antes do G eu gasto menos tecido para fazer uma camisa P do que para fazer uma camisa G então elas são qualitativas Mas guarda entre si uma ordem Tá bom então existem esses dois tipos e as variáveis quantitativas por sua vez armazenam números que podem ser discretos por exemplo um dois três zero 10 20 30 um conjunto finito valores não precisam ser valores inteiros mas tem que ser finitos Qual sua constante matemática preferida Pie ou
raiz de 2 são números guarda uma relação entre si é uma resposta quantitativa mas o possível conjunto de respostas é finito e variáveis quantitativas contínuas são aquelas que são números reais né pessoal a gente imagina que você pode apesar da precisão ser finita pode ser um número qualquer pluviosidade Quantos milímetros de chuva subiu hoje 12,3 a precisão for maior sei lá 17,55 mm é um número real não é um número discreto a gente não sabe de antemão o número de categorias possíveis Tá bom então aqui a gente tem um quadro resumo dos tipos de variáveis
estatísticas e dos seus nomes para consulta de vocês variável qualitativa também chamada de categórica porque armazena categorias variáveis quantitativas que são números podem ser discretos ou contidos uma outra maneira de a gente é classificar as variáveis estatísticas em termos de nível de nível de mensuração quer dizer quando eu meço elas que que eu posso fazer com elas então esses cara ela descreve o que que eu posso fazer com as variáveis uma vez que elas estejam registradas a escala nominal é aquela que não dá para fazer nada a escala nominal seria o equivalente Aquela nossa escala
qualitativa nominal são Dados categóricos separam as respostas em categorias mas fora isso não posso fazer mais nada e tem a escala original resultados podem ser ordenados numa escala eu digo quem está mais à esquerda quem tá mais à direita quem precede quem quem vem antes quem é menor a gente pode pensar em menor mas eu não posso fazer diferença né então pequeno médio e grande quanto que é g -m g - m não é nada m - p não é nada então eu não posso fazer operações matemáticas muito embora o pastor ordenadas e os outros
dois níveis são a escala intervalar em que os dados podem ser ordenados geralmente são números e eu posso fazer operações aritméticas com eles do tipo uma escala de temperatura então 30 graus Celsius não é uma grandeza física é uma escala que foi inventada Fahrenheit é diferente mas eu posso dizer que entre 30 e 50 graus Celsius eu já tenho 20 posso fazer essa operação de subtração Então eu tenho uma escala eu tenho o tamanho dos intervalos muito embora eu não tenha uma origem bem definida e a gente tem a escala da razão que é aquela
escala em que os números são realmente representativos daquilo que eles estão pedindo quando eu tenho um zero esse zero é o zero mesmo Ah você mediu lá quantas quantos filhos a família tem tem zero zero é zero não é uma questão de escala Se eu mudar para Fahrenheit vai continuar sendo zero Tá certo então esses são aqueles dois podem ser discretos ou contínuos Mas eles são números de verdade tá bom então esses níveis de mensuração São uma outra maneira da gente organizar variáveis que a gente vai usar na estatística aqui tem um quadro resumo e
[Música] sobre o que a gente pode fazer né variáveis nominal ordinal intervalares de razão e o que a gente pode fazer pode categorizar os dados a gente pode ordenar os dados a gente pode subtrair eles né para analisar intervalos a gente pode dizer que um é múltiplo do outro eu não posso dizer que 60 graus Celsius é o dobro de 30 graus Celsius isso não é verdade mas eu posso falar que 2 metros é o dobro de 1 m por quê Porque 0 1 m faz sentido é o comprimento nulo tá bom bom pessoal então
é isso espero que vocês tenham gostado da aula se acostumem com esses conceitos e até a próxima aula [Música] [Música]