[TEÓRICA] Especificação e diagnóstico de modelos econométricos

1.71k views13146 WordsCopy TextShare
economiaetv
➡️ CONSULTORIA, ASSESSORIA ACADÊMICA E PARCERIAS: economiaetv@gmail.com. ➡️ CURSO: INTRODUÇÃO A MOD...
Video Transcript:
E aí Tá bom então Capítulo 13 é que ele trata né E aí a entrada de um fechamento da parte da primeira parte de econometria ele fala basicamente sobre alguns apontamentos que o pesquisador tem que ter quando ele vai fazer Vai elaborar o seu estudo econométrico ao longo do Capítulo 123 nesse nessa primeira parte né da do livro econometria basicamente o que se vê são a é a formação do modelo as hipóteses subjacentes do modelo e algumas questões que ocorrem na análise que acabam ferindo alguma das preposições e na economia dois gente inicia já os
falando um pouco sobre essas pressuposições que acabam sendo quebradas na modelagem em função de desafios mesmo metodológicos que o pesquisador vai tendo ao longo do estudo econométrico né falou sobre a multipolaridade problema da multipolaridade da heterocedasticidade é as últimas aulas foram sobre a correlação é basicamente que a gente vê que é o fechamento dessa primeira parte né parte de baixo aqui de econometria e o teu Capítulo Traz ele ele é bastante intuitivo nesse sentido é que o quando a gente vai estudar econometria muitas vezes fica muito ligado com a questão a dos vivos têm isto
porque eles têm reportado em análise econométrica ela é muito complexo e né com mais que a parte teórica de econometria seja muito bem escrita nos livros análise e se ela é muito complexa ela envolve coleta de dados envolve a escolha de várias informações que estão disponíveis a escolha de vários métodos Às vezes a gente não tem a noção da quantidade de métodos que existe para terminar os problemas de da econometria Então à econometria uma disciplina sempre tá andando né Sempre tá tá avançando e numa velocidade nos últimos anos cada vez maior A então o pesquisador
e vai começar aí Selma no trabalho não é pesquisa ele tem que ter uma noção muito grande do da área que ele tá estudando dos trabalhos que têm sido elaborados para ele saber exatamente o que antes que ele tá pesando ele saber se determinada circunstância ele pode aplicar os mínimos quadrados ordinários céu em que especial MTG seu GNV enfim se é um outro tipo de método então assim o trabalho ele ele não é simplesmente ler literatura é teórica e depois sair aplicando igual a gente vê aqui mas a mesma mecânica disciplina porque ela disciplina é
de nível de graduação e que não tava especificamente formando pesquisadores nas pessoas que a querem no futuro trabalhar com econometria é um conhecimento básico que vai servir de nos primeiro passo e que permite o livro que você que vocês tenham uma certa um certo domínio ou uma certo grau é a instrução para tentar entender o que as pessoas fazem quando vão aplicar uma técnica econométrica né então na prática o estudo de econometria ele demanda muita compreensão intuição e também habilidade é compreensão no sentido de pesquisar vai entender muito bem o campo ele tá tentando estudar
tanto na questão teórica quanto também na questão empírica intuição no sentido de conseguir se antecipar alguns problemas que podem acontecer e buscar sempre as melhores soluções para isso e habilidade para poder sair de uma série de problemas que enfrenta na modelagem aplicado muitas vezes a gente pode ter um modelo teórico muito bem fechado uma base de dados consolidados a vinda de um Instituto de Pesquisa famoso e aí quando a gente vai fazer chamativo sinal da trocado a variável não da significância enfim são coisas que podem acontecer de tem que entender porque isso daí acontece na
e é na parte aplicada e tentar buscar soluções né então o livro ele trata ele coloca um exemplo aqui por exemplo de no caso de dar do engenheiro não é dependente passa uma ponte a gente não fico imaginando ali coloca o seu trabalho do engenheiro para poder fazer o palco Lady Di e peso daquela continha simplesmente confira o trabalho foi bem feito né a gente acaba passando economista também é bem semelhante a gente quando a gente vai elaborar um modelo econométrico a gente tem uma responsabilidade porque tudo modelo econométrico ele passa uma mensagem ele passa
uma informação e a partir daquela informação em que cria narrativa do trabalho para dizer se a variável tá o impacto metal o que que vai causar o que que vai acontecer então a essa parte da modelagem ela é extremamente importante porque ela diz algo né para as pessoas e se os economistas não tem essa habilidade para poder gerar resultados para é por meio da análise empírica receberam colocar lá um asterisco e nós vamos responsabilizando-se o uso desse modelo aqui da forma que tá provocar algum acidente cai no sentido de que a gente também tem responsabilidade
com o nosso trabalho e como a econometria é um ramo mais aplicado né levar mais aplicado tem que ser muito bem feita muito bem os procedimentos tem que ser em si a rigorosos para garantir e os resultados sejam condizentes com a realidade que não causem nenhum problema plástico o Paulo esse Maker por outro empresário filho as pessoas que vão utilizar aqueles resultados para poder aplicar ali no sentido de alocação de recursos meses né tá bom aí tem uma piadinha que quer interessante Também quem é do gato preto né que a gente colocar lá nem matemática
lista teórico e uma economistas são chamados para tentar localizar um gato preto uma sala fechada e escura não só que o gato não existe é o gráfico já sabe se a priori para o gato não existe aí matemático vai lá tenta procurar o gato faz todos os cálculos deriva todos os cantos do quarto e sai de lá louco porque não encontrou o resultado aí economiza teórico fica lá cinco minutos a vale o quarto episódio com trauma encontrei não mas eu posso escrever que Teoricamente os movimentos do gato de dessa sala e aí vai econometria você
passa um tempo algumas horas depois e sai gritar eu achei o gato Achei lugar e com sentido que essa piada se aplica né é a econometria ela pode gerar resultados que nós fato não não são condizentes com a realidade eu não sou condizentes com a realidade aí quando eu entrei acima de tudo eu faço estatística Condados e Condados econômicos então se eu pegar um conjunto de dados que não são condizentes com a realidade em pego Passa umas estimativa ali enquanto significância naquilo e a partir daquilo comércio geral na história né geral uma construção ali de
uma narrativa toda baseado no resultado eu tenho que ter um certo grau de confiabilidade de quem resultado é condizente com a realidade caso não seja é a mesma coisa desse economista que entrou no quarto aqui fez peso que tem que fazer lá e depois sai gritando que achou o gato quando na verdade não existe gato é porque análise foi aí foi mal feito análise apesar de ter encontrado o resultados que parecem ser ser tênis não não pensa essa robustez toda porque enfim não tem base não tem solidez para poder chegar aqui então econometria que é
aplicação de métodos estatísticos em dados de Economia tem que estar muito bem casada com a literatura teórica se ela não tiver e o simplesmente modelo que não pode pega uma base de dados acordando de aleatório escolhe avariada Pelo modelo de certo é a mesma coisa desse cronometrista que entra num quarto escuro e sai gritando que achou um gato preto sendo que na verdade o gato nem existe né bom é então é uma parte fundamental da análise Econômica seria a escolha dos modelos né seria Escolha dos modelos como que a gente pode escolher a melhor formatação
para o modelo e a gente pode seguir alguns critérios né distante por exemplo que é uma pertencer confirmado pelos atos você tem um modelo teórico Você tem uma base de dados então o modelo empírico ele tem que ser confirmado por aquela base se não for confirmado ou a teoria não se encaixa PT conjunto de dados os dados simplesmente não são diretamente relacionados com a teoria que está sendo traçado né ele tem que ser consistente também com a teoria do sentido de que tem que ter essa ligação E aí a parte é teórica os agressores tem
que ser fracamente exógenos no sentido de que o modelo tem que ser corretamente especificado o erro não pode ser correlacionado com o livro regressou caso contrário Possivelmente é um problema de omissão de variável relevante aí o função de variável também está relacionado com a especificação do nosso modelo funções de variáveis podem causar também viessem consistência no modelo a gente vê somente nos dias de hoje por causa da questão da academia por exemplo uma chuva de Pesquisas uma chuva de modelagem Sem Fim de análises tentando explorar alguns aspectos econômicos aí da academia ou então de outras
áreas específicas mas sem muitas vezes uma robustez teórica que permita utilizar pelos resultados o fato para planejamento público e fica aplicação de política pública às vezes regressores ali não são fracamente e exógenos nesse sentido né esse quase sempre o modelo ele acaba não ter esse suporte teórico bem ajustado E aí a análise acaba sendo enviesado inconsciente função disso bom os parâmetros tem que ter Constância nele consistência com a experiência eles não podem ser muito diferente do que a temperatura de alguém mostrando caso contrário ou trabalho fez uma inovação muito grande ou então a gente fez
alguma coisa errada ali na nossa modelagem como princípio para a tosse fazendo inovação muito importante nariz tem que ter conhecimento muito grande na área a gente a parte dessa preposição e já desenvolve o trabalho em cima dessa linha caso contrário sentiste modelo e a gente não espera um barulho e aquele valor ocorreu na nossa modelagem não pode dormir também sair falando que nossa inovação emite uma nova abertura do campo teórico no Camp porque o resultado foi diferente da literatura é bem provável que que abordagem dica foi foi mal conduzida né e é e consistência com
os dados exemplos devem deve ser puramente jogadores caso não sejam também é um indício de que há algum problema na modelagem e tem que ser abrangente o modelo né é que seu mais aprimorado possível no sentido de que se existe na literatura textos que foram as curtidas pelos pares e que de fato mostraram que a análise Econômica deve seguir por determinado caminho e isso fez surgir novos tipos de modelo para lidar com qualquer tipo de problemas então a gente sempre tem que ir para Fronteira de conhecimento para utilizar sempre os modelos que são mais aprimorados
mas apresente possíveis as contrário se a gente utiliza modelos é que estão ali no início da discussão a gente corre o risco muito sério de cair no lixo ali pesquisa que não vai ter relevo essa alguma porque vai apresentar diversos problemas que foram foram jaipur e já foram apresentadas soluções presente no procurar soluções dentro da modelagem então aqui alguns Alguns critérios que a gente tem que sempre ter em mente aí para a gente vai fazer uma na modelagem na na economia né bom E esse tópico 3.2 ele trata um pouco sobre os erros de especificação
basicamente os erros de especificação eles ocorrem quando o modelo não tá corretamente escrito né Existe algum problema no modelo algum problema na variável ou então a forma funcional do modelo não é a mais adequada alguma coisa nesse sentir e aquele discutir basicamente é omissão de variáveis relevantes inclusão de variáveis e relevantes aí quando a gente adota uma forma funcional equivocada erros de medida nas variáveis especificação incorreta do erro e a corrente supõe que seja distribuída igualmente sempre na verdade ele segue novo tipo de distribuição é bom em relação a audição de variável relevante é um
aspecto que merece fundamental atenção quando a gente vai lidar com abordagem pelo médico porque porque um modelo ele apresenta a missão de variável relevante quando ele não tem uma ligação direta com a teoria que o embaixo passe pelo lição de variável relevante uma literatura teórica tem que me dizer que àquela variável é importante para encorporar para ser incorporada dentro do modelo por exemplo eu tenho uma variável tem um modelo é consumo em função de renda vamos o próprio consumo seria variável y a renda seja variável x 2 E aí existe uma terceira variável que poderia
ser por exemplo educação mapa eu entro capital humano e disse que enfim a o nível de escolaridade ao nível de capital humano pode afetar Olá os hábitos de consumo das pessoas por exemplo Então se existe uma teoria que mim que incorpora essa variável dentro das funções consumo o dever e colocar lá dentro das especificações planeta caso eu não coloco essa maravilha dentro do modelo eu teria uma opção de variável relevante porque que ela é relevante é teoria diz que ela é relevante não foi eu que inventei foi um modelo mostrou simplesmente a teoria e de
pouco àquela variável seria relevante para nós daí eu tenho um modelo de lá dele que seria esse modelo com a inclusão da variável x 3 e o modelo que tá mal especificado que seria com a exclusão da X3 dentro do modelo que que acontece quando a gente tem esse tipo de circunstância bom me primeira coisa é a variável o grande problema da omissão de variável relevante é quando a gente realmente essa variável e essa variável tempo relação com algum outro regressou que tá dentro do modelo porque se caso essa variável metida ela tem correlação com
algum repetição que foi incorporar bem do modelo pelo fato da variável medida compor agora perdi erro e pelo fato de o rosto agora como um todo ser correlacionado com o impressor isso causaria viés e assistência na minha estimativa tão percebam que quando eu tenho a missão de uma variável relevante e essa variável que foi cometida que tá procurada no termo de erro tem alguma correlação com o regressou que ficou é especificado em da equação o modelo sempre vai ser enviesado e inconsistente por quê que isso acontece uma das posições do modelo clássico é que o
resíduo ele não é correlacionado com regressou caso contrário isso vai causar viessem consistência nas estimativas o fato de omitir a variável relevante faço o quê agora ela seja incorporado dentro desse termo dinheiro então se ela está incorporada neste diagrama passa a fazer parte da avaliação daquele erro tá lá então o ele passa a ser composto de uma variável puramente aleatório que não é para relacionada com ninguém e dessa variável mentira que tem correlação com alguma impressor E aí O curso agora vai acabar apresentando também o relação com alguma igreja que foi procurado e isso vai
causar viessem consistência bom é além disso a gente tem o fato de que a variância do erro e consequentemente dos parâmetros acaba também sendo é estimada em corretamente porque na fórmula da variância do estimador a gente se encontra lá no elemento Sigma 2 que é a variância do erro então trabalhar com a medida tá dentro do erro ou em passa a ter uma variação diferente ele vai ser a variância dele vai ser a soma agora da variância do erro puramente aleatório e tá variância desse dessa variável que foi mentira da modelagem então se a variância
do erro passa a ser diferente e ela compõe a variância do estimador então lavar aliança chamado também passa a ser diferente então acaba sendo incorretamente estimado por consequência ela tende a ser maior porque agora eu vou tá incorporando na outra informação ali na varian O que é e como os intervalos de confiança são criados a ao entorno do estimador dependem dessa variância do erro esse também vão ser maiores né intervalos de confiança maiores é uma probabilidade maior de incorporar o valor zero dentro das suas extremidades e incorporando o valor zero na extremidade não te não
rejeita a hipótese de que o parâmetro é estatisticamente igual a zero uma lambança que acontece a gente realmente uma variável relevante modelo acaba sendo enviesado inconsistentes a variável for relacionado com algum regressou adicionalmente o resíduo do modelo é a variância do novo resíduo do modelo acaba sendo maior em função dessa variabilidade que está incorporando dentro do da doença aleatório E aí por consequência a variância do estimado também vai ser maior o que aumenta os intervalos de confiança e pode até ser que o parâmetro que a gente tava analisando serviço assim ficar bem significativo Mas agora
ele não vai ser que a variância dele aumentou E aí cor 10 isso acaba concluindo que o coeficiente é não significativo quando na verdade ele poderia ter sido o que é a O Nosso Erro chamado que eu tipo um a gente acaba rejeitando uma hipótese é ético dois gente acaba aceitando a hipótese que na verdade é falsa né seria o as do Beta 0 do pé de algum mestre ficou parado no modelos estatisticamente diferente de zero e aí a gente acaba aceitando essa hipótese porque avaliando sua mãe entrou em função dessa pessoa missão de variável
então a gente acaba aumentando também a frequência do tipo 2 na nossa nossa modelagem né E por consequência né o final aí ele não vai ser confiável não vai ser confiar porque ele vai ser engraçado inconsistente E também porque ele vai ter uma variância mal estimado e vai ser em preciso por conta disso então é muito importante na hora que a gente vai fazer a modelagem perto no dos dados em saber quais são os fatos variáveis que mais é que são ali Teoricamente Oi Rê sustentados pela abordagem teórica e vamos ver se ele é formulado
na teoria relevante Não É aconselhável a gente simplesmente excluir uma variável do modelo por algum fator qualquer isso pode isso acontece mais começa Presidente mais lindos por exemplo tem uma equação que tá é incorporada com base teórica daí a gente faz a estimativa com base em um conjunto de dados e que acaba verificando que os dados são as variáveis foram estatisticamente significativas aí a gente vai com essa tirada e ali Escolhe um escolheu isso não procedimento considerado muito correto né duas correntes e técnicas para isso como as textuais que basicamente escolhe a Google a formatação
do modelo em função da significância das variadas Teoricamente isso não é não é correto de se fazer por fungo por causa dessa opção que acabei de citar que função de uma variável que é relevante a poderia O que significa cheiro da modelagem mas aí tirar a variável do modelo causa um problema muito maior Porque deixa lá é mesmo que não seja estatisticamente significativos e E no caso da inclusão de variável irrelevante o que a gente tem né a gente tem um modelo verdadeiro aqui no caso modelo ele tem a variável x 2 e tem um
modelo é com a inclusão da variável x 3 o modelo verdadeiro ele não contém para a variável x 3 e o modelo novo ele acaba especificando trabalhava X3 por exemplo de vai lá e incorporam a variável que está testando se me cansa a gente não tem uma base sólida Teoricamente vai sério além do modelo lá bom mais que suas consequências esse ar primeiro os estimadores eles nesse caso não são tendenciosos e não são inconsistentes vocês são nossos clientes continuam com assistências por quê que isso acontece quando a gente tem uma variável que a nossa significativa
no modelo que não é Teoricamente que relevante o Emulator basicamente ele é um resultado de todas as variáveis que não são teu ar eu levanto Eu tenho um efeito muito pequeno sobre a variado isso a equipa incorporada dentro desse esse erro aleatório então a gente espera que o conjunto dessas variáveis tem uma média é um efeito zero né é uma das preposições do modelo que o erro aleatório seja seja ser quando a gente tem um modelo corretamente especificado e a gente pega uma variável ali na sorte ou então está com intuição vai pega e coloca
alguns modelos se elas fato é irrelevante ela faz parte desse conjunto de variáveis é que por preço posição a gente a Sony que tem uma influência muito pequena sobre isso então que se ela tem uma influência muito pequena sobre isso espero que foi inclusão de alguma coisa que não tem influência alguma não vai causar uma mudança é uma mudança precisa dentro do modelo né seu modelo e já era não tendencioso e consistente antes a inclusão daquela variável no causa de um problema ela era simplesmente um fator adicional quanto incorporando nele do modelo é a variância
do erro e sentinela acaba também se não é é estimada corretamente porque a gente supõe o termo dinheiro ele seja composto da variância de todas essas variáveis que a gente não consegue controlar diretamente o que elas têm um efeito muito pequeno e que são independentes a vida isso para que ela seja Independência é então tirar uma coisa muito pequena doente para colocar no da refeição não vai aceitar antigamente também a estimativa da variância então por isso que a variância do erro acaba também sendo estimada de uma forma é correta e o Por isso os intervalos
confiança também são válidos Porque como a gente não tem mudança drástica na variância a gente também não vai ter mudança drástica na Aliança dos estimadores Então você tem vários confiança também não vou ter nenhuma mudança substancial porém tava Aliança do estimador ela pode ser um pouco mais alto é por um motivo quando a gente pega uma variável do resíduo coloca dentro do modelo Pode ser que a inclusão dessa variável acabe causando é um problema ou não problema Essa é a causando um Pedral né Que feio de multicolinearidade dentro do modelo pode ser uma questão puramente
aleatória mesmo sabe você coloca duas variáveis faz um coeficiente de correlação entre elas e você verifica aqui elas apresentam ali aparelho tem um grau de correlação não estará mente a causação é simplesmente uma correlação que acontece por pode ser perguntador pela me criatório inclusive é então quando a gente espera uma variável dentro do modelo a gente está incorrendo na probabilidade dessas variáveis incluídas dentro modelo apresentar o relação com algum realizou que já tava lá então o fato de haver correlação entre os agressores é faz a aconteceu que a gente chama de ir problemas de multicolinearidade
né a multipolaridade é muito sério quando a correlação entre as regras coisa é muito alto nesse caso mesmo sendo Marcos mesmo sendo baixo é a inclusão desse regressor ele vai acabar C é o fator de fracionamento da variância do estimador Então por mais que o signo né que o Sigma 2 aqui ele Seja Constante não se altere com a inclusão dessa variável dentro do modelo é quando eu coloco a variável que aí relevante dentro da equação a fórmula sai dessa primeira formatação para essa segunda formatação que tá aqui e aqui a gente tem um componente
que é o R2 a quadrado que na verdade é o coeficiente de determinação da regressão da variável x 2 contra a variável x 3 e como isso aqui é maior do que um a gente vai ter uma diminuição desce denominador e o momento aqui da variância do Alfa 2 Então como consequência a inclusão de uma variável e relevante pode aumentar um pouco a variância do estimador em produção da inclusão de um termo que Possivelmente vai causar no disponibilidade do modelo e uma das consequências da multicolorido como vocês viram é o aumento da variância do estimados
mas como a gente também viu que a multifuncionalidade não é um problema muito grave desde que a gente consiga fazer inferências a continua se conseguir fazer inferência sobre os nossos parâmetros né ele não vai não vai apertar ali a inclusão da dos Testes de hipótese a inclusão nessa variável por mais que pensa Esse aspecto aí de aumentar a multifuncionalidade do modelo pode também não ser um fator que me chame tanto a atenção assim então resumindo entre os dois problemas nem inclusão de variável e relevante e omissão de variável relevante a gente ficaria com certeza com
a opção de incluir um regressor que não é tão relevante assim porque o problema é que ele causa na nos queimadores e na estimativa na água escorrer todo é muito pequeno frente ao problema de omissão de um fator que é muito relevante pela Theory a Embasa que lá pela NASA mostra o E aí a Avon bom e duas vertentes aí de busca da ajuste de maneiro né primeira garimpagem de dados e a segunda é a teoria pura a garimpagem de dados é basicamente a escolha de modelos seguindo critérios estatísticos para se fazer com as escolhas
por exemplo teste e o PSF desde do opção outros critérios quaisquer e até o dia puro seria a se basear na estrutura Econômica simplesmente só por causa das variáveis que são ditas Ali pela teoria qual que a gente deve escolher não existe essa dicotomia na verdade que a gente tem é uma teoria que normalmente é muito abrangente não nos diz exatamente Quais são as variáveis que devem ser de fato ali especificados prazer quando se fala em capital humano não tá falando qualquer medida do capital humano não tá falando sério se a média dos anos de
estudo não tá falando seu percentual de pessoas com ensino superior a bença taxa de analfabetismo muito fala Exatamente isso né E quando se a gente tem a esse conjunto de dados a gente também não pode sair pegando variável puramente ali a sorte em agosto e insere no modelo escolher naquelas que são estatisticamente significativas então que tem a gente faz a gente utiliza o melhor da agilidade e o melhor da teoria pura qual seria o melhor da teoria pura seria escolher a dimensão dos fatores dimensão das variáveis com base nos modelos teóricos e já são pré-estabelecidos
pela literatura e qual seja a garimpagem de dados na sua Plenitude seria a gente dentro da dimensão escolher as melhores próteses para representar a dimensão que foi nada pela teoria subjacente não Por exemplo quando se fala de capital humano se a literatura não fala mais nada a gente poderia pegar umas três próteses de capital humano e testar dentro da modelagem para saber qual que é qual proxy que melhor se enquadra dentre não o piercing então no caso estar utilizando aí essas duas vertentes a teoria do sentido de escolher as dimensões das variáveis e a garimpagem
no sentido de dentro de dentro dessa admissão como há uma oferta muito grande muitas vezes da dos tipos de variáveis ali a gente vai escolher aquelas que mais se saber com a dentro do que a gente espera do modelo com aumento então basicamente é escolher as variáveis é utilizando essas duas mesclagem sair né Então é na rodagem é para a prática primeiro a gente estuda a teoria Este estudo da literatura a gente entende ali Quais que são as dimensões que devem ser consideradas dentro modelo por exemplo Renda ele precisar o consumo aí por exemplo uma
variável de estoque da riqueza não variaram de rindo outra de Educação na enfim outra de a pessoa de gênero não sei alguma coisa nesse sentido EA partir disso a gente vai ver o rindo aqui tem que ter um melhor representa Oi gente vai lá na literatura empírica e começa a estudar os trabalhos olhos trabalho que utilizou a renda per capta aquele dali utilizou a renda média da família aquele ali utilizou as a média entre os cantinhos renda enfim a gente vai ter uma números variáveis para serem considerados a partir disso a gente vai escolher aquela
que mais se enquadra e coloca a variável esta ela veio gráfico ver se ela tem uma relação positiva ou negativa dentro do esperado uma variável explicativa coloca todas as variáveis bem como é que ela se comporta dentro do modelo E aí nesse sentido a gente pode explorar um pouco mais o que a gente chama de garimpagem de dados entre "para se chegar na melhor especificação economia mesma coisa com o outro tipo de Missão por exemplo educação ou estoque de riqueza né então teoria pura e garimpa Easy das nenhuma coisa nem outra no extrema As duas
são abordagens é o ar esqui na abordagem implica né na parte Épica de econometria elas devem ser consideradas conjuntamente para se poder ter a especificação correta e esperava do mundo um e daí a gente tem também a análise do exame dos resíduos normalmente o exame dos resíduos ele é importante que quando a gente tem lição devagar mais relevante é problemas de trânsito da cidade ou problemas de aula com relação ao que é todo tipo de mais situação novamente o resíduo de apresenta aquele comportamento então a gente espera que se abordagem Nossa tá bem especificadas o
modelo também colocar os resíduos vão seguir as características de erros bem comportado contém em média 100 variância constante vão ser Independentes medicamentos distribuídos e a gente vai ver um resíduo que se se apresenta de maneira gráfica como um ruído né uma coisa que não tem um padrão pré-definido que não vai encontrar padrões subir de descida é a expressão que se concentra em determinados valores de x e no outro lado da outra da outra ponta do gráfico nos entretanto bom então vezes eles têm que ser um Encantada para mim chegar a pouco e aí quando a
gente faz análise gráfica dos resíduos o próprio eles Contra o Tempo pronto eles contra a variável Y estimado o contrário é o regressou ou até contra ele mesmo defasado a gente vai conseguir verificar se o resíduo tens comportamento puramente aleatório ou se não tem esse tiver um comportamento mais ou menos ro idoso a gente não consegue prever né comportamento do Recife então é bem provável que o modelo esteja corretamente especificados seguindo que vocês partiram daquela abordagem teórica primeiro isso agora caso ele apresente algum problema pode ser um problema de uma teórica com mais especificação do
modelo ou quase sempre problema de ordem Pires ou por exemplo éteres da cidade o autocorrelação desçam é que são questões que acontecem frequentemente na abordagem aplicado o teste do Robson e ele também ele pode ser utilizado porque autocorrelação E se ela pode ser uma medida demais especificação do modelo Por exemplo quando a gente tem uma variável isso nessa variável Y ela tem uma corrente apresenta um processo de nessa um processo de correlação com as suas vagens e a gente não especifica esse tipo de comportamento os resíduos é vão suprir a tela ausência desse tipo de
comportamento do modelo então eles vão apresentar esse tipo de autocorrelação mas aí a gente vai fazer o teste da blosson e vai verificar que eu reservo tem alguma relação só que na verdade não é um problema puro de autocorrelação mas sim um problema demais especificação porque se eu encorporar aquele componente defasado dentro da estrutura do modelo o resíduo passa a se comportar de uma forma puramente aleatória então não se trataria de se caso nesse exemplo de um problema de autocorrelação pura mas sim o problema de autocorrelação por uma mais especificação do nosso modelo econométrico então
muitas vezes o teste w ele também já dá aquela que ele difícil né Tipo eu mandei postar não é quase não está corretamente é especificado bom o teste reset ele também ela ilustrar na temperatura meter algum próximo procedimento que é mais ou menos padrão né então qual que é o qualquer a mecânica do peste reset que não exemplo a gente tem uma função de custo primeiro a gente estilo modelo que a gente deseja por exemplo aí o y em função de x 2 depois disso a gente obtém o nosso Y estimado Esse é a combinação
linear Du nosso modelo né de no caso do nosso x 2 é a nossa função de regressão amostral né os pontos dela é e depois disso a gente faz uma nova regressão de Y com outra e incorporando dentro do modelo o y é estimado o quadrado e o y estimado na sua versão cúbica Qual que é o sentido de se fazer isso a a lógica do teste reset é verificar se existe alguma informação que tá dentro da especificação do nosso modelo que poderia ser adicionada dentro dentro da nossa equação então ele pega o y estimado
e na verdade representa todas as variáveis explicativas que estão inseridos dentro do modelo né já que é uma combinação linear desses fatores e ela era o quadrado e leva o corpo quando eu levo a quadrado essa variável só tenho mais mais de uma variável explicativa É como se eu tivesse me levando todas as variáveis tirar quadrado é e pegando também as combinações lineares todas entre elas ali X2 X3 X2 X4 x 2 confiscar e quando ela leva o Cuba também vou ter todas Vai avisar o cubo e uma combinação de fatores ali peças variadas Oi
poderia me representar alguma informação de em relação àquela sagradas que estão dentro dos modelos e eu acabei não e seguindo na equação principal então se eu faço essa regressão E essas variáveis ao quadrado e Ao Cubo acabam representando é alguma informação útil para dentro do modelo A lógica é que o R2 desse modelo vai aumentar em detrimento do primeiro modelo do modelo original que não tinha é o cômputo esses desses dois fatores então a lógica do teste reset é basicamente verificar por meio do teste F se a melhoria do R2 proveniente do acréscimo dessas variáveis
foi substancialmente é grande em relação ao R2 do modelo velho que é o modelo sem inclusão desses fatores para eu poder dizer óleo a inclusão desses variados realmente melhora o grau explicação do modelo né melhor o meu teste F isso quer dizer que existe a e os dados ali que ainda não foram considerados pode ser as variáveis ao quadrado pode ser variáveis Okubo alguma combinação linear alguma coisa nem sentir então a gente avalia-se o teste F é significativo ou não olhando aqui pelo teste F E xi olha aqui no numerador que o R2 novo ele
tá aqui como primeiro elemento R2 velho tá aqui como segundo elemento então quanto maior for R2 novo maior vai ser o nosso PSF tão csr2 novo substancialmente maior do que o R2 velho o teste F vai ser grande e vai indicar que o modelo novo que é esse modelo com a inclusão dos termos quadráticos públicos é superior ao modelo velho que não tem inclusão desses termos Então esse caso a equação a gente poderia incluir que o teste reset apresenta a rejeição da hipótese de que o modelo está corretamente especificado quer dizer que falta ali alguma
coisa dentro do modelo e usa as outras é questões aqui são número de novos agressores que no caso que são dois é inclusão desses esses dois outros temos aqui ele tem o tamanho da nossa amostra número de novos parâmetros no modelo novo é o que no caso aqui são são dois também meta 3 Beta 4 e aí a gente avalia-se o teste é significativo ou não frente a esse fechar esse esse contexto aí né ou se fosse um cativo encher gente modelo que eu mandei tá corretamente especificado bom o que que acontece o teste reset
ele é um teste baseado numa equação empírica ele não nos diz o que que acontece ali por que que eu modelo tá mal especificado e nos falou é por causa da inclusão dessa variável da outra variável e ele nem poderia ter essa tipo de pretensão porque a omissão de variável relevante só a cor corre quando a teoria nos diz que aquilo é de fato algo a ser considerado o mais por exemplo que Pet reset a ponte que há uma omissão de variável que a o momento a mal especificado alguma coisa nesse sentido a gente tem
que saber porque que aquilo aconteceu mas tem que ter um balizamento aí que um com lado até óleo de E aí o peixe reset mostrar que modelo tá mal ajustado e vai fazer o que ele não consegue fazer nada quem vai comer o quê dentro do modelo vai ficar sorteando ali variáveis elevando ao quadrado tirando para ver se até onde o teste nos mostrar que nosso aplicativo não isso não vai acontecer então o Ted reset muitas vezes ele pode ser utilizado em paralelo com a modelo Até outro e não se o único teste utilizado para
se escolher um número de variáveis ou enfim quais olharmos deve ser curadas dentro do modelo e o multiplicador de Lagrange ele tem uma ideia semelhantes né E se baseia numa composição de modelo restrito e modelo irrestrito no caso modelo restrito seria uma especificação que é mais simples e o modelo e restrita uma especificação que poderia incorporar os fatores né então aqui a gente tem duas funções ET tem aqui novamente a função de custo na qual y a variável custo x a variável de produção e a gente está supondo no modelo e irrestrito que a função
de posto é cúbico né então se o modelo em Suponha que esse modelo e Respeito foi o mais adequado o resíduo que compõem o modelo restrito ele vai ter alguma correlação com esses fatores quadráticas e cúbicas de X então a gente se baseia o teste do multiplicador de Lagrange no resíduo da equação do modelo restrito tão procedimento é basicamente o primeiro destino à regressão restrita que essa regressão mais simples por mínimos quadrados ordinários e e que obtêm as vezes depois a gente pega o resíduo e China esse resido um sal de x ao quadrado e
x Ao Cubo e depois a gente pega o R2 essa regressão bom e faz um teste qui quadrado nesse R2 se as variáveis eu entro puramente aleatório E essas variáveis X2 X3 não tiver dentro da variável termo de erro a gente espera que o R2 seja substancialmente baixo Espero que seja substancialmente em baixo isso R2 que eu conheço muito próximo de zero que quadrado também vai dar muito próximo de zero é que eu tenho uma multiplicação entre o tamanho da amostra e o R2 suas duas presente puseram-no quadrado de febre e a gente tem o
que quadrado não significativo então a base do teste aqui a base do nosso Pet é verificar se o R2 obtido nessa impressão é suficientemente grande a ponto de nos indicar que a variável X2 e X3 deveriam fazer parte do modelo tão ele tamanho da nossa mostra o R2 que ela reduz a regressão auxiliar que é isso R2 e o número é o chi cuadrado O que representa a nossa tática né que no caso que tem os números de inscrições que são os graus de liberdade nesse caso são duas reflexão duas expressões que a basicamente são
a inclusão do X2 X3 são as variáveis que está tentando testar por basicamente verifica se o teste aqui é significativo não faz o cálculo do qui-quadrado com pala na tabela se for maior do que o valor tabelado de rejeitar h0 que seria a hipótese um modelo tá bem especificado Ou seja que o meu distrito seu melhor se caso o teste for maior do que o valor tabelado a gente rejeitar h0 e no caso seria o modelo restrito não sendo mais adequado eu sei escreveria incorporar as outras variáveis dentro da estrutura do modelo econômico mas novamente
tem naquela ressalva de que a incorporação das variáveis x 2 ao quadrado x 2 ao cubo devem ter uma sustentação teórica para serem consideradas dentro do modelo tão espécie são complementares e o texto dor Então deve ser utilizados como medida crítica única para as escolher Quais as variáveis que devem ser incorporados dentro do modelo então ó é no capítulo 13 fala também respeito de erros de medida na variável y e na variável X primeiro a gente vai aqui é simular uma variável Y que tem o erro de medida e a gente vai ele ficar o
que acontece com a modelagem quando a gente tem esse tipo de problema primeiro né porque as variáveis tem erro de medir Pode ser que na hora do pesquisador de coletar a base de dados alguma coisa nesse sentido ele preenche errado a planilha ou então a pessoa que vai falar para ele lá o valor acaba errando o valor para o querendo ou não errando o valor ou então pode ser que ele tem aí entendido errado alguma coisa nesse sentido enfim erros esses dessa natureza acontece em qualquer pesquisa Porque não são robôs né São pessoas que estão
fazendo as pesquisas e eles têm a limitações nesse bom né dicionários tabulação você que pegou o dado certo mas na hora estabulados cabelo errado então a gente vai ver que que acontece na modelagem quando isso eles ocorre então primeiro a gente vai supor aqui ó um modelo Y o Beta 0 o Beta 1 x mais mas eu tenho Diego daí essa variável Y nosso aqui ó é uma variável que a gente não consegue mensurar diretamente ela tem algum erro de medida então a variável Y que seria a variável verdade a variável que a gente vai
adotar ela é igual a variável verdadeira é mais um aí que representa que nosso caso o erro de medida Então a nossa variável que é o y e ela vai ser uma combinação da variável verdadeira e desse dessa variável é aí que representa que o erro e o erro de medida que a gente vai fazer aqui bom aqui a gente tem o nosso Y estrela a gente pode refazer essa equação colocando Y Estrela do lado de lá então ficaria y e Estrela igual passando o erro lado de lá ficar ali Y menos um Y menos
aí Cola só variável Y estrela = y - o erro de medida e aqui agora eu tem a variável Y Estrela tem aqui também a variável Y estrela e aí eu vou substituir essa variável dentro da do modelo econômico e aí nosso modelo vai ficar o y aí Beta 0 o Beta 1 x 1 e esse termo que tá aqui ficaria para cá negativo a gente vai jogar de um mês lá para ele no lado positivo Então a gente tem que o e mais um nosso termo de erro de medida que é denominado aqui já
ir Então veja aqui na nossa nova especificação a gente tem um somatório de resíduos esse resíduo primeiro ue é o resíduo aleatório da regressão esse resíduo é ir é o é o erro ocasionado por causa na medida que invocaram da variável Y então reescrevendo aqui ó e vai apagar aí isso escrevendo a gente vai ter o y II o Beta 0 Beta 1 x y + twee sendo que o w i é a soma do Wii mais mais velho então o w Você viu o nosso erro composto primeiro quando a gente tem o w que
é o nosso erro composto a gente vai ter duas questões aqui que a gente tem que avaliar primeira questão é se o novo resido tem correlação com algum com a variável x dentro do modelo Porque se o resíduo novo tiver com relação com x modelo seria enviesado em consistente segundo a gente tem que entender que que acontece com a variância de w porque você vai alianças alterar isso vai afetar variâncias dos estimadores pode também causar mudanças na parte é diferente estatística do nosso modelo então primeiro a gente tem por preço posição o Sport preço o
corpo e o erro de medida ele tenha por exemplo média 01 e olha nossa constante ele seja independente identicamente distribuído e tem boas propriedades quando a gente coloca esse tipo de propriedade por a gente medida o que a gente está querendo dizer é que é que ele é um erro é que ocorre mais que não é sistemático pesquisador que era lá na hora de Natal dado é de y ele não fez aquilo dali de propósito ele fez com a questão gente de sorte né Para a gente aleatório então se ele não era sistematicamente ele vai
errar para cima às vezes ele vai errar para baixo às vezes e na média a gente pensa ocupante se ele seja igual a zero além disso a gente também pressupõe aqui o erro de medida ele não tenha correlação com ninguém ele seja independente o cara não tá errando porque ele tá olhando a renda dos indivíduos ele tá olhando o consumo do outro de vida está olhando as atributos ali ele tá levantando esse presente errou uma forma puramente aleatória Então faz sentido para a gente pensa Oi tio Ede medida tem essas características Então se eles têm
essas características a gente poderia escrever a variância do W como a soma E aí e da variância do uh mais a variância é se eles são independentes eu posso escrever a aliança de w como a soma da variância de u + a variância é a variância eo ela é dada por Sigma 2 Gil EA variância é é dado por cima dois dia então a variância do erro composto que é dado pelo W vai ser agora uma soma entre a variância de U que é o erro puramente aleatório e a variância é e é o nosso
ele de medida qual seria a consequência disso para modelagem futebol agora eu tenho um outro elemento aqui ó que é diferente de zero que tá fazendo a variância do erro aumentar se ela aliança doer aumenta como o tempo todo a variância ela ainda também dentro das estimativas da variância do estimador agora em suma dura também vai ser maior ou isso intervalo de confiança o maior e aí a gente pode incorrer no fato de o erro com está contido dentro daquele intervalo e a gente acabar não rejeitando a hipótese nula quando na verdade ela é falsa
né Por exemplo enche o Beta nosso vai ser diferente de zero é mas aí por causa do erro de medida intervalo fica muito grande e aí a gente acaba não rejeitando as hipóteses EA gente incorre no erro tipo 2 é quando que a aliança não vai ser afetado quando a variância do erro de medida foi igual a zero seja quando não houver variação é quando a gente medida não existe quando essa variável que simplesmente não estiver Alvorada dentro do modelo caso contrário o erro de medida afeta a estimativa da variância nossa e isso pode causar
problemas na está Valença chamado quando que isso vai causar problema quando esse limite aqui foi muito grande somados os dois aqui quando eu tiver uma proporção muito grande dentro da variância do eu compro a bom a segunda coisa que a gente tem que ver É se o erro é o composto novo Tem alguma relação com a variável x dentro do nosso modelo que se eles tiverem alguma correlação então o Beto estimado aqui ó ele tende a ser em vesado e inconsistente Então como que a gente poderia verificar isso analisando a covariância do w e com
a variável x 1 o variância de w com xixi se pode ser escrita por esperança de w - média de w o que multiplica x - média de 15 a esse aqui seria a a forma que a gente escreve a covariância entre os dois elementos bom primeiro não pegar esse w aqui ó para entender Qual que é a média desse lado se o resíduo tem média zero e o erro de medida também tem média zero então a esperança de w i que vai ser igual a esperança de ue mais a esperança de i.a. tem já
ser igual a zero que na média o resíduo Nossa repetição é zero e a gente por preço posição colocou que a média do erro também igual a zero então a esperança de w i automaticamente também vai ser igual a zero Então o que a gente faz aqui aonde tiver esperança de w e dentro dessa conotação a gente ele me no meu caso aqui seria esse elemento que tá aqui bom então reescrevendo tem que pode colocar a esperança de w i aí a gente vai fazer agora a multiplicação entre os termos vezes x y - o
w i vezes esperança de Chile beleza aí agora a gente tem esse elemento que tem esperança matemática de fora então a gente pode aplicar a esperança matemática dentro desse primeiro elemento que a gente pode aplicar a esperança matemática no segundo elemento no primeiro ficaria a esperança de w e vezes x y - o LX eh a média de x quando eu vou aplicar Esperança matemática numa média que é uma constante vezes uma variável a constante sai para fora e no caso a esperança XR E aí eu aplico a esperança matemática na nossa variável que seria
o da WWE é bom que eu teria é de x é de w i só que a gente viu que a esperança de w i é igual a zero porque a média dos erros é igual a zero fala que eu vou eliminar esse termo e vai sobrar somente esperança de wix3 bem o que a gente vai colocar separadamente aqui em cima a beleza aí agora que a gente vai fazer a gente tem que abrir w que dentro a gente viu que o nosso w Ele é igual ao erro puramente aleatório mais o erro de medida
que é dado pelo nosso aí estão substituindo-os aqui dentro desse modelo dentro dessa função a gente vai ter esperança de eu fui mais aí e multiplica x abrindo a gente vai ter ui vezes chips mais aí vezes x e aplicando Esperança matemática e a gente tem esperança de o yin vezes x e y mais a esperança de é é vezes vezes x Então tem que a gente tem basicamente aqui a covariância de Wii com xixi e a covariância de é interno Nossa Rede medida vezes o XVI como a gente por preço posição colocou que a
esperança é que a variável way é uma variável puramente aleatória independente é identificar no distribuído não tem correlação com ninguém então ela não vai ter correlação com um x então quando eu aplica Esperança matemática em duas variáveis que o independente Eu posso fazer a combinação da Esperança matemática nesse produto só ficaria a esperança de ue vezes a esperança de X do lado de cá eu tenho basicamente a mesma coisa eu tenho variado o erro de medida é aí essa variável também é independente ela não tem correlação com nenhum regressor a gente pressuposição né É E
aí a esperança matemática seria esperança de é isso vezes x então reescrevendo aqui a gente teria e a esperança de ue vezes a esperança DX WWE ver mais a esperança de i.a. vezes a esperança gente esperança de xizinho ó e aqui o que acontece eu tenho a média do erro que é zero e eu tenho a média do erro de medida e também a zero então a covariância aqui ó entre a o erro composto w e avaliado x ela é igual a zero O que que significa que o nosso parâmetro não é em vesado nós
paramos não é inconsistente porque não existe fogo aliança entre o elemento que representa o erro composto q w e e variável x que é a variável botar dentro do modelo então resumindo o erro de medida da variável Y ele causa um aumento da variância do modelo porque eu tô incorporando no erro composto uma outra variação é um outro elemento ali dentro e ele vai ser um problema é muito grande ou não a depender da avaliação desse anjo medido se o pesquisador e rádio mais por exemplo se aumenta a variabilidade ali do é ele vai aumentar
a variância doendo composto e isso vai aumentar variância dos mandou e pode causar problemas ali de interesses é agora o parâmetro ele continua sendo corretamente especificado ele continua sendo corretamente estimado né E vai ele não enviesado e ele é consistente porque não existe é desse novo e recomposto com a variável x estão Resumindo erros de medidas na variável dependente não causam viés e não causam inconsistências simplesmente a um aumento da variância do estimador que é proveniente dessa variância do erro é o erro de medida do pesquisado ou seja não há problema muito grave assim a
depender do tanto que o cara é né e é agora vamos supor aqui um erro de medida na variável X é bom aqui agora a gente vai supor um modelo econométrico dado por y a meta zero meta um chips e mais o termo de erro novamente we pressupõe que a variável x 1 ela é igual a x estrela mais um erro de medida que que no caso eu vou chamar ele de É nesse w aqui e eu vejo de o meu erro de medida então basicamente a variável Nossa é que a gente utiliza dentro da
modelagem ela é igual a verdadeira variável mais um erro de medida que aconteceu na pesquisa né então isolando aqui o nosso XVI a gente tem que X e Y No Impacto um pouco x estrela vai ser igual ao xi verdadeiro menos o menos o w então aqui eu vou pegar o Chile e vou substituir ele dentro Eu modelo aí eu voltei a y o Beta 0 Beta um que multiplica chips - wi1 mais Week ao termo dinheiro e abrindo aqui a função eu tenho Beta 1 o XY - Beta 1 w i mais o termo
de erro um agrupando os resíduos no meio composto que eu vou chamar de Z e eu tenho Y a meta zero Betão x mais avaliar os aí beleza então aqui basicamente O problema é a gente tem erro de medida na variável x o modelo econométrico nosso é y em função da variável x a gente tem betazera constante Betão um coeficiente angular e o erro winkelmann puramente aleatório é porém a variável verdadeiro a gente não consegue utilizar ela porque a um erro de medida Então a gente tem uma proxy essa coloca você denominada por chips que
basicamente é a soma entre a variável verdadeira e o erro de medida novamente a gente pressupõe e o erro de medida ele seja independente identicamente distribuído ou média zero e variância Sigma 2dw ou seja ele é um erro puramente aleatório é o pesquisador erra mas não é de uma maneira sistemática não é proposital ea Oi gente fez substitui o nosso modelo Para incorporar o erro de medida dentro do estimativa e depois no final a gente chega na formulação é como erro composto Z e esse é o Zé a soma do Nosso Erro puramente aleatório oo
de uma combinação aqui nós vamos multiplicação do Betão um que é o coeficiente da variável x do W que é o nosso erro de medindo Então primeiramente a gente tem que levar ele ficar nova novamente na questão da variância que que aconteceria com a variância com esse novo erro de medida né nosso novo residual Z eu usei ele é igual a okue mi - Beta 1 vezes windows8 de medida Essa é a variância dizer como os erros são é eles têm eles são independentes a variância dizer vai ser igual a variância de um mais a
variância de w então aqui eu tenho a variância de um mais a variância de Beta 1 vezes wisha11 ânsia de um vai ser Sigma 2 de 1 ó e aqui eu tenho a variância de uma constante vezes a variável quando a gente tem a variância de uma constante obesas avaliava O resultado é a constante ao quadrado vezes a variância da variável a variância de W No caso e vai chamar de cima dois de w Então por esse resultado aqui a gente também verifica e a variância do modelo ela vai ser afetada pelo concorrente que está
relacionado ao erro de medida quanto maior ou ele o de medida maior e o efeito que ele causa na variância do é composto e essa variância do erro composto em ver ela também causa consequências de aumento da variância da nossa do nosso Fator X né do nosso Nossa com variável X é quando que esse elemento vai ser zero né Quando que a gente vai causar nada primeiro quando o a variância fizeram aqui no caso quando não houver erro de medida né e segundo quando o Beta fogo praticamente igual a zero né é justamente igual a
zero aqui significa que a variável o que a gente tá estudando não tem uma relação Direta com y seja o modelo tá que bocado ali alguma coisa tá não não se saiu bem né o que no vácuo hoje modelos quando o dele tá corretamente especificado EA evidência na literatura de que a variável tem influência sobre isso aqui não vai acontecer espera que o Beto ou seja não é seja significativo E no caso de erro de medida Essa maneira você vai ser maior do que zero então a variância de x é afetada E aí a gente
também tem a efeitos sobre a variância do estimado bom é uma aliança acaba sendo afetada agora vamos ver o que que acontece com o com a questão do nosso eficiente se ele passa sem vesado inconsistente Você não tem nenhuma alteração ali bom gente vai colocar de novo aqui nossa variável Z que é igual algo I - meta um DW a gente fica nem colocou que a nossa variável x e y = x estrela mais o erro de Medina essas duas definições aqui vão ser importante daí a gente vai calcular a covariância da variável Z com
a nossa variável x y isso aqui pode ser obtido pouco Esperança quer dizer menos média dizer que multiplica por o XY - a média de chips Oi beleza tá bom o preço posição como usei aqui ele tá em função dos resíduos nem o teu erro de medida que o erro aleatório a média dizer vai ser igual a média de mais ou menos aqui a média de w como eles têm média zero então a esperança dizer e também vai ser igual a zero então aqui a gente vai em mim naquele elemento ali e aí a gente
já escreve esperança de zx6 zx7 X9 que a gente tem a z vezes x z vezes é de Chilli Edge X é uma média né então que a gente tem uma variável que multiplica um valor médio que é uma constante tô aplicando Esperança matemática aqui nos alimentos a gente vai ter esperança de dizem vezes x y - a constante sai para fora então a gente tem esperança gêmeo x esperança de Z em e a esperança Diz aí a gente viu que é zero Então esse elemento aqui a gente elimina acaba eliminando todo esse outro componente
aqui e aí a gente eu me tem aqui a esperança do Z vezes vezes o nosso x futebol agora pegando esse resultado aqui e colocando ensino E aí a esperança dizei vezes x a gente vai substituir usei e vai substituir também o XVI que está sendo colocado aqui então o nosso usei é igual a primeira função vai ser igual a ue - Beta 1 vezes w i e o nosso x = x estrela mais o nosso da Amil II E aí a gente Multiplica agora todos os elementos estão ficam a esperança de kuyt vezes x
estrela é mais Way vezes w i - Beta 1 w i vezes x estrela - o Beta 1xw e ao quadrado e esse w e ao quadrado Ah beleza então agora aqui ó eu tenho que aplicar Esperança matemática em cada elemento para ver o que que acontece né primeiro nesse elemento aqui eu tenho esperança de Win vezes x a gente sabe que o Wii ele é um termo de erro independente estão como as variáveis x e Estrela eo são independentes ao aplicar a esperança matemática na composição explicativa dos dois eu teria que a esperança de
um vezes a esperança de X como a média de 1 a 0 a esperança dessa multiplicação também ser igual a zero então aplicar Esperança matemática excelente que acaba sendo eliminado aqui eu tenho a combinação leva a covariância de do termo de erro com termo de erro w eles também são variáveis aleatórias e Independentes então ao aplicar Esperança matemática embaraçosa Independentes o resultado seria o Ézio vezes ué de w seria Med a média de w as duas médias são 03 os elementos aqui também seriam eliminados É nesse outro elemento aqui ó eu tenho uma constante que
é Beta um tem uma variável que é puramente aleatória e não com relacionada com ninguém é o nosso w e aqui é variável x estrela que veio aqui dessa dessa equação aqui da variável x né quando ela aplica Esperança Matemática A constante sai para fora aí eu teria a esperança matemática de w vezes x e y e novamente como W é independente eu ficaria aqui com a esperança de w vezes a esperança de x e esse elemento novamente seria cortado por causa da esperança de dava é igual a zero e aí só me sobrou aqui
no caso e a esperança de menos meta um vezes w ao quadrado esse negativo eu posso tirar ele para fora aqui eu ficaria se aqui o que que eu tenho eu tenho uma constante vezes uma variável que tá elevado ao quadrado tá constante ela sai para fora aqui dessa dessa função né então ficaria aqui ó - Beta 1 vezes a esperança ge w i ao quadrado só que por preço posição a esperança de w e ao quadrado é igual a variância de w i foi definido anteriormente consegui uma 2dw Lembrando que a fórmula da variância
né variância de w ela é igual a esperança de w i - é TW I ao quadrado em média zero então a variância de w i é exatamente esperança de w e o quadrado que é o arquinho que é o que está aqui então é substituindo ali por cima dois aqui eu teria menos Beta 1 x Sigma 2 x Sigma do ajudado Então logo e eu tenho que a covariância entre o erro composto usei o x = - Beta 1 x Sigma 2dw isso aqui não é diferente de zero só que não é diferente de
zero eu tenho um beta um que é um objeto associado ao x Não espere que seja estatisticamente significativo porque ele está incluído lá e o modelo na rua está bem ajustado é você tem aqui o Sigma 2 w que é uma variável que compõem o modelo é puramente aleatória ela varia isso aqui também diferente de zero Então burro característica erros de medida na variável x causam viés e inconsistência né então o estimador estimador Beta 1 é é enviesado é um consistente na enviesado inconsistente por quê Porque a covariância do erro composto Z com a variável
x não é igual a zero ela é um valor diferente de zero e isso causa problema na prática O que que significa você pode errar na variável Y mas você pode errar na variável Y mas não é muito recomendado você errar na variável x porque se você errar na variável x que trabalhar no está tentando mensurar Você vai incorrer em problema de viés em consciência do chamado mesmo que esse erro seja puramente aleatória ou seja não é já não sistemático Tá tô aqui consegue mostrar o que que acontece com os fumadores podem a gente tem
esse tipo de problema é que frequentemente a gente verifica aí quando vai mexer com o banco de dados ele vai trabalhar com o presente dados do IBGE um bocado tipo de dados i e Suponho que os dados estejam sido é tenham sido corretamente coletados etc a gente sabe que a Elsa então tem limitações banco de dados têm limitações e não tem como muito Superar as limitações porque é o melhor que a gente tem e dá um toda a cautela necessária quando a gente trabalha com econometria Porque qualquer deslize que tem relação à construção das variáveis
pode causar viessem consistência que pode ser grande ou não vai ser grande ou não a depender da estimativa do Beto a dependendo do tamanho do emulador medida quanto maior foi o erro de medida o maior covariância aqui maior vai ser o efeito sobre a sobre o estimador pior vai ser o problema no caso lá então são um detalhes que a gente tem que a gente considerada então resumindo aí né erro de medida em Y estas posições afeta a variância do estimador por causa da variância de composto ele de medida em x causa um viés em
consistência porque a gente acaba e o variance diferente de zero e para a causa o problema de viesse de consistência modelos alinhados e não alinhados também podem ler lá no capítulo é basicamente a mesma ideia de teste tchau né quando a gente tem um modelo que tem que é uma particularidade de outro e quer saber se o modelo mais mais especificado é melhor né do que o modelo é menorzinho né pra gente faz aí os testes algumas abordagens é esse povo aqui é importante almoçar e disse ao pouco ele né A questão da abordagem discriminatória
normalmente iguais viu a gente fez o teste gente viu o teste de reset ou do multiplicador de Lagrange tudo mas a maioria dos casos quando a gente vai fazer escolha de modelos a escolha de variados e centro a gente normalmente isso que temos de informação pela simplicidade pela aplicabilidade que eles têm pode tenho que serve a cair até Two as seu critério de Hannah que em tem uma reduzida ajustado Então são critérios que o app verificam lado e se tem como base a que que acontece com o modelo dentro de ajustamento quando a uma inclusão
de uma variável no modelo E aí ele verifica se essa inclusão dessas variáveis Melhorou a explicação do modelo comentou no caso que tende a cair kit churrasco eles tem uma restrição eles esconderam o acréscimo de novos agressores assim como o R2 ajustado entre eles aqui obstrui enche o Asus ele é mais rigoroso no sentido de que para uma variável mostrar que ela realmente é importante para o modelo ela tem que mostrar um desempenho melhor do que a teria que mostrar no caso do que tá já cair Então nesse caso o teste quase é mais criterioso
de sentido R2 é um critério conhecido né e intermediário e sentir tão é no caso e o R2 que eu não fiquei sem determinação ele mede lá nossa qualidade do ajustamento do modelo Então sempre que eu acrescento uma variável no modelo basicamente que eu tô fazendo a tirando uma variação do resíduo e colocando dentro da soma de quadrados explicado então se aquela variação o mínimo que seja eh afeta ali a soma de quadrados resíduos ao impor parar ela dentro da soma de quadrados pecados e seria basicamente o pegar uma variável como seria a lei do
modelo vai dois ele vai sempre aumentar então ele é uma medida não decrescente com acréscimo de variáveis ou seja ele pode não aumentar mais diminuir ele não vai então sempre que aumentar o número de variáveis atendesse ele tem uma mostrar uma justamente melhor isso faz com que algumas pessoas pensem que dá não vai incluir então todas as variáveis possíveis para tentar maximizar o R2 bom vale a gente está aqui o R2 ele não é uma preposição do modelo econômico Você pode ter um modelo bem especificado com a rede o debaixo Valdete 115 por cento né
que você não vai gostar muito baixo objetivo da análise Econômica não é maximização de R2 né a gente tem que gastar os dois objetivos O primeiro é conhecer as causalidades E isso se dá pela análise dos betas e o segundo é se fazer previsão aí no caso de previsão ter uma de dois na maior é interessante porque você tem uma linha de Redenção mais ajustado os seus dados você consegue gerar previsões melhores ali da variável y e é isso que isso é muito pouco de fazer para sair cebolas que no momento gente tenta ajustar o
modelo das fases a previsão fora da mostra a gente tem que ter um modelo mais ou menos ajustar agora minha nasce o processo Chan não tem é muito não tenho motivo para mim ficar maximizando né buscando as coisas não que na análise deve ser coragem tem mas muito lindos ainda na análise processo né então Gerais que tem o modelo corretamente classificados seguindo a base teórica que o que abençoou aquela equação agora o R2 ajustado ele tem um efeito compensativo sempre que eu acrescento novos emissores ele Pondera o aumento da explicação Mas ele também Pondera a
perda de grau de liberdade que uma regressão adicional no modelo vai causar então não trouxe a forma aqui mas se vocês verificarem a forma do R2 vocês vão ver lá que no cálculo né que ele pega pela soma dos quadrados dos resíduos ele vai comportar dentro do R2 o acréscimo de novos agressores estão sempre que eu colocar uma pessoa no modelo e sem graça ou tem dois efeitos um é aumentar o grau explicação do modelo o osso é prejudicar o modelo pelo acréscimo dos do regresso foi o aumento dos graus de liberdade diminuição dos graus
de liberdade então ele faz uma ponderação ali e mostra ó e se relacione aumentou mais a explicação do modelo do que penalizou modelo pelo pela diminuição dos graus de liberdade então é uma decisão que deve ser considerada a mais ou menos essa análise do R2 ajustado E aí o dinheiro já caí que os que tem ali churrasco ou clipada Caique ele é uma medida mais acessível e penaliza mais o acréscimo de reversores é ao contrário do R2 daí dos ajustado que a gente tenta fazer a maximização entre ácidos o critério já caí assim como que
impede que o as tem que ser minimizado com a gente escolhe o modelo que apresenta o menor P derj informação de Caíque assim com o menor critério de informação e churrasco e o trecho acima não semelhante ou ele pede a Caíque Só que ainda mais esse tive porque é penalizar ainda mais o acréscimo de novos agressores Entre todos os critérios qual que a gente deve escolher não existe uma em firmar a regra para ir para Isso é óbvio que tem que usar esses critérios de Formação em concomitância com a teoria que a gente está utilizando
para embasar o nosso modelo normalmente a gente utiliza mais que pede informação quando a gente vai fazer estudos de séries temporais não existe uma teoria subjacente que Embasa ali a escolha do número de passagens então por exemplo a gente vai estudar inflação mas a gente no caso do Brasil e pode ter uma inflação Inicial está correlacionada com o período T - 1TB - 2tb - 3D - é seis então gente não sabe exatamente até onde vai a correlação da variável contemporânea com as suas mensagens nesse caso a gente faz o que a gente vai ser
indo esses defasagens dentro do modelo e vai analisando esses critérios de informação até onde a inclusão desses novos agressores consegui Minimizar os critérios eu vou eu vou fazer a partir do momento que não tem mais amenizar suas que tênis eu paro ali na expressão desses as variáveis que são defasados né e entre o que esteja Caíque churrasco pode ser que eu tenho um modelo de acaí que me mostre mais variáveis que devam ser consideradas enquanto os quase mostra menos variados aí vai o critério da dar para Simone da um simples sim um modelo como quiser
já caí que apareceu maior possibilidade analítica a gente vai escolher o que poderia até já caí agora se uma de lixo Ásia cai tem a mesma conclusão é a mesma conclusão empírica levantou as mesmas questões gente sempre escolhe o modelo que tem menos variados Nesse sentido porque por causa da questão da parcimônia quanto mais variável foi no modelo menores graus de liberdade mais efeito ou tem na inferência estatística e preocupar cerimônia entre o modelo muito grande o modelo é não tão grande assim sendo que os dois me dão resultados semelhantes em termos analíticos eu sempre
escolha um modelo que tem menos variáveis decente tá e não é o Capítulo e termina aí com essa esses questionamentos aí né Com essas questões e Prata um pouco sobre o último dia né e é um pouco cômico aí sobre como os pesquisadores da economia que trabalha pelo mestre aplicada deve seguir com abordagem então primeiro aí que usar Asus senso comum a teoria Econômica não se não vai explorar coisas que não está descrito na teoria Econômica não sei que você esteja inventando uma nova Teoria com nome coisa que é muito difícil né Pois é muito
difícil então a gente sempre se apega ali outro modelo teórico tá falando essa terça correspondência no modelo INPI e se deve fazer as perguntas certas delas tem que sempre focar que o modelo estatístico ele é uma ferramenta narrativa ele mostra é determinar os caminhos de análise que a gente deve seguir mas aí a gente sempre tem que ter em mente que é entre o modelo que está muito matematizado um modelo que tá mas Oi gente vai pelo modelo que tenha a leitura Então ela tem uma uma ilustração mais simples né muitas vezes as pessoas colocam
essa elegância matemática entre as à frente dessa relevância e acaba ali fazendo uma redação de de equações sempre não tem muitas substâncias assim como o galho pesquisa implica tem que ter um foco é uma pesquisa tem uma resposta que a gente busca através de uma hipótese que a gente gera e tem que ter esse foco sempre de caminhar a nossa análise empírica para a hipótese fingir levantou dentro do trabalho não ficar simplesmente marretando equações inequações buscando de uma elegância matemática sem uma fundamentação Então a gente tem que conhecer também o contexto a gente não pode
sair aplicando análises estatísticas sem o conhecimento senão modelo fica acima de tudo sem pé nem cabeça né e "aí seria um modelo escuro pixar é a gente tem que examinar os dados e esse é um fator muito importante pegar os dados com calma analisar os dados com cuidados calcular e a variância é vez estatísticas descritivas analisar os gráficos e se não tem nenhum problema em relação à questão os gráficos dos dados sensíveis não tem out Lines vê se eu tô tá completo essa parte de namorar os dados é muito importante na lados plenamente não adotar
as com a complexidade você tem uma maneira de simples de dizer o que você quer fazer utilize Essa maneira ou bege e cada no voltas e Voltas utilizando é formas de comunicação às vezes desnecessariamente é rebuscados né você também tem que examinar aí com Rigor os resultados nesse sentido tem que chamar o modelo olhar que coisa resultados estão querendo dizer vem com calma verificar se realmente está condizente com a história que o trabalho quer contar nesse enfim pensa essa ligação com a parte teórica é OK da procedimento se não convém rever os resultados reservo abaixo
dados que veio Neto e entre a pegar a base de dados shimao modelo no computador é muito simples é só botar quente aperta e já tinha tudo agora parte de deixar o trabalho totalmente ajustável e rigoroso frente às exigências da comunidade acadêmica é o que a gente mais gasta tem mais graça tempo né tanto Estar atento também aos curso do datamine o data mining essa escolha de variáveis porque Perez puramente estatísticos ao invés utilizar uma teoria que Embasa aquelas variáveis que estão que tem que ter parcimônia com isso não tem que tá disposto a conciliar
porque me sentindo aqui eu volto quiser aqui nos manuais muitas vezes ele dá lá o modelo perfeito né ela tem que fazer isso em fazer aquilo é assim tá certo mas muitas vezes a realidade empírica não nos permite chegar nessa modelagem perfeita pra gente tem que fazer um mais é outra pesquisa mais rigorosa possível dentro da questão de estar no na fronteira ali do conhecimento e reconhecendo que o trabalho têm limitações e que não é possível chegar no modelo perfeito é não confundir a seguinte cansa consubstancia significância estatística é simplesmente fato de duas variáveis teve
correlação e substância ao fato delas terem causalidade a causalidade não é igual a correlação com relação você pode pegar duas grandezas ali faz um juiz uma correlação de piercing por exemplo qualquer outro indicador lá e aí ontem fez maravilhas são é o relacionado pode acontecer com duas agradecer são puramente aleatórias presentes que são randômicos né que são conhecidos agora a substância não a gente fala substância está querendo dizer que x causa Y assistir Se alterar Y automaticamente vai só terá que existe uma lei existe uma força e dessas grandezas que estabelecem as relações e na
presença de questões que são delicados aí para vocês têm que incorporar isso dentro do modelo você sabe o seu trabalho têm limitações e Recompensas limitações do modelo não o que você se desse para as críticas E ser honesto aí com a sua própria abordagem
Copyright © 2024. Made with ♥ in London by YTScribe.com