Questões de Estatística - Componentes principais para Concurso

Foram encontradas 35 questões

Q537294 Estatística

Com o objetivo de estudar as relações entre características de uma carteira de clientes (salário em R$, saldo médio da conta corrente em R$, tempo de conta aberta no banco em anos e idade do correntista), um analista conduziu uma análise multivariada (análise de componentes principais e análise de agrupamento) e obteve os resultados abaixo, gerados por um software de análise estatística.


matriz de correlação:

                        sdmed           salário          tempo               idade

sdmed     1,00000000   0,93303483   0,6038786   -0,01126878

salário     0,93303483   1,00000000   0,5845924     0,06371626

tempo     0,60387857    0,58459235   1,0000000    0,49093437

idade     -0,01126878    0,06371626   0,4909344    1,00000000


sumário dos componentes principais:


                           comp. 1   comp.  2     comp.   3     comp.   4

desvio

padrão            1,576085 1,0866016 0,52563869 0,24281048

proporção da

variância         0,621011 0,2951758 0,06907401 0,01473923

proporção

acumulada        0,621011 0,9161868 0,98526077 1,00000000


componentes principais:

                    comp.1    comp.2    comp.3    comp.4

sdmed         0,582         0,322       0,145       0,733

salário         0,584         0,271       0,390      -0,659

tempo         0,532        -0,338      -0,767      -0,122

idade          0,196        -0,842        0,488       0,117



A partir das informações e das figuras apresentadas, julgue o item a seguir.
O segundo componente principal representa o antagonismo entre saldo e salário versus tempo e idade.
Alternativas
Q537292 Estatística

Com o objetivo de estudar as relações entre características de uma carteira de clientes (salário em R$, saldo médio da conta corrente em R$, tempo de conta aberta no banco em anos e idade do correntista), um analista conduziu uma análise multivariada (análise de componentes principais e análise de agrupamento) e obteve os resultados abaixo, gerados por um software de análise estatística.


matriz de correlação:

                        sdmed           salário          tempo               idade

sdmed     1,00000000   0,93303483   0,6038786   -0,01126878

salário     0,93303483   1,00000000   0,5845924     0,06371626

tempo     0,60387857    0,58459235   1,0000000    0,49093437

idade     -0,01126878    0,06371626   0,4909344    1,00000000


sumário dos componentes principais:


                           comp. 1   comp.  2     comp.   3     comp.   4

desvio

padrão            1,576085 1,0866016 0,52563869 0,24281048

proporção da

variância         0,621011 0,2951758 0,06907401 0,01473923

proporção

acumulada        0,621011 0,9161868 0,98526077 1,00000000


componentes principais:

                    comp.1    comp.2    comp.3    comp.4

sdmed         0,582         0,322       0,145       0,733

salário         0,584         0,271       0,390      -0,659

tempo         0,532        -0,338      -0,767      -0,122

idade          0,196        -0,842        0,488       0,117



A partir das informações e das figuras apresentadas, julgue o item a seguir.
No dendograma, nota-se que idade e tempo foram as variáveis mais relevantes. Porém, saldo médio e salário foram mais relevantes na análise de componentes principais. Isso enfatiza que os propósitos das análises são diferentes, conduzindo a conclusões diferentes.
Alternativas
Ano: 2015 Banca: FCC Órgão: CNMP Prova: FCC - 2015 - CNMP - Analista do CNMP - Estatística |
Q481337 Estatística
Considere as seguintes afirmações:

I. Na análise de componentes principais, quando a distribuição de probabilidade do vetor em estudo é normal multivariada, as componentes principais além de não correlacionadas são também independentes e têm distribuição normal.

II.imagem-026.jpg é a matriz de covariâncias do vetor aleatório X de dimensão (2X1), então a matriz de correlações de X é P = imagem-027.jpg

III. Na análise fatorial, quando a suposição de ortogonalidade dos fatores não puder ser considerada, pode-se utilizar o recurso da transformação ortogonal dos fatores originais na tentativa de se obter uma estrutura mais simples de ser interpretada.

IV. A análise de agrupamentos trabalha com medidas de similaridade e dissimilaridade, não comportando por isso o uso de variáveis qualitativas.

Está correto o que se afirma APENAS em
Alternativas
Q457299 Estatística
Sobre análise multivariada, considere:

I. Na análise fatorial nenhuma variável é definida como dependente ou independente.

II. Na análise de agrupamentos deve haver bastante homogeneidade interna (dentro do agrupamento) em cada um dos agrupamentos resultantes.

III. Na análise de correlação canônica o princípio subjacente é desenvolver uma combinação linear de cada conjunto de variáveis dependentes e independentes para minimizar a correlação entre esses dois conjuntos.

IV. O escalamento multidimensional é uma técnica multivariada apropriada para representar n elementos em um espaço dimensional menor que o original, levando em consideração a similaridade que os elementos têm entre si.

Está correto o que consta APENAS em
Alternativas
Q443964 Estatística
A análise dos componentes principais é um método de se expressarem os dados multivariados. Ela permite que o pesquisador reoriente os dados para que algumas poucas primeiras dimensões expliquem tantas informações quanto possível. A análise de componentes principais é também útil na identificação e compreensão dos padrões de associação entre as variáveis. Considere as cinco afirmações seguintes, sobre a análise dos componentes principais:

I. O primeiro componente principal, Z1 é dado pela combinação linear das variáveis originais X = [ X1 X2, ..., Xp] com maior variância possível.

II. Todos os componentes principais subsequentes são escolhidos para que não sejam correlacionados a todos os componentes principais anteriores.

III. Em razão de a análise de componentes principais buscar maximizar a variância, ela pode ser altamente sensível às diferenças de escala entre variáveis. Assim, é uma boa ideia padronizar os dados e representá-los por Xs.

IV. A solução para o problema dos componentes principais é obtida realizando-se uma decomposição de autovalor da matriz de correlação. Cada autovetor, indicado por Ui, representa a direção de um desses eixos principais. O vetor u controla os pesos usados para formar a combinação linear de Xs, que resulta em zi= Xs.Ui.

VI. No caso mais geral, só faz sentido utilizar a análise dos componentes principais quando os dados não são independentes. Barlett fornece um teste de qui- quadrado para determinar a esfericidade dos dados, 2 representado por X 2 = - [ n - 1 + (2p + 6)/5]ln | R|, com 2 (p2 - p)/2 graus de liberdade, onde p é o número de variáveis, n é o tamanho da amostra, e R é a matriz de correlação.

Dentre as seis afirmações dadas, quantas são falsas?
Alternativas
Respostas
16: C
17: E
18: E
19: E
20: C