<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>0870-8231</journal-id>
<journal-title><![CDATA[Análise Psicológica]]></journal-title>
<abbrev-journal-title><![CDATA[Aná. Psicológica]]></abbrev-journal-title>
<issn>0870-8231</issn>
<publisher>
<publisher-name><![CDATA[ISPA-Instituto Universitário]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S0870-82312009000400002</article-id>
<title-group>
<article-title xml:lang="pt"><![CDATA[As potencialidades da Teoria de Resposta ao Item na validade dos testes: Aplicação a uma prova de dependência-independência de campo]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Vieira]]></surname>
<given-names><![CDATA[Maria João]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Ribeiro]]></surname>
<given-names><![CDATA[Rui Bártolo]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Almeida]]></surname>
<given-names><![CDATA[Leandro S.]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,ISPA - Instituto Superior de Psicologia Aplicada  ]]></institution>
<addr-line><![CDATA[Lisboa ]]></addr-line>
</aff>
<aff id="A02">
<institution><![CDATA[,Universidade do Minho  ]]></institution>
<addr-line><![CDATA[Braga ]]></addr-line>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>10</month>
<year>2009</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>10</month>
<year>2009</year>
</pub-date>
<volume>27</volume>
<numero>4</numero>
<fpage>455</fpage>
<lpage>462</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://scielo.pt/scielo.php?script=sci_arttext&amp;pid=S0870-82312009000400002&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.pt/scielo.php?script=sci_abstract&amp;pid=S0870-82312009000400002&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://scielo.pt/scielo.php?script=sci_pdf&amp;pid=S0870-82312009000400002&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="pt"><p><![CDATA[No presente estudo realizou-se uma análise aos itens da prova &#8220;Padrões&#8221; - teste de escolha múltipla informatizado que avalia a dependência-independência do campo - à luz dos modelos de um, dois e três parâmetros da Teoria de Resposta ao Item (TRI). Utilizou-se uma amostra de 1.918 candidatos ao Curso de Pilotagem Aeronáutica da Academia da Força Aérea Portuguesa. Analisou-se o ajustamento aos modelos logísticos de um (ML1), dois (ML2) e três parâmetros (ML3), concluindo-se que o primeiro modelo se ajustou a todos os itens que compõem a prova, o segundo apenas a sensivelmente metade dos itens, e o terceiro não chegou a cumprir as pré-condições. A análise dos resultados sugere que a principal razão do desajuste dos ML2 e ML3 se tenha ficado a dever à não unidimensionalidade do teste, ilustrando deste modo as exigências fundamentais da aplicação da TRI na construção e validação de provas psicológicas.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[In this paper analyses the items of &#8220;Padrões&#8221; test - a multiple-choice computerized test of field dependence-independence - considering the one, two or three parameters logistic models of Item Response Theory (TRI). A sample of 1918 candidates to an aeronautic course on Portuguese Air Force was considered. We analyzed the adjustment level for one parameter (1PL), two parameters (2PL) and three (3PL) parameters logistic models. Results show that 1PL adjusted to all items, 2PL adjusted to half, and 3PL didn&#8217;t allow the assurance of the previous conditions. Data analysis suggest that the first reason for 2PL and 3PL models maladjustment is the lack of unidimensionality, which can be considered as an illustration of the basic exigencies for IRT implementation on psychological test construction and validation.]]></p></abstract>
<kwd-group>
<kwd lng="pt"><![CDATA[Análise dos itens]]></kwd>
<kwd lng="pt"><![CDATA[Dependência-independência de campo]]></kwd>
<kwd lng="pt"><![CDATA[Teoria da Resposta ao Item (TRI)]]></kwd>
<kwd lng="pt"><![CDATA[Validade dos testes]]></kwd>
<kwd lng="en"><![CDATA[Field dependence-independence]]></kwd>
<kwd lng="en"><![CDATA[Item analysis]]></kwd>
<kwd lng="en"><![CDATA[Item Response Theory (IRT)]]></kwd>
<kwd lng="en"><![CDATA[Tests validity]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="center"><b>As potencialidades da Teoria de Resposta ao Item na validade    dos testes: Aplica&ccedil;&atilde;o a uma prova de depend&ecirc;ncia-independ&ecirc;ncia    de campo</b> </p>        <p align="right">Maria Jo&atilde;o Vieira <a name="top1"></a><sup><a href="#1">(*)</a></sup></p>        <p align="right">Rui B&aacute;rtolo Ribeiro <a name="top1"></a><sup><a href="#1">(*)</a></sup> </p>        <p align="right">Leandro S. Almeida <a name="top3"></a><sup><a href="#3">(**)</a></sup></p>     <p align="center">RESUMO </p>     <p>   No presente estudo realizou-se uma an&aacute;lise aos itens da prova &ldquo;Padr&otilde;es&rdquo; &ndash; teste de escolha m&uacute;ltipla informatizado que avalia a depend&ecirc;ncia-independ&ecirc;ncia do campo &ndash; &agrave; luz dos modelos de um, dois e tr&ecirc;s par&acirc;metros da Teoria de Resposta ao Item (TRI). Utilizou-se uma amostra de 1.918 candidatos ao Curso de Pilotagem Aeron&aacute;utica da Academia da For&ccedil;a A&eacute;rea Portuguesa. Analisou-se o ajustamento aos modelos log&iacute;sticos de um (ML1), dois (ML2) e tr&ecirc;s par&acirc;metros (ML3), concluindo-se que o primeiro modelo se ajustou a todos os itens que comp&otilde;em a prova, o segundo apenas a sensivelmente metade dos itens, e o terceiro n&atilde;o chegou a cumprir as pr&eacute;-condi&ccedil;&otilde;es. A an&aacute;lise dos resultados sugere que a principal raz&atilde;o do desajuste dos ML2 e ML3 se tenha ficado a dever &agrave; n&atilde;o unidimensionalidade do teste, ilustrando deste modo as exig&ecirc;ncias fundamentais da aplica&ccedil;&atilde;o da TRI na constru&ccedil;&atilde;o e valida&ccedil;&atilde;o de provas psicol&oacute;gicas. </p>     <p> <I>Palavras chave: </I>An&aacute;lise dos itens, Depend&ecirc;ncia-independ&ecirc;ncia    de campo, Teoria da Resposta ao Item (TRI), Validade dos testes. </p>     <p>&nbsp;</p>     <p align="center">ABSTRACT </p>      <p> In this paper analyses the items of &ldquo;Padr&otilde;es&rdquo; test &ndash;    a multiple-choice computerized test of field dependence-independence &ndash;    considering the one, two or three parameters logistic models of Item Response    Theory (TRI). A sample of 1918 candidates to an aeronautic course on Portuguese    Air Force was considered. We analyzed the adjustment level for one parameter    (1PL), two parameters (2PL) and three (3PL) parameters logistic models. Results    show that 1PL adjusted to all items, 2PL adjusted to half, and 3PL didn&rsquo;t    allow the assurance of the previous conditions. Data analysis suggest that the    first reason for 2PL and 3PL models maladjustment is the lack of unidimensionality,    which can be considered as an illustration of the basic exigencies for IRT implementation    on psychological test construction and validation. </p>     ]]></body>
<body><![CDATA[<p> <I>Key words: </I>Field dependence-independence, Item analysis, Item Response    Theory (IRT), Tests validity. </p>     <p>&nbsp;</p>     <p>&nbsp;</p>        <p align="center">INTRODU&Ccedil;&Atilde;O </p>     <p>   O livro de Lord e Novick (1968, citado por Embretson &amp; Reise, 2000) pretendia revolucionar a metodologia seguida na constru&ccedil;&atilde;o e   valida&ccedil;&atilde;o dos testes psicol&oacute;gicos, destacando v&aacute;rias potencialidades da &ldquo;Teoria da Resposta ao Item&rdquo; (TRI) na   mensura&ccedil;&atilde;o psicol&oacute;gica. Nesta teoria, tamb&eacute;m algumas vezes designada &ldquo;Teoria do Tra&ccedil;o Latente&rdquo; (TTL), o   n&iacute;vel do tra&ccedil;o de um indiv&iacute;duo &eacute; estimado a partir das respostas que ele d&aacute; aos itens que lhe s&atilde;o apresentados e   n&atilde;o atrav&eacute;s da compara&ccedil;&atilde;o do seu desempenho face &agrave; m&eacute;dia e desvio-padr&atilde;o dos resultados num qualquer   grupo de refer&ecirc;ncia (Embretson &amp; Reise, 2000), sendo esta ali&aacute;s a grande novidade do m&eacute;todo. </p>     <p> A TRI est&aacute; assente em v&aacute;rios pilares, nomeadamente: a forma    espec&iacute;fica das curvas caracter&iacute;sticas dos itens (CCIs); a independ&ecirc;ncia    local; a unidimensionalidade; e a fun&ccedil;&atilde;o caracter&iacute;stica    do item (FCC) (Embretson &amp; Reise, 2000; Hambleton, Swaminathan, &amp; Rogers,    1991; Yu, 2007). Deste conjunto de pressupostos ou condi&ccedil;&otilde;es pr&eacute;vias,    importa aqui destacar a unidimensionalidade e a independ&ecirc;ncia local dos    itens de uma prova psicol&oacute;gica (Pasquali &amp; Primi, 2003). </p>       <p> O postulado da independ&ecirc;ncia local afirma que as respostas dadas por    um mesmo sujeito a dois itens s&atilde;o independentes, desde que sejam mantidas    constantes as aptid&otilde;es que afectam o teste, &agrave; excep&ccedil;&atilde;o    da aptid&atilde;o que est&aacute; a ser medida (theta ou <i>&theta;</i>) (Pasquali    &amp; Primi, 2003). Em termos pragm&aacute;ticos, este postulado tem uma implica&ccedil;&atilde;o    necess&aacute;ria &agrave; aplica&ccedil;&atilde;o da TRI, ou seja, o desempenho    do sujeito num item n&atilde;o afecta o seu desempenho nos restantes. A independ&ecirc;ncia    local diz-nos que se existir correla&ccedil;&atilde;o, essa &eacute; causada    por outros factores que n&atilde;o a aptid&atilde;o. A partir do momento em    que sejam mantidos constantes esses outros factores, o factor dominante (tra&ccedil;o    avaliado) passa a ser a &uacute;nica fonte de variabilidade, tornando-se assim    as respostas independentes, dado que o sujeito responde aos itens apenas em    fun&ccedil;&atilde;o do seu <i>&theta;</i> (Pasquali, 2007; Pasquali &amp; Primi, 2003).  </p>     <p> Partindo do postulado da independ&ecirc;ncia local chegamos tamb&eacute;m    ao pressuposto da unidimensionalidade dos itens da prova. A TRI requer que todos    os itens numa prova avaliem um &uacute;nico tra&ccedil;o, ou seja, a prova deve    ser unidimensional, pois de outra forma a sua an&aacute;lise deve ser feita    por subconjuntos de itens ou dimens&otilde;es. A quest&atilde;o da independ&ecirc;ncia    local implica o postulado da unidimensionalidade, uma vez que &eacute; o <i>&theta;</i> do    sujeito a &uacute;nica causa ou factor latente da resposta dada (Pasquali &amp;    Primi, 2003). </p>     <p> Assim sendo, para uma correcta aplica&ccedil;&atilde;o da TRI a um qualquer    instrumento de medida psicol&oacute;gica, deve assumir-se a unidimensionalidade    dos itens, ou seja, cada um dos itens mede apenas um tra&ccedil;o latente (Wiberg,    2004). Extrapolando deste princ&iacute;pio, um participante com uma habilidade    elevada no constructo que est&aacute; a ser avaliado ter&aacute; uma elevada    probabilidade de responder correctamente ao item. Ao mesmo tempo, os itens    que melhor avaliam a habilidade de um sujeito, s&atilde;o aqueles que exigem    o n&iacute;vel de tra&ccedil;o necess&aacute;rio para a correcta resolu&ccedil;&atilde;o    equivalente ao n&iacute;vel geral de tra&ccedil;o que esse mesmo sujeito possui.    Por outras palavras, itens demasiado f&aacute;ceis ou dif&iacute;ceis para um    participante, contribuem muito pouco para estimar a sua habilidade (Green, Bock,    Humphreys, Linn, &amp; Reckase, 1984). </p>     <p align="left"> <I>Depend&ecirc;ncia-independ&ecirc;ncia de campo </I></p>     ]]></body>
<body><![CDATA[<p>   O constructo depend&ecirc;ncia-independ&ecirc;ncia de campo descreve duas formas distintas de processar informa&ccedil;&atilde;o e encontra-se entre os mais estudados no que diz respeito &agrave;s dimens&otilde;es dos estilos cognitivos (Guisande, P&aacute;ramo, Tinajero, &amp; Almeida, 2007). Os indiv&iacute;duos dependentes de campo, tendencialmente, percebem o campo como um todo, t&ecirc;m dificuldade em separar a informa&ccedil;&atilde;o do seu contexto, e s&atilde;o mais facilmente influenciados por pistas externas. J&aacute; no outro extremo, os indiv&iacute;duos independentes de campo, t&ecirc;m tend&ecirc;ncia para se focar em aspectos isolados, t&ecirc;m mais facilidade em separar a informa&ccedil;&atilde;o essencial do contexto, e s&atilde;o mais facilmente influenciados por pistas internas do que externas (Miyake, Witzki, &amp; Emerson, 2001). </p>     <p>   O teste &ldquo;Padr&otilde;es&rdquo; permite-nos avaliar o construto depend&ecirc;ncia-independ&ecirc;ncia de campo, tendo a singularidade de permitir que o sujeito visualize a figura-alvo enquanto est&aacute; a tentar resolver o item (B&aacute;rtolo-Ribeiro, 2003). O facto de esta prova ser realizada em contexto multim&eacute;dia, atrav&eacute;s do uso de computador, por centenas de candidatos ao ano, faz dela um &oacute;ptimo teste para estudar o comportamento psicom&eacute;trico dos modelos log&iacute;sticos da TRI. </p>     <p>   Aproveitando uma base de dados dispon&iacute;vel, pretendemos com o presente estudo testar os modelos de 1, 2 e 3 par&acirc;metros log&iacute;sticos na an&aacute;lise dos itens da prova &ldquo;Padr&otilde;es&rdquo;, ilustrando assim a aplicabilidade que a Teoria de Resposta ao Item pode ter na valida&ccedil;&atilde;o e reestrutura&ccedil;&atilde;o das mais diversas provas. </p>     <p align="center">M&Eacute;TODO </p>     <p>   <I>Amostra </I></p>     <p> A popula&ccedil;&atilde;o em estudo &eacute; constitu&iacute;da por 1918 candidatos    ao Curso de Pilotagem Aeron&aacute;utica da Academia da For&ccedil;a A&eacute;rea    Portuguesa que prestaram provas entre 2004 e 2007. As idades dos candidatos    oscilam entre os 17 e os 23, com uma m&eacute;dia de idades de 18,7. Todos os    participantes t&ecirc;m como m&iacute;nimo de habilita&ccedil;&otilde;es liter&aacute;rias    o 12&ordm; ano de escolaridade completo, e 87,4% da amostra &eacute; do sexo    masculino. Trata-se de uma amostra por conveni&ecirc;ncia (Maroco, 2007), que    corresponde &agrave; totalidade dos candidatos que prestaram provas nos quatro    anos consecutivos. </p>     <p>   <I>Instrumento </I></p>     <p>   A prova &ldquo;Padr&otilde;es&rdquo; &eacute; um teste de escolha m&uacute;ltipla informatizado, desenvolvido por Eugene Burke na d&eacute;cada de noventa (B&aacute;rtolo-Ribeiro, 2003), que avalia o constructo independ&ecirc;ncia do campo. Semelhante ao teste das figuras embutidas, pode incorporar-se na classe dos testes de figuras ocultas, considerando que o participante tem que identificar se a figura-alvo &ndash; est&iacute;mulo &ndash; se encontra em uma, nas duas, ou em nenhuma das figuras complexas apresentadas. A prova &eacute; composta por 10 itens, apresentados aos participantes numa sequ&ecirc;ncia pr&eacute;-estabelecida, sendo que para a resolu&ccedil;&atilde;o de cada um desses itens, os candidatos t&ecirc;m 1 minuto. A tarefa de resolu&ccedil;&atilde;o de cada item, tem presente a press&atilde;o temporal porque em janela pr&oacute;pria, &eacute; apresentado em termos gr&aacute;ficos, o tempo restante em contagem decrescente. Essa barra, nos &uacute;ltimos dez segundos muda para a cor encarnada. Importante salientar que a press&atilde;o do tempo contribui para um aumento da ansiedade do candidato, podendo mesmo constituir-se como um factor n&atilde;o cognitivo limitador do sucesso da tarefa. </p>     <p>   Na sua aplica&ccedil;&atilde;o, solicita-se a cada um dos participantes que identifique uma figura-alvo em dois padr&otilde;es visualmente desorganizados, sendo que a figura-alvo pode estar presente apenas num, nos dois ou em nenhum deles. O candidato deve escolher a sua resposta atrav&eacute;s de um teclado num&eacute;rico premindo a tecla zero quando n&atilde;o encontra a figura-alvo em nenhuma das figuras complexas; a tecla um caso encontre a figura-alvo na figura complexa que se encontra no lado esquerdo; a tecla dois caso a figura-alvo esteja apenas na figura complexa do lado direito; e a tecla tr&ecirc;s caso se encontre em ambas. </p>     <p>   <I>Procedimento </I></p>      ]]></body>
<body><![CDATA[<p>   A recolha de dados foi efectuada <I>a posteriori, </I>em 2007, atrav&eacute;s de uma rotina pr&oacute;pria do sistema inform&aacute;tico gestor da aplica&ccedil;&atilde;o dos testes do Centro de Psicologia da For&ccedil;a A&eacute;rea Portuguesa. O teste Padr&otilde;es faz parte da bateria de provas usada para o ingresso na Academia da For&ccedil;a A&eacute;rea Portuguesa, tendo sido aplicada em contexto real de selec&ccedil;&atilde;o. </p>     <p>   Em termos de an&aacute;lise estat&iacute;stica dos resultados, os itens foram analisados atrav&eacute;s do software BILOG-MG (Zimowski, Muraki, Mislevy, &amp; Bock, 1996). Foram efectuadas v&aacute;rias execu&ccedil;&otilde;es no sentido de se proceder &agrave; calibra&ccedil;&atilde;o dos itens e dos par&acirc;metros de cada um dos tr&ecirc;s modelos. Foi tamb&eacute;m utilizado o Winsteps (Linacre &amp; Wright, 2001), que &eacute; um software que permite a realiza&ccedil;&atilde;o da an&aacute;lise dos dados, &agrave; luz do Modelo de Rash, ou Modelo Log&iacute;stico de Um Par&acirc;metro. Importa referir que o Winsteps (Linacre &amp; Wright, 2001) faz a estima&ccedil;&atilde;o dos par&acirc;metros por m&aacute;xima verossimilhan&ccedil;a, ao passo que o BILOG-MG (Zimowski, Muraki, Mislevy, &amp; Bock, 1996) utiliza processos de estima&ccedil;&atilde;o bayesianos. </p>     <p align="center">RESULTADOS </p>     <p>   Antes de passarmos &agrave; verifica&ccedil;&atilde;o emp&iacute;rica dos modelos de 1, 2 e 3 par&acirc;metros e apreciarmos o seu grau de adequabilidade face aos resultados emp&iacute;ricos obtidos nos itens do teste de depend&ecirc;ncia-independ&ecirc;ncia de campo, quisemos proceder &agrave; verifica&ccedil;&atilde;o dos dois pressupostos pr&eacute;vios &agrave; aplica&ccedil;&atilde;o da TRI: unidimensionalidade do teste e independ&ecirc;ncia local dos itens. </p>     <p> Para a an&aacute;lise da dimensionalidade, procedemos &agrave; an&aacute;lise    factorial das respostas aos itens. O teste KMO foi usado para verificarmos se    os itens se encontravam suficientemente correlacionados (foi escolhido o KMO,    em detrimento do teste de Bartlett, por este segundo ser sens&iacute;vel &agrave;    dimens&atilde;o da amostra). De acordo com Maroco (2007), o resultado da medida    de adequa&ccedil;&atilde;o da amostragem obtido (KMO=0,69), &eacute; med&iacute;ocre    mas ainda aceit&aacute;vel, permitindo concluir que as vari&aacute;veis se encontram    suficientemente intercorrelacionadas. </p>     <p>   Os resultados preliminares da referida an&aacute;lise factorial, sem imposi&ccedil;&atilde;o de limites ao n&uacute;mero de factores a extrair, e de acordo com a regra de Kaiser, exibiram tr&ecirc;s componentes com valores pr&oacute;prios (<I>eigenvalues</I>) superiores a 1: o primeiro factor, com um valor-pr&oacute;prio de 1,99 explicava 20% da vari&acirc;ncia, o segundo factor com valor-pr&oacute;prio de 1,16 explicava 11% e o terceiro factor com valor-pr&oacute;prio de 1,04 explicava 10% da vari&acirc;ncia dos resultados nos 10 itens. Contudo, e embora a an&aacute;lise factorial sem for&ccedil;ar n&uacute;mero de factores tenha sugerido a exist&ecirc;ncia de 3 factores, a an&aacute;lise do <I>Scree Plot </I>evidenciou a poss&iacute;vel exist&ecirc;ncia de um factor muito forte, o que nos permitiu sustentar a justifica&ccedil;&atilde;o do pressuposto da unidimensionalidade da TRI para efeitos da prossecu&ccedil;&atilde;o deste estudo. </p>     <p>   Avan&ccedil;ando para a verifica&ccedil;&atilde;o do pressuposto da independ&ecirc;ncia local, ou seja, a resposta dada a um item por um sujeito com determinado valor de <i>&theta;</i>, n&atilde;o &eacute; influenciada pelas respostas que deu a outros itens mas apenas reflecte o seu n&iacute;vel de tra&ccedil;o (Andriola, 1998), tom&aacute;mos a informa&ccedil;&atilde;o relativa &agrave; unidimensionalidade. Com efeito, o pressuposto da independ&ecirc;ncia local pode derivar-se do princ&iacute;pio da unidimensionalidade, uma vez que os dois pressupostos s&atilde;o equivalentes (Hambleton et al., 1991). Assim sendo, e apenas para efeitos de prossecu&ccedil;&atilde;o deste estudo de ilustra&ccedil;&atilde;o, est&atilde;o verificados os dois pressupostos base da TRI, pelo que poderemos passar &agrave; aplica&ccedil;&atilde;o dos seus tr&ecirc;s modelos. </p>     <p> A Teoria de Resposta ao Item &eacute; uma metodologia muito valiosa na an&aacute;lise    da qualidade dos itens de um dado teste, contudo, isto s&oacute; se verifica    quando os modelos se adequam aos dados emp&iacute;ricos, sem a evid&ecirc;ncia    do ajuste do modelo, os resultados da an&aacute;lise podem ser suspeitos (Chernyshenko,    Stark, Chan, Drasgow, &amp; Williams, 2001; Pasquali, 2007). Como se pode verificar    na Tabela 1, todos os valores dos &iacute;ndices <I>Infit Mnsq </I>e <I>Oufit    Mnsq </I>oscilam entre 0,8 e 1,2, o que nos permite afirmar que os itens se    ajustam ao modelo por serem considerados aceit&aacute;veis (cf. Linacre &amp;    Wright, 1994). </p>     <p>&nbsp;</p>       <p align="center">TABELA 1 </p>     ]]></body>
<body><![CDATA[<p align="center"><I>&Iacute;ndices de ajuste do ML1 ao teste Padr&otilde;es </I></p>     <p align="center"><img src="/img/revistas/aps/v27n4/27n4a02t1.jpg" width="660" height="242"></p>      
<p>&nbsp; </p>     <p>O Modelo de Rasch, permite-nos conhecer os valores do par&acirc;metro b &ndash;    dificuldade do item &ndash; revelando-se este valor atrav&eacute;s do n&iacute;vel    de aptid&atilde;o necess&aacute;rio para poder responder correctamente a cada    um dos itens. Com base na an&aacute;lise do Winsteps (Linacre &amp; Wright,    2001), podemos afirmar que o teste &eacute; f&aacute;cil uma vez que, tendo    em conta que o valor m&eacute;dio da aptid&atilde;o &eacute; 0, os itens 1,    3, 4, 8 e 9, t&ecirc;m um par&acirc;metro de dificuldade com valor negativo    e o item 2 tem um valor de b muito pr&oacute;ximo de zero (b=0,06), como se    pode confirmar na Tabela 2. Atrav&eacute;s do mapa item pessoa podemos tamb&eacute;m    afirmar que existe um n&uacute;mero consider&aacute;vel de sujeitos com aptid&otilde;es    superiores &agrave;s exigidas pelos itens mais dif&iacute;ceis. </p>     <p align="center">&nbsp;</p>     <p align="center">TABELA 2 </p>     <p align="center"><I>Amplitude das diferen&ccedil;as entre os par&acirc;metros    b obtidos atrav&eacute;s do ML1 </I></p>     <p align="center"><i><img src="/img/revistas/aps/v27n4/27n4a02t2.jpg" width="660" height="181"></i></p>     
<p>&nbsp; </p>     <p>Como podemos verificar na Tabela 2 as amplitudes das diferen&ccedil;as entre    os n&iacute;veis de dificuldade dos itens s&atilde;o muito heterog&eacute;neas,    sendo que os seus valores oscilam entre 0,01 (b<Sub>10</Sub>-b<Sub>7</Sub>)    e 0,95 (b<Sub>3</Sub>-b<Sub>1</Sub>). </p>     ]]></body>
<body><![CDATA[<p> Um outro aspecto que nos parece relevante verificar, &eacute; se o grau de    dificuldade de cada um dos itens est&aacute; de alguma forma relacionado com    o seu tipo de resposta. Recordemos que para cada um dos itens existem quatro    tipos de resposta poss&iacute;veis: (0) quando a figura-alvo n&atilde;o &eacute;    encontrada em nenhuma das figuras complexas; (1) quando a figura-alvo se encontra    na figura complexa do lado esquerdo; (2) quando a figura-alvo est&aacute; no    lado direito; e (3) quando a figura-alvo se encontra em ambas as figuras complexas.    Depois de realizada essa an&aacute;lise, conseguiu-se fazer um <I>match </I>entre    os tr&ecirc;s itens com menor grau de dificuldade, e o tipo de resposta 0. Contudo,    n&atilde;o se consegue identificar um padr&atilde;o claro entre os restantes    tipos de resposta e o grau de dificuldade que os itens apresentam. </p>     <p>   Em termos de adequa&ccedil;&atilde;o dos dados ao modelo de dois par&acirc;metros (ML2), recorrendo-se para esta an&aacute;lise ao software BILOG-MG (Zimowski, Muraki, Mislevy, &amp; Bock, 1996), a converg&ecirc;ncia foi verificada (maior mudan&ccedil;a=0,001&lt;0,01=crit&eacute;rio de converg&ecirc;ncia). Inteirados de toda a pan&oacute;plia de opini&otilde;es e diverg&ecirc;ncias sobre a adequa&ccedil;&atilde;o dos modelos, tendo em conta que a &uacute;nica forma de obter as CCIs emp&iacute;rica e estimada atrav&eacute;s do software &eacute; for&ccedil;ar o procedimento estat&iacute;stico com 10 itens, e sabendo que a alternativa &eacute; proceder ao desenho das curvas manualmente, optou-se por for&ccedil;ar o procedimento estat&iacute;stico, solicitando ao software a cria&ccedil;&atilde;o das CCIs para todos os itens. De acordo com os outputs do software, o modelo ajusta-se apenas aos itens 3 e 4. Neste sentido, poder-se-ia concluir que o ML2 n&atilde;o &eacute; um modelo adequado &agrave; maioria dos itens que comp&otilde;em o teste Padr&otilde;es. Contudo, analisando o grau de ajuste de todos os itens atrav&eacute;s da an&aacute;lise gr&aacute;fica da CCI te&oacute;rica, e tendo em conta que o item 3 &ndash; considerado ajustado pelo pr&oacute;prio software &ndash; apresenta um ponto fora da margem de confian&ccedil;a e outro mesmo no seu limite, optou-se por considerar ajustados todos os itens que apresentassem at&eacute; ao m&aacute;ximo de tr&ecirc;s pontos numa das duas condi&ccedil;&otilde;es supracitadas. Desta forma, consideram-se tamb&eacute;m ajustados os itens 1, 5 e 10. </p>     <p>   Uma vez que o ML2 nos permite conhecer, al&eacute;m da dificuldade, a discrimina&ccedil;&atilde;o de cada um dos itens, podemos afirmar que os itens 3 e 4 apresentam um poder discriminativo muito baixo (0,18 e 0,14 respectivamente), os itens 1 e 10 apresentam um poder discriminativo baixo (0,43 e 0,43), e o item 5 tem um poder discriminativo moderado (0,88) (Baker, 2001). Os &iacute;ndices de dificuldade dos itens estimados pelo ML2 t&ecirc;m valores ligeiramente diferentes dos estimados pelo ML1, pois os processos de estima&ccedil;&atilde;o utilizados pelos dois softwares s&atilde;o distintos, como j&aacute; foi referido. </p>     <p>   N&atilde;o se prosseguiu com a verifica&ccedil;&atilde;o do ajuste do modelo ML3, por a converg&ecirc;ncia n&atilde;o ter sido alcan&ccedil;ada para um crit&eacute;rio de 0,005, quando for&ccedil;ado o procedimento estat&iacute;stico para 10 itens. </p>     <p align="center">DISCUSS&Atilde;O E CONCLUS&Otilde;ES </p>     <p>   O presente estudo prop&ocirc;s-se verificar qual dos tr&ecirc;s modelos para dados dicot&oacute;micos &ndash; ML1, ML2 e ML3 &ndash; se apresentava como o mais adequado aos itens que constituem o teste Padr&otilde;es, com o fim &uacute;ltimo de salientar a aplicabilidade que a Teoria de Resposta ao Item pode ter na valida&ccedil;&atilde;o e identifica&ccedil;&atilde;o de pontos de melhoria, para uma eventual reestrutura&ccedil;&atilde;o da prova &agrave; luz da TRI. </p>     <p> Uma vez que a prova Padr&otilde;es se apresenta como um teste de escolha m&uacute;ltipla,    tornou-se particularmente relevante verificar o grau de acerto ao acaso, por    parte dos participantes com baixa aptid&atilde;o, nos itens que o comp&otilde;em.    Contudo, a an&aacute;lise anteriormente efectuada, permite-nos afirmar que o    ML3 &ndash; modelo que permite ter conhecimento do par&acirc;metro c &ndash;    n&atilde;o se adequa de todo aos dados, uma vez que n&atilde;o chegou a ser    cumprida a pr&eacute;-condi&ccedil;&atilde;o, nomeadamente n&atilde;o se atingiu    o crit&eacute;rio de converg&ecirc;ncia. Algumas causas poss&iacute;veis do    desajuste s&atilde;o: (1) um par&acirc;metro c com valor muito elevado; (2)    a prova ser constitu&iacute;da por apenas dez itens, o que se apresentou como    um obst&aacute;culo ao tratamento estat&iacute;stico com o software BILOG-MG    (Zimowski et al., 1996); (3) a baixa correla&ccedil;&atilde;o total entre os    itens, que por si s&oacute; &eacute; j&aacute; um mau pren&uacute;ncio para    o pr&eacute;-requisito da unidimensionalidade; (4) a prova n&atilde;o ser unidimensional.    A hip&oacute;tese de falta de unidimensionalidade, no entanto, revela-se a mais    prov&aacute;vel uma vez que a an&aacute;lise factorial sem for&ccedil;ar n&uacute;mero    de factores, sugeriu a exist&ecirc;ncia de 3 factores, e a correla&ccedil;&atilde;o    entre os itens &eacute; baixa. </p>     <p>   No que diz respeito ao ML2 a pr&eacute;-condi&ccedil;&atilde;o verificou-se, mas para se poderem obter as CCIs foi necess&aacute;rio for&ccedil;ar o software a computar a an&aacute;lise estat&iacute;stica do ajuste do modelo (pedindo as CCIs dos itens que, para um n&iacute;vel de signific&acirc;ncia de 0,005, n&atilde;o eram considerados ajustados). Essa an&aacute;lise revelou que os itens aos quais o modelo se ajustou, com crit&eacute;rio de converg&ecirc;ncia de 0,005, foram os itens 3 e 4, sendo que atrav&eacute;s da metodologia gr&aacute;fica para a an&aacute;lise do ajuste do modelo, se concluiu que os itens 1, 5 e 10 tamb&eacute;m se ajustavam ao ML2. Por&eacute;m, os n&iacute;veis de discrimina&ccedil;&atilde;o s&atilde;o baixos para todos os itens, &agrave; excep&ccedil;&atilde;o do item 5 que det&eacute;m, de acordo com Baker (2001), um moderado poder de discrimina&ccedil;&atilde;o. </p>     <p>   Por um lado detemos o conhecimento de que nem todos os itens se ajustam ao modelo, mas por outro, vimos j&aacute; que a TRI permite a realiza&ccedil;&atilde;o de uma an&aacute;lise individual de cada item, sabemos que existem autores a defenderem a hip&oacute;tese de itens de um mesmo teste serem ajustados a modelos diferentes (Embretson &amp; Reise, 2000), e acrescentando a estes dois argumentos o facto de o ML2 nos dar mais informa&ccedil;&atilde;o do que o Modelo de Rasch, parece-nos que os itens acima mencionados deveriam ser representados atrav&eacute;s do ML2. &Eacute; importante, no entanto, recordar que os itens s&atilde;o tanto melhores, para efeitos de avalia&ccedil;&atilde;o psicom&eacute;trica &agrave; luz da TRI, quanto maior o seu poder de discrimina&ccedil;&atilde;o, e neste caso concreto, verific&aacute;mos que os itens que se ajustam ao ML2 n&atilde;o t&ecirc;m bom poder discriminativo. </p>     <p>   O ML1, ou Modelo de Rasch, permite conhecer a dificuldade de cada um dos itens e &eacute; aquele que melhor se adequa aos dados, n&atilde;o se tendo verificado desajuste por parte de nenhum dos itens, atrav&eacute;s da an&aacute;lise dos res&iacute;duos estandardizados. O facto de se conseguir identificar um padr&atilde;o entre os tr&ecirc;s itens com menor grau de dificuldade, e o tipo de resposta 0, sugere que os itens cuja figura alvo n&atilde;o se encontra em nenhuma das duas figuras complexas, s&atilde;o os mais f&aacute;ceis. </p>     ]]></body>
<body><![CDATA[<p>   Uma vez que existe ajuste do modelo a todos os itens, podemos avan&ccedil;ar com algumas observa&ccedil;&otilde;es e sugest&otilde;es para uma   reformula&ccedil;&atilde;o da prova. Tendo em conta que o item mais f&aacute;cil apresenta um par&acirc;metro de dificuldade de -1,73 e o mais   dif&iacute;cil 1,16, a primeira observa&ccedil;&atilde;o que se pode fazer &eacute; o facto de espectro de dificuldade avaliado pelos itens ser   grande (b<Sub>10</Sub>-b<Sub>1</Sub>=2,89). No ponto de vista da constitui&ccedil;&atilde;o da pr&oacute;pria prova, embora seja constitu&iacute;da por   cinco itens mais f&aacute;ceis (leia-se com b&lt;0) e cinco mais dif&iacute;ceis, tendo em conta o par&acirc;metro b, constatou-se que a dificuldade dos   itens n&atilde;o aumenta de forma gradual e equilibrada, verificando-se diferen&ccedil;as grandes no n&iacute;vel de exig&ecirc;ncia de um item para outro.   Note-se que o item 1 &eacute; o mais f&aacute;cil (b=-1,73), sendo que o segundo item mais f&aacute;cil &eacute; o 3 (b=-0,78), havendo uma   diferen&ccedil;a de 0.95 nos seus graus de dificuldade. </p>       <p>A prova tem um item muito f&aacute;cil (item 1), dois itens dif&iacute;ceis (itens 10 e 7), e os restantes t&ecirc;m valores interm&eacute;dios de   dificuldade, existindo itens que diferem no seu grau de dificuldade apenas por uma cent&eacute;sima, e outros que se distanciam por uma unidade. Neste   sentido, e para que a prova seja mais eficiente, sugere-se que um dos itens mais dif&iacute;ceis (i<Sub>7 </Sub>e i<Sub>10</Sub>) seja retirado da prova,   uma vez que t&ecirc;m os dois praticamente o mesmo n&iacute;vel de dificuldade (b<Sub>7</Sub>=1,15, b<Sub>10</Sub>=1,16). Se o ML2 se tivesse ajustado a   estes dois itens, devia excluir-se o item que menos discrimina&ccedil;&atilde;o tivesse, como tal n&atilde;o se verificou, sendo que apenas o item 10 se   ajusta ao ML2, sugere-se que seja retirado o item 7. Pode observar-se, tamb&eacute;m, que existe um n&uacute;mero consider&aacute;vel de sujeitos cujas aptid&otilde;es s&atilde;o superiores ao n&iacute;vel de aptid&atilde;o necess&aacute;rio para responder ao item com maior par&acirc;metro de dificuldade (b<Sub>10</Sub>=1,16), neste sentido torna-se pertinente incluir na prova um item com um grau de dificuldade superior ao do item 10. Graves, Bezeau, Fogarty, e Blair (2004) adoptaram o mesmo procedimento no desenvolvimento de uma forma mais curta do <I>Boston Naming Test </I>(BNT), mas no sentido contr&aacute;rio, ou seja, como o teste era composto por muitos itens f&aacute;ceis retiraram alguns deles. </p>      <p>   O presente estudo permite-nos afirmar que a TRI, nos seus tr&ecirc;s modelos log&iacute;sticos para dados dicot&oacute;micos, se apresentou como uma metodologia capaz de fornecer informa&ccedil;&atilde;o com bastante potencial para a an&aacute;lise e eventual reestrutura&ccedil;&atilde;o da prova &ldquo;Padr&otilde;es&rdquo;. </p>     <p align="center">&nbsp;</p>     <p align="center">REFER&Ecirc;NCIAS </p>      <!-- ref --><p> Andriola, W. (1998). Utiliza&ccedil;&atilde;o da teoria de resposta ao item    (TRI) para a organiza&ccedil;&atilde;o de um banco de itens detinados a avalia&ccedil;&atilde;o    do racioc&iacute;nio verbal. <I>Psicologia, reflex&atilde;o e cr&iacute;tica</I>,    <I>11</I>, 1-13. Consultado em 4 Junho, 2008, de <a href="http://redalyc.uaemex.mx/redalyc/pdf/188/18811209.pdf" target=" blank">http://redalyc.uaemex.mx/redalyc/pdf/188/18811209.pdf</a>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=000068&pid=S0870-8231200900040000200001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><p>   Baker, F. B. (2001). <I>The basics of item response theory</I>. Washington, DC: ERIC. </p>     <p> B&aacute;rtolo-Ribeiro, R. (2003). <I>Os tempos de lat&ecirc;ncia nas respostas    aos itens de testes informatizados: Contributos para a compreens&atilde;o do    processa</I><I>mento cognitivo</I>. Disserta&ccedil;&atilde;o de mestrado n&atilde;o    publicada. Instituto Superior de Psicologia Aplicada, Lisboa, Portugal. </p>     <p>   Chernyshenko, O., Stark, S., Chan, K., Drasgow, F., &amp; Williams, B. (2001). Fitting item response theory models to two personality inventories: Issues and insights. <I>Multivariate Behavioral Research</I>, <I>36</I>(4), 523-562. Retrieved March 24, 2007 from the Psychology and Behavioral Sciences Collection database. </p>     <p>   Embretson, S. E., &amp; Reise, S. P. (2000). <I>Item response theory for psychologists</I>. New Jersey: Lawrence Erlbaum Associates, Inc. </p>     ]]></body>
<body><![CDATA[<p>   Graves, R., Bezeau, S., Fogarty, J., &amp; Blair, R. (2004). Boston naming test short forms: A comparison of previous forms with new item response theory based forms. <I>Journal of Clinical and Experimental Neuropsychology</I>, <I>26</I>, 891-902. Retrieved September 5, 2008, from MEDLINE database. </p>     <p>   Green, B., Bock, R., Humphreys, L., Linn, R., &amp; Reckase, M. (1984). Technical guidelines for assessing computerized adaptive tests. <I>Journal of Educational Measurement</I>, <I>21</I>, 347-360. </p>     <p>   Guisande, M., P&aacute;ramo, M., Tinajero, C., &amp; Almeida, L. (2007). Field dependence-independence (FDI) cognitive style: An analysis of attentional functioning. <I>Psicothema, 19</I>, 572-577. Retrieved May 29, 2008, from PsycINFO database. </p>     <p>   Hambleton, R., Swaminathan, H., &amp; Rogers, J. (1991). <I>Fundamentals of item response theory</I>. New York: Sage publications. </p>     <p> Linacre, J. M., &amp; Wright, B. D. (1994). Reasonable mean-square fir values.    <I>Rasch Measurement Transactions, 8</I>, 370. Retrieved May 7, 2008 from<a href="http://www.rasch.org/rmt/rmt83b.htm" target="_blank">    http://www.rasch.org/rmt/rmt83b.htm</a>. </p>     <p>   Linacre, J. M., &amp; Wright, B. D. (2001). <I>Winsteps </I>(Vers&atilde;o 3.61.1) [Computer software]. Chicago: Mesa Press. </p>     <p>   Maroco, J. (2007). <I>An&aacute;lise estat&iacute;stica com utiliza&ccedil;&atilde;o do SPSS </I>(3&ordf; ed.). Lisboa: Edi&ccedil;&otilde;es S&iacute;labo. </p>     <p>   Miyake, A., Witzki, A., &amp; Emerson, M. (2001). Field dependence-independence from a working memory perspective: A dual-task investigation of the Hidden Figures Test. <I>Memory, 9</I>, 445-457. Retrieved May 20, 2008, doi:10.1080/0965821 0143000029. </p>     <p>   Pasquali, L. (2007). <I>Teoria de resposta ao item. </I>Bras&iacute;lia, D.F.: Laborat&oacute;rio de Pesquisa em Avalia&ccedil;&atilde;o e Medida. </p>     <p> Pasquali, L., &amp; Primi, R. (2003). Fundamentos da Teoria de Resposta ao    Item &ndash; TRI. <I>Avalia&ccedil;&atilde;o Psicol&oacute;gica, 2</I>, 99-110.    Consultado em Mar&ccedil;o, 10, 2008, atrav&eacute;s da fonte <a href="http://pepsic.bvs-psi.org.br/pdf/avp/v2n2/v2n2a02.pdf" target=" blank">http://pepsic.bvs-psi.    org.br/pdf/avp/v2n2/v2n2a02.pdf</a>.</p>     ]]></body>
<body><![CDATA[<p> Wiberg, M. (2004). <I>Classical test theory vs. Item response theory</I>.    Retrieved May 10, 2007, from <a href="http://www.umu.se/edmeas//publikationer/pdf/EMno50.pdf" target=" blank">http://www.umu.se/edmeas//publikationer/pdf/EMno50.pdf</a>.</p>     <p> Yu, C. H. (2007). <I>A simple guide to item response theory</I>. Retrieved    August 7, 2007 from <I><a href="http://www.creative-wisdom.com/computer/sas/IRT.pdf" target=" blank">http://www.creative-wisdom.com/computer/sas/IRT.pdf</a></I></p>     <p>   Zimowski, M., Muraki, E., Mislevy, R., &amp; Bock, R. (1996). <I>BILOG-MG: Multiple-group IRT analysis and test maintenance for binary items </I>(Vers&atilde;o 3.0) [Computer software]. Chicago: Scientific Software International (SSI). </p>     <p align="center">&nbsp;</p>     <p>  <a name="1"></a><Sup><a href="#top1">(*)</a></Sup> Instituto Superior de Psicologia Aplicada, Lisboa. </p>     <p> <a name="3"></a><Sup><a href="#top3">(**)</a></Sup> Universidade do Minho,    Braga. </p>       ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Andriola]]></surname>
<given-names><![CDATA[W.]]></given-names>
</name>
</person-group>
<article-title xml:lang="pt"><![CDATA[Utilização da teoria de resposta ao item (TRI) para a organização de um banco de itens detinados a avaliação do raciocínio verbal]]></article-title>
<source><![CDATA[Psicologia, reflexão e crítica]]></source>
<year>1998</year>
<volume>11</volume>
<page-range>1-13</page-range></nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Pasquali]]></surname>
<given-names><![CDATA[L.]]></given-names>
</name>
<name>
<surname><![CDATA[Primi]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
</person-group>
<article-title xml:lang="pt"><![CDATA[Fundamentos da Teoria de Resposta ao Item - TRI]]></article-title>
<source><![CDATA[Avaliação Psicológica]]></source>
<year>2003</year>
<volume>2</volume>
<page-range>99-110</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
