34 2 
Home Page  

  • SciELO

  • SciELO


Revista Portuguesa de Educação

 ISSN 0871-9187 ISSN 2183-0452

GOMES, Cristiano Mauro Assis; LEMOS, Gina C.    JELIHOVSCHI, Enio G.. The reasons why the Regression Tree Method is more suitable than General Linear Model to analyze complex educational datasets. []. , 34, 2, pp.42-64.   01--2022. ISSN 0871-9187.  https://doi.org/10.21814/rpe.18044.

^a

Any quantitative method is shaped by certain rules or assumptions which constitute its own rationale. It is not by chance that these assumptions determine the conditions and constraints which permit the evidence to be constructed. In this article, we argue why the Regression Tree Method’s rationale is more suitable than General Linear Model to analyze complex educational datasets. Furthermore, we apply the CART algorithm of Regression Tree Method and the Multiple Linear Regression in a model with 53 predictors, taking as outcome the students’ scores in reading of the 2011’s edition of the National Exam of Upper Secondary Education (ENEM; N = 3,670,089), which is a complex educational dataset. This empirical comparison illustrates how the Regression Tree Method is better suitable than General Linear Model for furnishing evidence about non-linear relationships, as well as, to deal with nominal variables with many categories and ordinal variables. We conclude that the Regression Tree Method constructs better evidence about the relationships between the predictors and the outcome in complex datasets.

^len^a

Qualquer método quantitativo é formatado por certas regras ou postulados que constituem a sua própria racionalidade. Não fortuitamente, esses postulados determinam as condições e constrangimentos segundo os quais as evidências podem ser construídas. Neste artigo, argumentamos por que a racionalidade do Método de Regressão em Árvore é mais apropriada do que a do Modelo Linear Geral para analisar dados educacionais complexos. Ademais, aplicamos o algoritmo CART do Método de Regressão em Árvore, assim como a Regressão Linear Múltipla, num modelo com 53 preditores, tomando como desfecho as pontuações dos estudantes em leitura da edição de 2011 do Exame Nacional do Ensino Médio (ENEM; N = 3.670.089), o qual é um dado educacional complexo. Esta comparação empírica ilustra como o Método de Regressão em Árvore é superior ao Modelo Linear Geral para fornecer evidências sobre relações não lineares, assim como para lidar com variáveis nominais com muitas categorias, e variáveis ordinais. Concluímos que o Método de Regressão em Árvore constrói melhores evidências sobre as relações entre os preditores e o desfecho em dados complexos.

^lpt^a

Cualquier método cuantitativo está conformado por ciertas reglas o postulados que constituyen su propia racionalidad. No por casualidad, estos postulados determinan las condiciones y restricciones sobre las cuales se puede construir la evidencia En este artículo, argumentamos por qué la racionalidad del Método de Árbol de Regresión es más apropiada que el Modelo Lineal General para analizar datos educativos complejos. Además, se aplicó el algoritmo CART del Método de Regresión de Árbol, así como la Regresión Linear Múltiple, en un modelo con 53 predictores, tomando como variable de respuesta el desempeño de los estudiantes en lectura de la edición 2011 del Examen Nacional de Educación Secundaria (ENEM; N = 3.670.089), que es un dato educativo complejo. Esta comparación empírica ilustra cómo el Método de Árbol de Regresión es superior al Modelo Linear General al proporcionar evidencia de relaciones no lineales, así como al tratar con variables nominales con muchas categorías y variables ordinales. Llegamos a la conclusión de que el Método de Árbol de Regresión genera mejores evidencias sobre las relaciones entre los predictores y el variable de respuesta en datos complejos.

^les

: .

        · | | |     ·     · ( pdf )