1 Introdução
A pesquisa em educação (ou investigação em educação) é um campo muito amplo, devido às diversas instâncias da gestão educacional, aos inúmeros sujeitos envolvidos, aos distintos processos e metodologias pedagógicos e aos projetos e políticas do setor, inseridos em uma conjuntura de mudanças sociais, econômicas e políticas que se operam na atualidade, nos planos nacional e internacional.
Além disso, as tecnologias da informação e comunicação (TIC) assumiram um papel preponderante no momento atual de pandemia, com destaque para as necessidades de manter as atividades educacionais em ambientes remotos.
A literatura sobre esse campo de pesquisa é muito abrangente e diversificada. Mais recentemente, alguns autores exploraram temas relacionados à política em educação (Martinez & Machado, 2020), o monitoramento de avaliação dos Planos Decenais de Educação (Aranda, Rodrigues, & Militão, 2020) e à Base Nacional Comum Curricular (Costa & Silva, 2019); à formação de professores para a educação infantil (Cunha, Cunha, & Ferreira, 2020) e para a educação básica (Amaral & Monteiro, 2019).
Outros autores apresentaram uma análise sobre a regulação da conduta da pesquisa em educação (Savi Neto, Fare, & Silva, 2020); a caracterização dos passos da Teoria Fundamentada nos Dados (TFD) e as possíveis aplicações na pesquisa em educação (Prigol & Behrens, 2019); e a relevância para a pesquisa em história da educação (Martins, 2019).
Diante dessa diversidade surge a questão de pesquisa deste estudo: qual o panorama das publicações em português na base Scielo sobre a pesquisa em educação?
2 Metodologia
Este trabalho tem como objetivo apresentar um panorama das publicações sobre a pesquisa em educação, por meio de uma análise bibliométrica. Para responder à questão de pesquisa, explorou-se a análise de redes de coocorrência de palavras-chave e de citações de documentos, de periódicos e de organizações. Para isso, foram utilizados métodos de pesquisa bibliométrica (ZUPIC & CATER, 2014) e de análise de redes (Newman, 2009; Van Eck & Waltman, 2014).
Uma rede bibliométrica consiste em nós e arestas. Os nós podem ser, por exemplo, publicações, periódicos, organizações, autores ou palavras-chave. As arestas indicam relações entre pares de nós. Os tipos de arestas geralmente mais utilizados são as relações de citação, de co-ocorrência de palavras-chave e de coautoria. No caso de relações de citação, uma distinção adicional pode ser feita entre a citação direta, a co-citação e o acoplamento bibliográfico. As redes bibliométricas são geralmente redes ponderadas. Consequentemente, as arestas indicam não apenas se há uma relação entre dois nós ou não, mas também a força dessa relação.
A análise bibliométrica fornece uma ferramenta útil para inferir conhecimento de um corpo da literatura científica e interpretar a evolução, a distribuição e o desenvolvimento da pesquisa em um determinado campo (Daim, Rueda, & Martin, 2005). Trata-se de uma abordagem que permite avaliar as relações entre autores, entidades, periódicos ou países, além de medir o impacto da pesquisa e a vinculação envolvendo as co-citações e as palavras-chave empregadas (Lv et al, 2011; Martínez-Gómez, 2015).
Esta pesquisa seguiu as seguintes etapas: desenho da pesquisa com a definição do objetivo e a expressão de busca; escolha das unidades de análise - palavras-chave, documentos, fontes e organizações; escolha do tipo de análise - redes de coocorrência de palavras-chave e de citações; seleção da base Scielo para a pesquisa bibliográfica e a recuperação de informações; escolha do software VOSviewer (Van Eck & Waltman, 2021) para gerar as redes de coocorrência de palavra-chave e de citações de documentos, fontes e organizações; elaboração do arquivo de tesauros do VOSviewer para controle do vocabulário e normalização de nomes de organizações; obtenção das redes de coocorrência de palavras-chave e de citações de documentos, de fontes e de organizações com o controle do vocabulário e a normalização dos nomes de organizações; escolha do software Gephi (Bastian, Heymann, & Jacomy, 2009) para o cálculo das métricas de análise de redes - grau médio, classes de modularidade e centralidade de autovetor; identificação dos termos mais relevantes e emergentes dos tópicos de pesquisa; identificação das fontes e das organizações com as maiores centralidades de autovetor.
3 Resultados da Pesquisa
A pesquisa bibliográfica foi realizada na base Scielo Citation Index (Web of Science) utilizando a expressão de busca: educação, que retornou 23731 documentos publicados do período de 2002 a 2021. Como o foco da pesquisa é a análise das publicações em português na área da educação, foram realizados dois refinamentos com a seleção dos seguintes filtros: categoria - education educational research; tipos de documentos - artigos em periódicos e de revisão; e iselecionado o idioma - português.
O resultado é constituído por 7448 documentos publicados no período de 2002 a 2021. A Figura 1 apresenta a evolução das publicações no período de 2002 a 2021. Observa-se que o pico de publicações ocorreu em 2018, seguido por 2019 e 2020. A seguir, serão apresentados os resultados das análises de coocorrência e de citações.
3.1 Análise de Coocorrência de Palavras-chave
Para a obtenção da rede de coocorrência de palavras-chave, foi utilizado o software VOSviewer. As palavras-chave foram extraídas da lista fornecida pelos autores de cada publicação. O número de coocorrências de duas palavras-chave corresponde ao número de publicações nas quais os dois termos ocorreram simultaneamente (Van Eck & Waltman, 2014).
Os metadados foram lidos e foi selecionada a opção de coocorrência de palavras-chave do autor. Sem o controle do vocabulário, com um mínimo de 1 ocorrência para cada par de palavras-chave, resultou em uma rede de coocorrência com 10694 nós, 11 comunidades e 38783 arestas. Cada comunidade possuía pelo menos 100 nós. Adicionalmente, o VOSviewer oferece uma opção de criar um arquivo de texto para realizar o controle do vocabulário - o tesauro, ou seja, é possível realizar a substituição e a exclusão de termos. Trata-se de uma interpretação qualitativa das palavras-chave incluídas pelos autores nos metadados de cada documento. Com essa opção do controle do vocabulário, a rede resultante incluiu 9011 nós, 11 comunidades e 25473 arestas.
A Figura 2 apresenta a visualização da rede de coocorrência de palavras-chave. É possível identificar algumas palavras-chave que se destacam na rede: special education, physical education, children, teacher training, history of education, medical education, curriculum, distance education, entre outras. Contudo, alguns termos, que aparecem com baixa intensidade e em áreas mais periféricas da figura, podem constituir oportunidades de pesquisa: anti-drug education, educational identity, assessment of higher education, indigenous culture, military education,deaf literature, etc.
Contudo, a interpretação desses resultados a partir do mapa de densidade não é precisa. Para obter resultados mais precisos, com a identificação dos termos mais influentes e os emergentes, a rede foi exportada em formato GML para ser recuperada no Gephi (Bastian, Heymann, & Jacomy, 2009). Em seguida, foram calculadas as métricas de redes: grau médio, modularidade de classes e centralidade de autovetor. A centralidade de autovetor atribui relevância a um nó em função de sua relação com os demais vértices da rede. Se um nó está ligado a outros que se encontram numa posição central na rede, o mesmo terá um valor alto de centralidade de autovetor (Newman, 2009).
A Tabela 1 apresenta os resultados para as 20 palavras-chave com os valores mais elevados de centralidades de autovetor e de grau. A palavra-chave higher edcuation é a que apresenta o maior valor de centralidade de autovetor e o maior grau. Entre as palavras-chave da Tabela 1, algumas merecem destaque: special education, educational policies, curriculum, history of education, basic education, early childhood education, inclusive education, distance education, continued education. Tais palavras-chave são conceitos que mostram a diversidade da pesquisa em educação. Outro ponto a destacar é que estes conceitos têm anos médios de publicação variando de 2012 a 2015.
Para a identificação de temas emergentes, alguns estudos recentes utilizaram a rede de coocorrência da palavras-chave nos seguintes temas: manutenção preditiva e sensores inteligentes em fábricas inteligentes (Pech, Vrchota, & Bednář, 2021), segurança contra incêndio (Lang et al, 2021), cooperação internacional em migração (Khaldi & Prado-Gascó, 2021) e saúde e segurança ocupacional e responsabilidade social corporativa (Bautista-Bernal, Quintana-García, & Marchante-Lara, 2021).
Neste trabalho, foi utilizado um recurso do VOSviewer que é o ano médio que cada palavra-chave ocorre no conjunto de documentos da pesquisa bibliográfica. Para isso, foi utilizada a rede importada pelo Gephi e extraídas as palavras-chave que tiveram ano médio de 2020, porque não tiveram termos com ano médio de 2021. A Tabela 2 apresenta o resultado para os tópicos emergentes. As palavras-chave foram colocadas em ordem crescente de grau e centralidade de autovetor. Esta ordem revela as palavras-chave com menor grau e baixa influência na rede. A tendência é que, com o tempo e com a publicação de novos documentos, estas palavras-chave se conectem àquelas mais influentes e alcancem relevância por se transformarem em temas de interesse de pesquisa.
Os resultados revelam a emergência de tópicos atuais, como é o caso da Covid-19, a pós-pandemia, as inovações pedagógicas e o aprendizado remoto (ou aprendizagem à distância). A realidade atual motivou estudos e pesquisas destes tópicos. O tópico Covid-19 se destaca pelo grau e centralidade de autovetor bem maiores que os demais.
3.2 Análise de Citações
Vários tipos de relações entre as publicações podem ser usadas para identificar os tópicos de pesquisa, como abordagens baseadas em citações, em textos e híbridas. No caso de abordagens baseadas em texto, alguns estudos estabeleceram clusters com base na coocorrência de termos (Furukawa et al., 2015; Lee, 2008; Rotolo, Hicks, & Martin, 2015). As abordagens baseadas em citações permitem identificar diversos tipos de relações, tais como: citação direta (Kajikawa & Takeda, 2008; Kajikawa, Yoshikawa, Takeda, & Matsushima, 2008; Shibata et al, 2011), acoplamento bibliográfico (Morris, Yen, Wu, & Asnake, 2003) e cocitação (Small, 2006; Upham & Small, 2010). Estas relações podem ser usadas para agregar publicações.
Comparadas com a cocitação e o acoplamento bibliográfico, as citações diretas, por vezes chamadas de citações cruzadas, oferecem uma indicação mais imediata da ligação das publicações. No entanto, na literatura sobre visualização de redes bibliométricas, é relativamente incomum trabalhar com citações diretas. Isso provavelmente ocorre porque o uso de citações diretas geralmente leva a redes muito esparsas (ou seja, redes com apenas um número muito pequeno de arestas). Apesar dessa questão, parece haver um interesse crescente em citações diretas na literatura (Boyack & Klavans, 2010; Persson, 2010; Waltman & Van Eck, 2012).
Foram geradas as redes de citação de documentos, de fontes e de organizações, ambas no VOSviewer e exportadas para o Gephi. A rede de citação de documentos obtida, com o mínimo de 5 citações por documento, possui 376 nós, 19 comunidades e 459 arestas. A Tabela 3 apresenta os 10 artigos mais influentes da rede e os seus respectivos tópicos de pesquisa. Nota-se que, apesar dos artigos possuirem grau baixo, têm centralidades de autovetor mais alta.
A rede de citação de fontes foi gerada pelo VOSviewer e importada pelo Gephi. Neste caso, as a opção foi a de indagar quais os periódicos que publicaram os artigos. A rede de citação de fontes obtida, com o mínimo de 1 citação por periódico, possui 42 nós, 4 comunidades e 271 arestas. A Tabela 4 apresenta os 10 periódicos mais influentes desta rede. Observa-se que o periódico mais influente possui classificação B2 no Qualis da Capes. Contudo, sete periódicos são A1, e os outros dois, A2 e A4.
A última rede gerada foi a de citação de organizações, que foi opbtida pelo VOSviewer e exportada para o Gephi. A Figura 3 apresenta o mapa de densidade de citações das organizações. Em destaque aparecem as seguintes instituições: Universidade de São Paulo (USP), Universidade Estadual de São Paulo (UNESP), Universidade Estadual de Campinas (Unicamp), Universidade Federal do Rio Grande do Sul (UFRGS), Universidade Federal do Rio de Janeiro (UFRJ), Universidade Federal do Paraná (UFPR), Universidade Federal de São Carlos (UFSCar), Universidade Federal de Minas Gerais (UFMG), Universidade Federal de Santa Maria (UFSM), entre outras.
Para verificar as organizações ou instituições mais influentes na rede, a Tabela 5 apresenta a rede de citação de organizações. Observa-se que algumas instituições da Figura 3 constam da Tabela 5, tais como USP, UFSCar e UFSM. Como a influência é determinada pela centralidade de autovetor, insituições que não ficaram visíveis na Figura 3 constam desta Tabela. Outro ponto a destacar é que oito instituições são brasileiras, uma da Espanha e uma do Reino Unido. Como o recorte foi feito no idioma português, o resultado está coerente.
4 Conclusões
Esta pesquisa apresentou um panorama da pesquisa em educação a partir da análise da bibliografia recuperada na base Scielo Citation Index (via Web of Science).De notar que a produção em língua portuguesa é mais vasta do que indexada nesta base referencial. Futuras pesquisas pretendem ultrapassar esta limitação para dar visibilidade a essa produção, aos seus autores, instituições e países que divulgam o conhecimento em língua portuguesa.
Como o campo de pesquisa é muito vasto, a metodologia utilizada mostra um caminho para que seja obtido um panorama usando métodos da análise de redes bibliométricas.
A partir desta base de trabalho, onde foram identificados tópicos de pesquisa mais relevante e emergentes, além dos periódicos e das organizações mais influentes, surgem novas questões:
- quais os tópicos pesquisados pelas organizações mais influentes?
- quais os autores mais relevantes e suas contribuições para a pesquisa em educação?
- qual a cooperação e os tópicos de pesquisa existentes entre as organizações mais influentes?
O desafio de dar respostas a essas questões indica novos aprofundamentos empregando métodos qualitativos para a interpretação dos resultados. Este grupo de artigos pode ser complementado por outros recuperados nas bases Scopus e Web of Science, a partir dos refinamentos utilizados neste trabalho. A interpretação dos artigos relevantes pode ser objeto de análise de conteúdo, agilizada pelo Software WebQDA, alinhada com as questões que agora emergiram (Costa & Amado, 2018). A potencialidade de questionamento deste software irá permitir um rico aprofundamento na exploração dos textos dos artigos relevantes.
Deste modo, apesar das inerentes limitações deste estudo exploratório, ele se revela de grande utilidade para desenhar e realizar uma revisão da literatura, sobre um subtema que queiramos focar. O mapeamento agora obtido assume uma importância por apresentar indicações de rotas de pesquisa num campo tão vasto e diversificado como é a Pesquisa em Educação.