46Revisión sistemática de instrumentos de evaluación de calidad de objetos de aprendizaje 
Home Page  

  • SciELO

  • SciELO


RISTI - Revista Ibérica de Sistemas e Tecnologias de Informação

 ISSN 1646-9895

GUIMARAES, André José Ribeiro; MENDES JUNIOR, Ricardo    FREITAS, Maria do Carmo Duarte. Requisitos para a ciência de dados: analisando anúncios de vagas de emprego com mineração de texto. []. , 46, pp.54-70.   30--2022. ISSN 1646-9895.  https://doi.org/10.17013/risti.46.54-70.

^a

Esta pesquisa identifica os requisitos para cientistas de dados no Brasil em anúncios de emprego. Para analisar estes documentos, adota métodos de mineração de texto: n-grama, modelagem de tópico e agrupamento. Os resultados apontam uma concentração de vagas em São Paulo e revelam que a modalidade remota é a segunda mais ofertada. Além disso, destaca que os salários no Brasil estão abaixo da média de outros países, mesmo que as organizações procurem por profissionais experientes e com alto nível educacional. Quanto aos requisitos, há o predomínio de habilidades técnicas como machine learning, modelos estatísticos, python, banco de dados, dentre outras. Para as técnicas de mineração, demonstra que n-grama e o agrupamento são mais adequadas que a modelagem de tópicos.

^lpt^a

This research identifies in job postings the requirements for data scientists in Brazil. To analyze these documents, it adopts text mining methods of analysis: n-gram, topic modeling, and clustering. The findings point to a concentration of job opportunities in São Paulo while demonstrating that the remote modality is the second most offered. Additionally, it highlights that salaries in Brazil are below the average of other countries, even if organizations look for experienced professionals with an elevated level of education. About the requirements, there is a predominance of technical skills such as machine learning, statistical models, python, and database, among others. The results also demonstrate that n-gram and clustering are more suitable for text mining techniques than topic modeling.

^len

: .

        · | |     · |     · ( pdf )