1. Introdução
Até março de 2020 a indústria turística tinha registado um crescimento anual constante e encontrava-se em franca expanção (WTTC, 2019). A pandemia Covid-19 fez tremer os alicerces de toda a economia mundial e teve um impacto sem precedentes na indústria turística (Chakraborty & Maity, 2020). Perdas superiores a $1,2 mil biliões em receitas de exportação turística e de cerca de 120 milhões em trabalhos diretos (Sigala, 2020) levaram os organismos que controlam as decisões no setor turístico a pensar como relançar o setor e atrair os turistas num cenário pós-pandémico.
(Sigala, 2020) afirma que as tecnologias vão estar no centro das soluções para a reabertura da economia e do turismo após o profundo impacto ao nível estrutural e transformacional na atividade turística causado pela pandemia. A análise de dados e uma correta gestão das informações sobre a perceção dos turistas disponível virtualmente, como é o caso do User Generated Content (UGC) (Kaosiri et al., 2017), serão fundamentais na compreensão de como formar uma Tourist Destination Image (TDI) e para a reinvenção desta indústria.
O UGC, aliado à informação turística nos meios de comunicação social, é aceite como informação de apoio aos turistas para desenvolver o seu plano de viagem e tomar uma decisão quanto ao destino turístico (Xiang & Gretzel 2010); (Kaosiri et al., 2017); (Marine-Roig, 2019). Além disso, é considerado um método altamente fiável para a procura de informação segura e instantânea (Yoo & Gretzel 2011); (Kaosiri et al. 2017) uma vez que os utilizadores podem procurar informação e interagir com outros com ampla dispersão (Nezakati et al., 2015). O impacto em todo o processo de viagem torna o UGC importante, tanto para os turistas como para as empresas turísticas que podem recorrer-se dessas informações para atrair novos clientes (Kaosiri et al., 2017); (Marine-Roig, 2019).
O presente estudo concentra-se na examinação da imagem de uma região turística, por meio da utilização de User Generated Content (UGC) sobre diferentes tipos de recursos turísticos (atrações, atividades relacionadas a viagens, hotéis e restaurantes). Para tal, foi necessário atentar-se para a construção desta imagem de uma perspetiva holística, derivando da imagem percebida do turista e da imagem projetada dos agentes e organizações turísticas. Utilizou-se o modelo proposto por Marine-Roig, 2019) criado especificamente para analisar a TDI dando uso a conteúdo criado por visitantes.
Considera-se que os resultados, com base nas necessidades, preferências e opiniões dos visitantes, podem ser úteis para melhor compreensão do que mais atrai o turista na região, para que as organizações voltadas para o turismo possam investir os seus recursos de forma mais sustentada, criando assim uma experiência turística de alto valor para o visitante.
2. Revisão de Literatura
2.1. Imagem de um destino turístico
A soma de convicções, ideias, e impressões que um indivíduo manifesta por um destino, tem sido alvo de estudo pela comunidade científica ao longo das últimas 4 décadas (Crompton, 1979); (Ekinci & Hosany, 2006); (Marine-Roig, 2017); (Shankar, 2018). A TDI consiste na interpretação subjetiva da realidade feita pelo turista e, não só tem uma influência considerável na intenção de visitar e propensão de regressar/recomendar um destino, como tem ainda um papel fundamental na evolução do próprio destino (Chon, 1990); (Gretzel & Yoo, 2008); (Marine-Roig, 2017).
De uma forma geral a TDI é considerada uma construção dialética onde a imagem projetada (projected) - representada pela imagem criada por agentes e organizações turísticas sobre determinado destino - e a imagem percebida (perceived) - subjetiva e contextual, criada por cada indivíduo sobre um destino turístico - se influenciam mutuamente num fluxo constante (Marine-Roig, 2015), ou seja, uma está constantemente a depender da outra. A TDI criada por um indivíduo retrata a sua perceção e interação com a imagem projetada, o seu contexto individual (contexto social, variáveis demográficas, estereótipos, identidade, entre outros) e a sua experiência e relação com outras fontes de construção de informação (Marine-Roig, 2015), como os conteúdos de viagem criados na internet.
No intuito de decifrar a imagem de um destino turístico, por meio da utilização de recursos como o conteúdo criado por turistas, a comunidade científica tem recorrido a diferentes plataformas digitais. Nomeadamente, a análise de fóruns de conteúdo de viagens (Tamajón & Valiente, 2017); (Gkritzali et al., 2018), tweets (Jabreel et al., 2017), Facebook posts (Lalicic et al., 2019), photo posts (Agustí, 2018); (Deng et al., 2019) e blogs de viagens (Choi et al., 2007); (Marine-Roig, 2010). Embora a grande maioria dos estudos existentes se centrem neste último, a verdade é que esse tipo de recurso está a tornar-se cada vez menos utilizado pelos turistas. Em contrapartida, o foco das pesquisas tem-se deslocado para plataformas digitais como o TripAdvisor (Gretzel & Yoo, 2008); (Kladou & Mavragani, 2015); (Marine-Roig, 2017); (Marine-Roig, 2019), devido ao crescimento exponencial das avaliações e comentários de viagens feitos online (Online Travel Reviews - OTRs) (Marine-Roig, 2019).
O estudo da imagem de um destino foi realizado por diferentes autores e cada um deles avalia a imagem de um destino por meio de um conjunto de diferentes componentes (Apostolopoulou & Papadimitriou, 2015); (Baloglu & McCleary, 1999); (Kladou & Mavragani, 2015); (Shankar, 2018), sendo a grande maioria dos estudos guiados por modelos herdados da psicologia (Prayag et al., 2017); (Marine-Roig, 2019).
Neste estudo utilizou-se o modelo proposto recentemente por Marine-Roig (2019), criado especificamente para analisar a TDI utilizando conteúdo criado por turistas, correspondendo assim ao objetivo deste estudo. Este modelo divide a interação entre o turista e o ambiente em três áreas: conhecer algo (Cognitivo/designativo); sentir algo (Afetivo/estimativo) e fazer algo em relação a isso (Conativo/prescritivo) (Marine-Roig, 2019).
A componente designativa diz respeito aos elementos físicos e temporais da imagem e responde sucintamente às questões “O quê?”, “Onde?” e “Quando?” (Baloglu & McCleary, 1999); (Martín & Bosque, 2008); (Marine-Roig, 2019). Já a componente estimativa, por sua vez, incorpora a avaliação e preferência do indivíduo e relaciona por isso a resposta aos seus sentimentos, valor e significado atribuído à imagem (Pocock & Hudson, 2000); (Kladou & Mavragani, 2015); (Marine-Roig, 2019). E por fim a componente prescritiva, incluída recentemente em estudos sobre a imagem de um destino, corresponde à reacão dos visitantes perante a imagem realizada de um destino. Neste estudo é medida como o comportamento que sugere possível recomendação e/ou futura re-visita (Martín & Bosque, 2008); (Kladou & Mavragani, 2015); (Shankar, 2018); (Marine-Roig, 2019).
2.2. User Generated Content
Uma das principais fontes de informação para o setor do turismo (Buhalis & Amaranggana, 2014) encontra-se na enorme quantidade de conteúdo criado por utilizadores (UGC) nos vários canais das mídias sociais (social media). Para o turista, o UGC é aceite como informação de apoio para desenvolverem os seus planos de viagem e auxiliá-los na tomada de decisão de viagem (Xiang & Gretzel 2010). Além disso, é considerado um método altamente confiável para obtenção de informação instantânea (Gretzel & Yoo, 2008); (Yoo et al., 2009), uma vez que os utilizadores podem procurar informações e interagir com outras pessoas com ampla dispersão (Nezakati et al., 2015); (Kaosiri et al., 2017).
Tendo em conta a importância deste conteúdo para os visitantes, as organizações e agentes do turismo devem ser capazes de recolher esta enorme quantidade de dados (Big Data) e aplicar técnicas de análise para promover o aumento da eficiência operacional, a inovação dos serviços, a dinamização dos modelos de negócio e a melhoria da experiência turística para os visitantes (Gretzel & Yoo, 2008); (Buhalis & Amaranggana, 2014); (Marine-Roig, 2019).
As online travel reviews - OTR´s, e classificações de produtos, serviços e empreendimentos representam a fonte mais prevalente e acessível de UGC no turismo (Gretzel & Yoo, 2008). De acordo com (Kaosiri et al., 2017) os comentários de utilizadores servem dois propósitos funcionando, simultaneamente, com um caracter informador, na medida em que providenciam informação na óptica do utilizador de um produto, e ainda como método de recomendação, ao fornecer uma plataforma que permite aos consumidores expressarem o seu grau de recomendação ou contentamento com um produto, estabelecimento, serviço, ou mesmo destino, sob a forma de electronic word of mouth (eWOM). Segundo Marine-Roig (2019) essa fonte de informação pode ser considerada o principal atributo de um destino, ultrapassando a crença anterior de que eram as atrações de um destino que constituíam o elemento decisivo na motivação de visita por parte dos turistas.
3. Metodologia e Região de estudo
3.1. Região de estudo
Segundo os dados fornecidos por World Travel & Tourism Council (WTTC, 2019) a contribuição total em 2018 do sector turístico para o produto interno bruto (PIB) português foi de 19,1%, ou seja, quase um quinto do PIB do país. O impacto causado por chegadas internacionais foi de 20,6 mil milhões de euros, ou cerca de 23,1% das exportações do país. A mesma organização estima que a indústria turística é ainda responsável por cerca de 21,8% da empregabilidade total de Portugal.
Lisboa por si só foi, em 2018, responsável por mais de 1/4 de todas as dormidas nacionais (25,9%) e quase 1/3 da totalidade de hóspedes (29.9%). Quando isolamos o outbound tourism (turismo internacional), a região foi responsável por 36% da totalidade de hóspedes e quase 29% das dormidas (INE, 2018). Lisboa assume-se como uma ferramenta de combate à sazonalidade turística nacional uma vez que cerca de dois terços das dormidas em Lisboa ocorre entre os meses de Setembro e Junho, fora do período sazonal, e possui uma vulnerabilidade turística inferior à do resto do país (Nunes, 2017); (Silva, et al. 2018).
A entidade responsável pelo turismo da região de Lisboa (Associação Turismo de Lisboa), divide a região por 5 centralidades (zonas), Lisboa, Sintra, Cascais, Arco do tejo e Arrábida, as quais vão ser estudadas ao longo do artigo de forma isolada e em grupo.
3.2. Descrição geral
Para revelar a imagem turística de Lisboa, foi seguida a metodologia proposta por (Marine-Roig & Clavé, 2015). São por isso segmentadas as 4 etapas fulcrais que antecedem os resultados do estudo, sendo: Seleção dos websites e plataformas a utilizar; Recolha de dados e construção de base de dados primária; Fase pré-processamento, que vai englobar toda a filtragem, gestão e organização dos dados e vai resultar na construção de uma segunda base de dados (corpus); e Fase analítica, onde vão ser utilizados métodos quantitativos que vão potenciar o objetivo principal do estudo.
3.3. Seleção da plataforma
A plataforma escolhida para o estudo foi o TripAdvisor, considerada a plataforma de maior visibilidade, popularidade e tamanho (Baka, 2016); (Marine-Roig, 2017;2019) do setor de viagens e turismo. Criada em 2000, está presente em 49 países e em 28 idiomas, tem cerca de 460 milhões de visitantes mensais e mais de 830 milhões de avaliações e opiniões sobre a indústria turística mundial (TripAdvisor LLC, 2017).
As OTRs do TripAdvisor estão organizadas consoante a sua natureza e localização. Neste estudo foram consideradas OTRs de Restaurantes, Atividades e Alojamentos. O TripAdvisor engloba ainda outras naturezas que, por não serem fontes de OTRs (Airlines, Rent a car, fóruns de pergunta e resposta) não foram considerados neste estudo.
3.4. Recolha de dados e construção de base de dados primária
Para extração de dados (data scrapping) foi utilizada a ferramenta R software, que permite a pré-filtragem do que é extraído. Como tal todo o conteúdo não criado pelo utilizador não é considerado, e seu download não é realizado.
Para construção da base de dados primária, com todos os URLs (Uniform Resource Locator - Endereço de rede) que continham reviews da região de estudo foi utilizado o pacote RCrawler. Todas as páginas do TripAdvisor têm o seu propósito indicado no URL no seguimento do domínio (“https://www.TripAdvisor.com”). As páginas que contém OTRs apresentam sempre o código “\ShowUserReviews” que constituiu o filtro final para agregar todas as páginas com OTRs de todas as localizações através das ferramentas linkextractor e rcrawler.
Durante a construção da base de dados primária a região de estudo foi dividida por centralidade e microcentralidade e os dados foram processados de acordo com a região correspondente no TripAdvisor. Só foram consideradas localizações com número de OTRs superior a 100. Foram criados 3 vetores de listas de URLs de OTRs para cada natureza (OTRs de Restaurantes, de Alojamentos e de Atividades).
3.5. Pré-processamento
Pela sua natureza, o TripAdvisor agrega resultados de localizações não só da região em específico como também possui um algoritmo para dispor os resultados que a plataforma considera “perto” ou “sugestivos” ou ainda páginas promovidas. Assim, paralelamente à formação da base de dados primária foram eliminadas possíveis duplicações de URLs e feita uma correspondência exata da localização a considerar.
Para cada uma das naturezas descritas no ponto anterior foi feita nova pré filtragem para respeitar a metodologia proposta. Neste sentido, foram criados 3 parâmetros de filtragem, sendo:
Data: A amostra foi filtrada para devolver apenas reviews de 2019;
Linguagem: Por ser a língua estrangeira mais frequente da plataforma, apenas OTRs em inglês foram consideradas;
Tamanho: Para harmonizar a análise quantitativa as amostras foram reduzidas a um número comum às 3 naturezas. 17.000 reviews de cada natureza foram considerados.
Na fase de data scrape da página web foram consideradas três fontes de conteúdo relevante para o estudo em cada um dos resultados da base de dados primária:
HTML1metadata: consiste na informação de uma webpage a ser lida pelo browser. A metadata de cada URL da base de dados primária, no TripAdvisor contém o título da review (inclui localização e título escrito); o coding da página (protocolo http2, tipo html) e a linguagem da página. O próprio URL, que faz parte da metadata, revela também o código interno da localização; o código interno do alojamento, restaurante ou atividade; o código único da OTR; o nome interno do alojamento, restaurante ou atividade; a localização e o nome da região em que se enquadra.
Corpo de Texto: a parte mais importante da OTR. Trata-se da componente escrita pelo visitante, a sua opinião e experiência expressa no título e comentário.
Elementos paratextuais: Todos os elementos que, não fazendo parte do corpo de texto, são considerados para análise da imagem de um destino turístico. Nomeadamente a classificação dada; a localização do alojamento, restaurante ou atividade; a data da review; a linguagem ou os dados sociodemográficos do reviewer.
Foi feito um webscrapping dos elementos acima mencionados utilizando o pacote rvest e criada uma base de dados secundária, denominada corpus que constituiu uma tabela com os seguintes elementos: URL; nacionalidade e localidade do reviewer (quando possível); classificação da review; data da OTR; nome do recurso; categoria do recurso (para restaurantes e atividades); classificação geral do recurso (para alojamentos); localização do recurso; linguagem; título e corpo de texto.
Tal como sugerido por (Welbers, et al., 2017) os elementos textuais da base de dados (Título e Corpo de Texto) foram ainda preparados para uma posterior análise quantitativa fundamentada no uso do pacote quanteda.
Foram realizadas operações de string (String é uma sequência de caracteres que representam texto) para retirar todo o conteúdo genérico que pudesse aparecer (ex. “Este texto foi traduzido pelo Google”); remover todo o whitespace (espaço que facilita a leitura como parágrafos ou avançamentos de texto); padronizar todas as palavras em minúsculas para que não houvessem erros de contagens; fazer um stemming do texto (Stemming é uma técnica que reduz as palavras a uma forma comum a todas as terminações morfológicas e sufixos); e remover todas as stopwords (conjunto de palavras que são apenas conectores ou separadores de palavras e pontuação). Por fim foi realizado o Tokenization dos dados - processo de separar o texto em tokens ou elementos individuais. Estes elementos são palavras simples ou palavras compostas tais como “long-term”.
3.6. Fase Analítica
Inicialmente foi criada uma tabela de frequências de todos os tokens através do pacote quanteda, nomeadamente a função DTM (Document term matrix), que produz uma matriz na qual as linhas são elementos, as colunas são termos e as células indicam o número de repetições por documento.
Sequencialmente, na análise estatística quantitativa, as palavras mais vezes repetidas foram consideradas. Estas foram categorizadas de forma exaustiva, mutuamente exclusiva e independente (Stepchenkova, 2012). As 5 categorias criadas, num momento a priori, de acordo com o modelo proposto por Marine-Roig, 2019), foram:
1. Atrações, Estruturas e Serviços:
Foi efetuado uma análise quantitativa aos reviews e menções dos estabelecimentos e categorias em que se inserem, uma vez que, um maior número de OTRs num local indica uma maior popularidade desse estabelecimento ou atração/atividade dentro do panorama da região. Para esta categoria foi utilizado um método dedutivo de contagem relativa e absoluta dos termos únicos textuais das OTRs (Welbers, et al., 2017).
2. Dimensão Espaciotemporal:
Os recursos do TripAdvisor permitem recolher o local da atração, serviço, estabelecimento ou atividade que está a ser comentado. É por isso possível ver a sazonalidade das reviews por microcentralidade, natureza ou geral, e perceber ainda a evolução da eWOM que certas regiões tiveram ao longo do período de estudo ou quais regiões estão a ter um maior influxo de comentários ao longo do tempo.
3. Dimensão Avaliativa:
Todas as OTRs da plataforma TripAdvisor têm uma classificação entre “Terrível” e “Excelente” numa escala de 1 a 5, respetivamente. De acordo com o modelo proposto por Marine-Roig (2019) a análise irá utilizar dois tipos de métricas diferentes:
Score médio: São consideradas avaliações positivas (score +) as avaliações de “excelente” (5) e “muito bom” (4) e avaliações negativas (score -) as avaliações “Fraco” (2) e “Terrível” (1). As avaliações de score médio (3) não alteram a escala. É analisada em valor percentual face à amostra.
Média ponderada: a segunda métrica constitui uma média ponderada através da conversão das avaliações numa escala de 10 valores em que: “Excelente” = 10; “Muito bom” = 7,5; “Médio” = 5; “Fraco” = 2,5; “Terrível” = 0.
4. Dimensão afetiva:
A análise de sentimentos tenta deduzir o sentimento de uma review com base nas palavras e expressões que são utilizadas para descrever uma experiência. Classifica-se por isso como um mecanismo de avaliação dedutiva uma vez que a polaridade de uma palavra é ditada por um conjunto de regras pré-concebidas (Welbers, et al., 2017).
Para a análise de sentimentos foi utilizada a ferramenta sentimentr que, através da utilização de dicionários integrados no pacote, interpreta as frases do corpus, equacionando expressões que mudem a polaridade geral de uma frase, intensificando o seu significado ou alterando-o. Na língua inglesa, estas expressões são denominadas de valence shifters, e incluem, negators, amplifiers (intensifiers), de-amplifiers (downtoners), adversative conjunctions entre outros (Rinker).
Para um cálculo mais real da análise de sentimentos, foi utilizado uma ferramenta para ponderação das médias denominado average_weighted_mixed_sentiment. Esta função é aconselhada na análise de textos com várias frases curtas de carácter opinativo. Nestas condições é frequente assistir a um conjunto de frases positivas ou neutras precederem uma frase negativa no sentido de a atenuar. A fórmula equaciona esta possibilidade atribuindo um peso ligeiramente superior às frases negativas e baixando o peso das frases neutras (Rinker).
5. Dimensão de atitude e comportamento
Tal como na Dimensão Afetiva (4) para analisar o grau de recomendação de uma review foi utilizado o pacote quanteda e sentimentr. Ao contrário da dimensão anterior foi criado um dicionário próprio para a análise, que contém listagens de tokens sugestivos de recomendações positivas (do not miss, don't miss, worth a visit, etc.) e negativas (avoid, be careful, beware, etc.). O dicionário utilizado surgiu da adaptação do proposto por (Marine-Roig & Ferrer-Rosell, 2018). A palavra “recommend” e derivados como “recommended” e “recommendation” foram analisadas isoladamente e cruzadas com a polaridade da frase dada pela ferramenta sentimentr para haver um escrutínio mais rigoroso da intenção de recomendação ou não, através da polaridade da frase.
4. Resultados
4.1. Amostra
Ao todo foram considerados 51.000 reviews, com uma distribuição em pelo menos 131 nacionalidades sendo que os 10 países mais intervenientes são, respetivamente: Estados Unidos (9726); Reino Unido (8663); Portugal (2715); Canadá (1978); Irlanda (1363); Austrália (1246); Singapura (834); Países Baixos (819); Alemanha (819) e Espanha (567).
Os comentários em si refletem uma predominância nas palavras relacionadas com alojamento (Tabela 1) sendo que hotel (24129), room (21777) e stay (14928) encontram-se, respetivamente no rank 1, 3 e 9 das palavras mais mencionadas. Os comentários refletem maioritariamente palavras com entoação positiva, great (22323), good (19670), frien(ly) (13109), nice (13043), love (11462).
Keyword | Contagem | Keyword | Contagem | ||||
---|---|---|---|---|---|---|---|
Palavras únicas: 55,084 | Total palavras: 3,981 milhões | % | Palavras únicas: 55,084 | Total palavras: 3,981 milhões | % | ||
1 | Hotel | 24129 | 0,606% | 11 | Restaur | 14572 | 0,366% |
2 | Great | 22323 | 0,561% | 12 | Recommend | 14104 | 0,354% |
3 | Room | 21777 | 0,547% | 13 | Friend | 13109 | 0,329% |
4 | Good | 19670 | 0,494% | 14 | Nice | 13043 | 0,328% |
5 | lisbon | 17792 | 0,447% | 15 | Time | 12026 | 0,302% |
6 | Food | 17209 | 0,432% | 16 | One | 11467 | 0,288% |
7 | Staff | 16745 | 0,421% | 17 | Love | 11462 | 0,288% |
8 | Place | 15661 | 0,393% | 18 | Servic | 11338 | 0,285% |
9 | Stay | 14928 | 0,375% | 19 | Tour | 11193 | 0,281% |
10 | Us | 14851 | 0,373% | 20 | Day | 11013 | 0,277% |
4.2. Imagem Designativa
Quanto às OTRs da natureza das Atividades, no Top 10 constam apenas atividades da microcentralidade Lisboa, referente a locais e monumentos da cidade (Tabela 2). Entretanto, foram também referenciadas duas empresas de fornecimento de tours, a Discover Lisbon (466) e Withlocals (321) e o serviço de transporte público Tram 28 (534) como atividades a realizar na localidade. A atração Time Out Market Lisboa foi a mais comentada da amostra.
Nome da Atividade | Localização | Contagem | Tipo de Atividade / Produto |
---|---|---|---|
Time Out Market Lisboa | Lisbon | 947 | Cooking Classes, Points of Interest and Landmarks |
Castelo de S. Jorge | Lisbon | 650 | Historic Sites, Castles |
Torre de Belem | Lisbon | 610 | Points of Interest and Landmarks |
Tram 28 | Lisbon | 534 | Tramways |
Mosteiro dos Jeronimos | Lisbon | 498 | Historic Sites, Architectural Buildings, Sacred and Religious Sites |
Discover Lisbon | Lisbon | 466 | Walking Tours, City Tours, Night Tours, Bar, Club and Pub Tours, Sightseeing Tours More |
Oceanario de Lisboa | Lisbon | 459 | Aquariums |
Alfama | Lisbon | 445 | Neighborhoods |
Praca do Comercio (Terreiro do Paco) | Lisbon | 338 | Points of Interest and Landmarks |
Withlocals | Lisbon | 321 | Food Tours, Wine Tours and Tastings, Private Tours, City Tours, Sightseeing Tours More |
Foram contabilizados 278 tipos de atividades diferentes na região. É importante realçar que cada recurso desta natureza no TripAdvisor tem associada, geralmente, múltiplos tipos de atividade. Espantosamente, na análise realizada, o tipo mais comum de atividade citada pelos visitantes são os tours, cujas variedades somam 12 dos 20 tipos de atividades mais comuns. Dentro do mesmo Top 20 incluem-se ainda atividades relacionadas com monumentos e património e atividades relacionadas com gastronomia e bares.
No que diz respeito aos restaurantes, 18 dos 20 mais mencionados estão localizados na centralidade de Lisboa, sendo os dois restantes na localidade Sintra. Sem grande surpresa os restaurantes com gastronomia European (9895), Mediterranean (9187) e portuguese (5706) completam as três categorias mais comentadas pelos utilizadores da plataforma (Tabela 3).
Região | País | Culinária | ||||||
---|---|---|---|---|---|---|---|---|
European | 9895 | 21,0% | Portuguese | 5706 | 12,1% | Seafood | 3194 | 6,8% |
Mediterranean | 9187 | 19,5% | Italian | 1284 | 2,7% | Vegetarian | 2509 | 5,3% |
International | 2150 | 4,6% | Indian | 1241 | 2,6% | Contemporary | 1135 | 2,4% |
Asian | 911 | 1,9% | American | 504 | 1,1% | Healthy | 894 | 1,9% |
Middle Eastern | 141 | 0,3% | Nepali | 429 | 0,9% | Vegan | 781 | 1,7% |
Quanto aos OTRs referentes à natureza Alojamento todos os alojamentos do Top 20 são localizados em Lisboa. A totalidade da Amostra da natureza de Alojamentos tem 1066 alojamentos dos quais quase 50% tem classificação igual ou superior a 4,5 pontos no TripAdvisor. A média de classificação do TripAdvisor para esta natureza é de 4,05 pontos.
A amostra recolhida revela que os trimestres com maior incidência de reviews são o terceiro (15.937) e o segundo (14.313) que corresponde ao período entre abril e setembro, inclusivamente, com julho, outubro e setembro a serem os meses com maior afluência de OTRs, respectivamente. A região de estudo tem 58 localizações do TripAdvisor afetas. Destas, a amostra aleatória recolheu OTRs de 54, com as seguintes localizações a não estarem representadas na amostra: Póvoa de Sta. Iria; Pegões; Samouco e Cajados. A metrópole, Lisboa, detém a grande maioria dos reviews sendo responsável por 67% de todos os comentários de restaurantes, e 86% de alojamentos e atividades.
4.3. Imagem Estimativa
A (Tabela 4) revela a dimensão avaliativa da amostra. Regra geral, as classificações das naturezas são bastante positivas, especialmente no que diz respeito às OTRs das Atividades e dos Restaurantes.
Ao analisar a amostra foi possível constatar que embora a média ponderada e o score das atividades seja, no geral, a mais elevada da amostra, o Top 5 de atividades mais comentadas não seguiram a tendência das restantes ao apresentar classificações abaixo da média (Time out market, Castelo são Jorge, Torre de Belem, Tram 28 e Mosteiro dos Jerónimos, respectivamente), especialmente o recurso Tram 28, que apresenta uma média ponderada de apenas 7,36 e um score negativo superior a 11%.
Score + | Neutro | Score - | % Score + | % Score - | Média Ponderada | |
---|---|---|---|---|---|---|
Restaurantes | 15115 | 752 | 1133 | 88,91% | 6,66% | 8,82 |
Alojamentos | 14580 | 1244 | 1176 | 85,76% | 6,92% | 8,52 |
Atividades | 15191 | 1072 | 737 | 89,36% | 4,34% | 8,84 |
A (Tabela 5) representa a análise sentimental descrita em 3.6 por centralidade. É possível constatar que os comentários têm frases geralmente positivas, com destaque para a centralidade de Lisboa que tem a pontuação mais elevada de sentimentr geral (0,234). De realçar ainda que, embora tenha uma contagem de palavras relativamente reduzida, a centralidade do Arco do Tejo apresenta valores negativos na análise sentimental aos comentários relativos a Alojamentos e Atividades, representando as únicas médias negativas da amostra.
Centralidade | Natureza | Contagem palavras | Sentimentr | Sentimentr agregado |
---|---|---|---|---|
Arco do Tejo | Atividades | 1436 | -0,074 | 0,162 |
Alojamentos | 1129 | -0,204 | ||
Restaurantes | 7323 | 0,225 | ||
Arrábida | Atividades | 20131 | 0,283 | 0,230 |
Alojamentos | 25225 | 0,220 | ||
Restaurantes | 41654 | 0,212 | ||
Cascais | Atividades | 48437 | 0,246 | 0,216 |
Alojamentos | 138191 | 0,201 | ||
Restaurantes | 184336 | 0,219 | ||
Lisboa | Atividades | 975942 | 0,222 | 0,234 |
Alojamentos | 1522263 | 0,211 | ||
Restaurantes | 695365 | 0,290 | ||
Sintra | Atividades | 101846 | 0,141 | 0,186 |
Alojamentos | 103958 | 0,187 | ||
Restaurantes | 109258 | 0,219 |
A ferramenta Sentimentr contabilizou, no geral, um total de 290.885 frases, das quais 210.119 têm uma polaridade positiva, 44.039 tiveram uma atribuição de score ou carácter neutro, e 36.727 têm uma polaridade negativa. Os restaurantes registam a melhor percentagem de frases com polaridade positiva, e, sem surpresa, são também a natureza que apresenta melhor índice de análise sentimental (Tabela 6).
4.4. Imagem Prescritiva
Quanto à imagem prescritiva, que tem em consideração a possível recomendação e/ou futura re-visita de um destino turístico, foram contabilizadas um número de recomendações positivas muito superior às recomendações negativas. Na totalidade, quase 4% do total de frases da amostra contém recomendações positivas, e menos de 0,3% das frases tem recomendações negativas o que favorece a recomendação positiva. Quando analisamos ao nível das reviews, 1 em cada 5 (20,8%) contém recomendações positivas, contrastando com a percentagem de recomendações negativas de 1,4% (Tabela 7).
Recomendações positivas | Recomendações negativas | |
---|---|---|
Contagem | 11217 | 844 |
% relativa ao n( frases | 3,825% | 0,274% |
% relativa ao n( reviews | 20,820% | 1,424% |
Quanto à imagem prescritiva por natureza, tal como na imagem estimativa os restaurantes têm o melhor rácio de recomendações positivas por frase (5,037%) e por review (22,518%) assim como têm o mais elevado número absoluto de recomendações positivas por review e total (Tabela 8).
5. Discussão e Conclusões
A pandemia Covid-19 teve um impacto sem precedentes no setor turístico em Portugal, sendo responsável por perdas elevadas de receita e inúmeros postos de trabalho. Torna-se por isso indispensável que o país reaja e aplique recursos para melhorar a sua imagem e atratividade de forma sustentável, e que projete a reforma do setor, responsável por quase 1/3 do PIB nacional. Sigala (2020) afirma que o conhecimento e gestão de uma TDI vai ser essencial nas fases de resposta e recuperação à pandemia. Nesse sentido o presente estudo teve como objetivo revelar qual a imagem da região de Lisboa através da utilização de UGC.
Para concretizar este estudo foram analisados 51.000 OTRs da plataforma TripAdvisor, escritos na língua inglesa no ano de 2019, por mais de 130 nacionalidades. Para harmonizar a análise estatística foram recolhidos valores iguais de cada uma das naturezas dos recursos da plataforma (Atividades, Alojamentos e Restaurantes). O modelo de análise foi baseado no extenso trabalho de Marine-Roig, investigadora da universidade de Lleida na Catalunha e descrito no capítulo “Metodologia e Região de estudo”.
Considerando o objetivo geral deste estudo pode dizer-se que, na generalidade, a imagem turística da região de Lisboa de 2019 é bastante positiva em todas as naturezas e, especialmente, no que diz respeito aos restaurantes. As recomendações positivas são muito mais frequentes que as negativas.
Existe na imagem da região turística de Lisboa uma predominância no número de reviews na metrópole. Ao todo a centralidade de Lisboa detém 80% dos OTRs da Amostra, com as centralidades Cascais (10%), Sintra (8%), Arrábida (2%) e Arco do Tejo (0,3%) a seguirem-se.
No que diz respeito às Atividades, a Amostra conclui que, embora apresentem o melhor score (89,36% positivo) e resultado da média ponderada (8,84/10), têm o segundo melhor índice de Sentimentr (0.22) e não são a natureza com melhor índice de recomendação. Esta análise parece revelar que não existe uma relação direta clara entre estes elementos da imagem e demonstra ainda que, embora a satisfação com esta natureza é a mais evidente através da pontuação dada, a intensidade dos comentários parece ter uma polaridade inferior à das restantes naturezas. Da mesma forma, a natureza parece ter menos capacidade de cativar a lealdade dos visitantes que os restaurantes, e menos expressões de recomendação positiva são usadas. É também importante realçar a prevalência dos tours na imagem designativa da Amostra, não só pelo número de comentários que lhe são afetos como também por serem o tipo de atividade mais comum e por parecerem ser o tipo de atividade que melhor pontua na imagem estimativa. É relevante por isso realçar o papel que as atividades desta natureza têm na ótica do visitante da região. As atividades mais populares parecem manifestar scores positivos e médias ponderadas abaixo da média, com todo o top5 de recursos mais visitados a respeitar esta tendência.
A natureza dos Alojamentos é a natureza com maior volume de frases nas suas OTRs (125,221), o que indica que os visitantes parecem escrever maiores reviews nesta categoria. A imagem designativa demonstra a importância que o pequeno-almoço tem nestes estabelecimentos com a palavra breakfast a ser a quinta mais mencionada nos comentários (10,163). Embora tenham maiores comentários, o índice de recomendação (4.279% das frases) o valor de sentimentr (0,209), e a média ponderada (8,52/10) são os mais baixos da amostra, o que parece revelar que os comentários têm uma polaridade menos intensa face ao resto da amostra e são, provavelmente, na sua maioria, descritivos. Os 1066 alojamentos da amostra têm uma classificação do tripadvisor elevada com quase 50% (49,43%) a registar um valor igual ou superior a 4,5. A média em 2019 parece aumentar face à geral uma vez que se registou um aumento na média de classificação dada nos reviews (4,437 vs. 4,5). Comparativamente à classificação geral dos alojamentos, a amostra de 2019 apresenta 72,60% de classificações dadas pelos reviewers iguais ou superiores a 4,5, o que pode levar a um aumento da classificação geral.
Os Restaurantes são a natureza com maior dispersão de comentários por centralidade, com Lisboa a assumir 67,1%. Têm também a segunda melhor média ponderada, muito próxima das atividades (8,82/10), o melhor índice de recomendação (4,8% das frases e 22,5% das reviews) e a melhor classificação de sentimentr (0,27). A imagem designativa demonstra a importância do serviço nesta categoria com as palavras friend(ly) (4,934) e staff (4301) a serem mencionadas no top10 e ainda o destaque para a palavra wine (4572) que parece ter também uma elevada importância nesta natureza. A gastronomia portuguesa tem um destaque na natureza (12%) e, olhando para a região do tipo de cozinha, sem surpresa, a região european (21%) e mediterranean (19,5%) são as mais representadas. No que diz respeito à culinária, parece haver uma clara predominância no número de reviews de restaurantes com opções de culinária de dieta e saudável, com os restaurantes com opções vegetarianas (5,3%), comida saudável (1,9%), opções vegans (1,7%) e glúten free (1,5%) a ocupar 4 dos 6 lugares cimeiros no top6 de culinárias. A culinária seafood é a mais mencionada em reviews.
No que diz respeito às centralidades, a metrópole, Lisboa, detém a melhor marca de imagem prescritiva (21,24% de reviews com recomendações positivas), a melhor média ponderada de classificação (9,02), e o melhor valor de sentimentr (0,234). É seguro por isso dizer que a região é largamente dependente da sua metrópole na sua eWOM e, por conseguinte, constitui o elemento âncora da imagem turística da região. As centralidades apresentam níveis de recomendação muito semelhantes, que oscilam entre 3% (Arco do Tejo) e 4% (Lisboa) das frases. Em relação às reviews, Lisboa apresenta 21,24% das reviews com recomendações positivas e apenas 1,39% com reviews negativas. No que diz respeito à análise do sentimento, Lisboa apresenta o valor mais elevado (0,234) com o Arco do Tejo a apresentar o lado oposto (0,162). De realçar ainda que o Arco do Tejo apresenta os únicos dois elementos negativos da amostra com as atividades e os alojamentos nesta centralidade a ter uma análise sentimentr de -0,07 e -0,20 respetivamente.
A amostra não parece apresentar uma sazonalidade muito elevada, visto que apresenta valores acima da média de reviews por mês (4250) entre abril e outubro, inclusive. Parece haver por isso um equilíbrio na criação de Tourism Generated Content (TGC) ao longo do ano com apenas o primeiro trimestre do ano a registar um valor inferior a 10,000 reviews.
O conhecimento desta imagem é essencial uma vez que permite combater a subjetividade da mesma dado o volume, variedade, velocidade, veracidade e valor que caracterizam o big data. O estudo do conteúdo criado por visitantes permite adaptações em tempo real por parte dos organismos regentes do turismo, gestores hoteleiros, turísticos, de museus ou de empreendimentos que dependam ou contem com a atividade, bem como o alargamento do conhecimento do seu mercado, da sua concorrência, e da sua própria atividade e evolução.
A imagem projetada por parte dos organismos turísticos, ou fontes inferidas, deve ter em consideração o presente estudo. Um futuro estudo por parte do Turismo de Portugal deve procurar cruzar a imagem conseguida em 2019 com o plano estratégico proposto para 2015 a 2019 (Turismo de Lisboa, n.d.). A organização pode medir a eficiência do seu plano e cruzar as medidas de desenvolvimento propostas por centralidade e geral com a eWOM na mesma. Também com o conhecimento criado pela exploração da imagem, um futuro estudo deve tentar perceber o que se passa com o top5 de atividades mais mencionadas uma vez que as mesmas apresentam scores médios muito abaixo da média da amostra seguindo a metodologia proposta em Marine-Roig & Clavé (2015).
Como sugestão para futuros investigadores parte ainda o desafio de relacionar os resultados aqui projetados com a realidade estatística da região em 2019. Um estudo com o intuito de cruzar dados reais com a imagem aqui produzida permitirá perceber o nível de relação entre as variáveis e explorar mais a fundo o grau de dependência entre a eWOM e a chegada/dormida de visitantes ou receitas. Parece ainda evidente que, na evolução do turismo nacional para uma smart destination, devem ser realizados estudos da imagem turística nas restantes regiões do país. O conhecimento criado por estes estudos torna-se indispensável nas regiões com maior preponderância turística como o Algarve e a Madeira, sobretudo na resposta à pandemia Covid-19.
Embora seja expectável haver uma maior concentração de OTRs na metrópole, os destination marketing organizations (DMOs) podem utilizar a imagem da região como uma fonte para dinamizar a oferta fora da metrópole. Por exemplo compreender os recursos mais apreciados pelos visitantes fora de Lisboa e promover os mesmos, ou explorar os recursos com maior classificação e com margem de crescimento sustentável, que provavelmente estão a ser subvalorizados pelos operadores turísticos. Combinar elementos de diferentes naturezas valorizadas para aumentar a diversidade, como por exemplo o aproveitamento do tipo de atividade mais utilizado - tours - para promover a natureza com maior preponderância fora da metrópole - restaurantes - e criar, por exemplo, tours gastronómicos às centralidades menos visitadas.
As várias categorias que cada recurso apresenta no TripAdvisor (ex. Restaurante: Shish - Gastronomia: Libanês, Fast food, Mediterrâneo, Médio Oriente) podem constituir um enclave no valor da análise uma vez que existe demasiada diversidade e subjetividade na categoria a que o recurso pertence, podendo por isso produzir resultados que não refletem necessariamente a amostra (Marine-Roig, 2019).
Outra das limitações do estudo é a margem de erro que os pacotes utilizados para a análise em R podem ter. A medição da polaridade de uma frase bem como da intenção de recomendar é uma das tarefas mais difíceis na análise de dados. Sobretudo no que diz respeito à intensidade do comentário ou aplicação de expressões de carácter irónico, sarcástico ou retórica.
Por fim, é também necessário mencionar a volatilidade que a pandemia covid-19 trouxe a estudos turísticos. A indústria encontra-se em mudança e reinvenção e, embora o conhecimento da imagem turística de um destino seja considerado um dos elementos chave na resposta à pandemia e relançamento da indústria (Sigala, 2020), a verdade é que deve haver uma perceção geral de que as expectativas turísticas devem ser reajustadas.