1. Introdução
A riqueza das sociedades contemporâneas dominadas pelo modo de produção capitalista apresenta-se-nos na forma de uma enorme acumulação de diferentes máquinas “inteligentes”1 que nos confrontam nas mais diversas esferas sociais da vida. Tal realidade social tende a reforçar a constatação de que “todas as nossas invenções e progresso parecem resultar em conferir vida intelectual às forças materiais e em estupidificar a vida humana numa força material” (Marx, 1856/2010, p. 656). Dito por outras palavras, somos cada vez mais confrontados com artefactos tecnológicos que parecem dotados de capacidades que, em contraponto, o ser humano parece estar a perder, seja no cálculo seja nas criações artísticas.
Face ao desenvolvimento das mais recentes tecnologias, especialmente as relacionadas com a inteligência artificial (IA), diversos autores têm tentado demonstrar que estas são produtos de um modo de produção específico, constituído por redes materiais, logo sociais2, complexas a uma escala planetária: as tecnologias ditas “inteligentes” funcionam tendo por base trabalhadores que selecionam e categorizam os dados essenciais ao seu funcionamento3 (Altenried, 2022; Cant et al., 2024; Crawford, 2021; Gray & Suri, 2019), a que se associam os contributos, raramente conscientes, de utilizadores nos espaços digitais, o que permite criar uma perceção ilusória no consumidor de que a máquina responde de forma mais eficiente e imediata do que qualquer outra entidade. No limite, estas máquinas saberiam melhor do que nós de que é que gostamos ou o que desejamos (Zuboff, 2018/2020). Outros autores têm tentado desmistificar estas capacidades “revolucionárias” - tanto na IA preditiva como na IA generativa ou nas aplicações à moderação de conteúdos4. Apresentando os pressupostos teóricos e as suas limitações técnicas, realçam também as diversas questões morais e políticas relacionadas com a automação de processos de tomada de decisão em áreas como a saúde e o controlo de fronteiras ou populacional ou a possibilidade de (re)produzirem desinformação, sublinhando que a utilização destas tecnologias reforça desigualdades sociais a diferentes níveis (classe, género, racial; Benjamin, 2019; Narayanan & Kapoor, 2024).
Assumindo que as tecnologias de IA têm um papel cada vez mais relevante na comunicação entre os seres humanos, e sendo necessário também considerar os seus impactos na ação comunicativa, segundo o sentido dado por Habermas (1981/2012), pretendemos analisá-las colocando a seguinte questão: quais são os modos de produção de dados que suportam o desenvolvimento das tecnologias de IA que aceleram a interação entre os humanos?
Mantendo o entendimento, até hoje não contestado por evidências empíricas robustas, de que a relação humano-máquina é, acima de tudo, uma relação humano-humano, já que ao “relacionar-se com a Máquina, o ser humano está, na realidade, a relacionar-se [de forma mediada] com outro ser humano, seja o criador, o utilizador ou o proprietário da máquina” (Azeri, 2024, p. iii), tentaremos contribuir para este debate que suscita o interesse de muitos na teoria social e comunicacional, no intuito de demonstrar a dimensão intrinsecamente social das bases de dados da IA. Tal implica a oposição a qualquer forma de neutralidade, em linha com os argumentos de Harvey (2018) sobre as técnicas. Para conhecer e compreender o quanto de social está incorporado nos dados, temos de escrutinar os modos de produção de conhecimento e seus efeitos na comunicação entre os humanos, marcada pela força crescente das tecnologias na vida social. Como notou Martins (2011), as inovações técnicas prometem, no entender de muitos, prover os computadores e outros artefactos tecnológicos de características específicas da vida e de competências até hoje só presentes nos seres humanos dotados de um cérebro singular do ponto de vista biológico5. Interpelando a própria noção de “humano”, tal contradiz a neutralidade destas tecnologias. Em linha com os argumentos de Harvey (2018) sobre as técnicas, também a IA envolve dilemas que suscitam confrontos políticos e morais, por exemplo em torno da sua finalidade: melhoramento humano ou, em contraponto, aumentação humana (Morozov, 2024)6.
2. A Historicidade do Conhecimento e a Produção do Mundo Humano
Afirmar que o ser humano é um ser social, mais do que significar que interage com outros seres humanos e participa numa dada cultura, implica reconhecer que a forma como pensa, comunica com os outros e se relaciona com o mundo à sua volta é resultado de um processo de socialização longo e complexo, que é historicamente situado. No mesmo sentido, a formação de consciência de si mesmo é resultado deste processo de incorporação de valores, normas e conhecimentos que estruturam uma dada cultura ou civilização humana e que estão materializados numa panóplia de artefactos culturais. Portanto, a análise do processo de produção e transmissão de conhecimento, bem como a forma como se comunica num dado contexto socio-histórico, é fundamental para compreender determinadas dinâmicas sociais contemporâneas, como é o caso da relação do humano com a máquina.
Atualmente, o processo de produção e transmissão de conhecimento está cada vez mais concentrado num conjunto pequeno de empresas que, em intensa competição, produzem e possuem tecnologias de IA generativa, e respetivas infraestruturas, tais como OpenAI (ChatGPT), Google (Gemini), Anthropic PBC (Claude), NVidia, Amazon, entre outras7. Só o futuro dirá como tal processo se irá desenvolver, mas pode-se afirmar que estas tecnologias têm vindo progressivamente a substituir outras formas de produção, de transmissão e de controlo de conhecimento, tais como as enciclopédias, os livros e artigos técnicos, os professores e as instituições de ensino, nos diferentes graus, ou mesmo os média, como a televisão, ou o YouTube. Já estes tinham vindo a substituir formas ditas “tradicionais”, como a oralidade ou as guildas, que se caracterizavam pela sua capacidade de controlar o conhecimento a um nível mais local e utilizando técnicas específicas de registo do conhecimento e da sua transmissão.
É interessante notar que alguns dos protagonistas das áreas que têm contribuído cientificamente para o desenvolvimento da IA consideram que a tecnologia que desenvolvem ou, de forma genérica, as tecnologias que caem nesta categoria constituem um caso de um ser senciente, racional, criativo8, inteligente, comunicativo9, entre outras características que genericamente conotamos como “humanas”. Se a reação entusiástica de um antigo engenheiro da Google ao desenvolvimento do programa LaMDA10 foi rapidamente criticada (e até gozada), o que dizer da posição de um dos cientistas que ganhou o Nobel da Física, em 2024, ao considerar que estas novas máquinas são inteligentes, têm experiências, tomam decisões e, no futuro, terão autoconsciência11? Ou do aclamado físico e cientista da cognição, Douglas Hofstadter, que perante um público de engenheiros da Google desabafou, confrontado com as evidências do que a IA tinha já conseguido completar (segundo os padrões dos cientistas): “acho muito assustador, muito perturbador, muito triste, e acho terrível, horrível, bizarro, desconcertante, que as pessoas se apressem cega e delirantemente a criar estas coisas” (Mitchell, 2019, p. 11).
Esta aparente antropomorfização das máquinas (conceito utilizado aqui em sentido lato) subjacente a este tipo de discurso é, em primeiro lugar, resultado, de forma bastante irónica, da mecanização do humano (Dupuy, 1994/2009; Gerovitch, 2002) e, mais concretamente, do entendimento segundo o qual a atividade de pensar (logo, de conhecer) diz respeito a uma “propriedade de uma certa classe de máquinas” (Dupuy, 1994/2009, p. 4), no qual o cérebro humano seria somente um dos tipos - detendo, até há pouco tempo, uma superioridade indiscutível em todos os domínios. Quer dizer, o paradigma teórico que caracteriza o pensamento de cientistas, no qual temos de incluir disciplinas como a ciência da computação ou da cognição, e de capitalistas é ora um materialismo cru - o ser humano reage a estímulos exteriores, isto é, numa linguagem computacional, a inputs - ora um idealismo - o humano compreende e transforma o mundo a partir de processos mentais. Ambos pecam, de certo modo, por um entendimento fetichista que reduz o ser humano ao seu cérebro e o separa de um corpo funcionante, e, mais concretamente, da vida social, das relações sociais, ou seja, ambos desprezam a dimensão ativa, criativa e transformadora da atividade humana. Além disso, em ambas as perspetivas, a criação de conhecimento é reduzida a procedimentos lógicos.
Mais do que a força constitutiva de metáforas que entendem o ser humano como uma máquina complexa e eficiente, ou da comunicação, enquanto mera transferência de informação em diferentes formatos (Gerovitch, 2002), ou somente uma falta de consenso ou definição concreta de determinados conceitos12, estamos perante um entendimento histórico específico do ser humano e das suas capacidades. Desta forma, entende-se a inteligência como sendo desprovida de materialidade e, deste modo, somente enquanto “propriedade da manipulação formal de símbolos em vez da interação no mundo da vida humana” (Hayles, 1999, p. xi). Por outras palavras, ocorre um corte radical, que pode ser remontado à tradição do pensamento ocidental, entre os “corpos representados” e os “corpos em ação”, o que implica uma transformação da questão “quem pode pensar” para “o que pode pensar” (Hayles, 1999, pp. xiii-xiv)13. Veja-se que as mais recentes materializações de IA para o grande público são representações de figuras femininas, como o caso do robô Sofia (e podemos acrescentar a tecnologia Siri da Googe ou Alexa da Amazon): a escolha da figura feminina, que transmite uma ideia sedutora ou apaziguadora destas tecnologias em contraposição com as representações da cultura pop (por exemplo, Terminator), deve-se unicamente a uma questão de forma (representação) e não de conteúdo (a identidade do sujeito que comunica). No mesmo sentido, o conhecimento é reduzido a informação (independente do meio) e esta entendida enquanto uma entidade com existência própria - capaz de “circular sem alterações entre diferentes substratos materiais” (Hayles, 1999, p. 1; seja o cérebro, folhas de papel, infraestruturas digitais, áudio, imagem, etc.)
Chegados aqui, torna-se mais fácil compreender que os diversos discursos que marcam a história da IA até à contemporaneidade ignoram recorrentemente uma dimensão central do ser humano:
sonhando com uma máquina pensante que é tão perfeita, ou mesmo mais perfeita, que o humano, muitos cibernéticos procederam [nas suas formulações] a partir da noção que é o cérebro que pensa. Consequentemente, imaginaram que é suficiente construir um modelo de um cérebro para alcançar também um pensamento artificial. Infelizmente, não [é assim que acontece]. Porque não é o cérebro que pensa, mas o humano com a ajuda do cérebro. (Ilyenkov et al., 2024, p. 157)
Se é verdade que é indispensável uma base material para o ser humano pensar, mais concretamente um cérebro (fisiologicamente) saudável e um conjunto de órgãos sensoriais (Ilyenkov et al., 2024), tal não é suficiente, pois um desenvolvimento fora da sociedade resulta na criação de “Mowglis” e “Tarzans” (Last, 2024), isto é, seres que se desenvolvem unicamente em contacto com animais (não-humanos). Tais casos, que contribuíram no século XIX para o desenvolvimento de questões importantes em torno das qualidades específicas do ser humano, demonstram que o ato de pensar não está “codificado” geneticamente no ser humano, mas é adquirido através de um processo de socialização geracional (portanto, dos mais velhos para os mais novos), desde a mais tenra idade, de modo a incorporar (ou internalizar) um sistema de normas, valores e necessidades sociais14 (Bakhurst, 1991; Ilyenkov et al., 2024). Para tal, é necessário que a criança entre em contato, de forma ativa, com as diferentes formas que constituem o mundo dos objetos da sua comunidade (no fundo, todo o tipo de artefactos culturais). Ou seja,
a habilidade para usar o próprio cérebro para pensar - bem como as próprias mãos para produzir e a própria língua para falar - é, do início ao fim, cem por cento, um produto social. ( … ) [Tal habilidade] não é definida pela organização morfológica do corpo do indivíduo em si mesma, mas pela organização daquele sistema enormemente complexo que, na linguagem científica, é denominada de “totalidade das relações sociais entre pessoas”. (Ilyenkov et al., 2024, p. 159)
Uma das consequências imediatas desta perspetiva é que o indivíduo não é uma entidade autónoma, passível de ser analisada por si mesma, mas corresponde a um “órgão do sistema”, isto é, uma parte participante da totalidade social. Isto significa que existe uma ligação íntima entre o indivíduo e a sociedade na qual se desenvolveu. O momento de união destes polos distintos (indivíduo-sociedade) é a atividade social, mais concretamente, a produção de objetos: dos mais elementares (uma colher, por exemplo) até aos mais complexos (uma estação espacial ou uma obra de arte). Portanto, nas suas mais diversas atividades,
os seres humanos criam e sustentam um ambiente escrito com significado; cuidam de um mundo enriquecido com propriedades ideais, com valor e significado. Este é o mundo que conhecem. Realmente, somente um mundo idealizado pode ser conhecido, pois somente tal mundo pode ser complementado por um sujeito capaz de reproduzi-lo em pensamento e experiência. (Bakhurst, 1991, p. 217)
O mundo que conhecemos é, portanto, uma realidade socialmente mediada, mesmo quando observável a partir de uma panóplia de artefactos tecnológicos, como os utilizados na produção de conhecimento científico. Tal se deve ao facto de os seres humanos, num dado agrupamento social, dotarem “o mundo material com uma nova classe de propriedades que, apesar de nos deverem a sua origem, adquirem uma presença duradoura na realidade objetiva, começando a existir de forma independente dos indivíduos [como o caso das leis, normas, teorias científicas, valores, visões do mundo, etc.]” (Bakhurst, 1991, pp. 179-180).
Deste modo, a produção de objetos pode ser entendida segundo o processo de idealização, isto é, uma “espécie de selo impresso na substância da natureza pela atividade social da vida humana” (Ilyenkov, 2014, p. 58) que não pode ser reduzido a um fenómeno de consciência, muito menos a uma ilusão ideológica. Pelo contrário, os artefactos culturais adquirem significado pelo facto de serem “criado[s] enquanto encarnação de um propósito e ao ser[em] incorporado[s] na nossa atividade de vida de uma determinada forma” (Bakhurst, 1991, p. 182), com uma razão e um fim.
Da mesma forma, podemos analisar a produção da linguagem: as palavras, que não se esgotam na sua materialização em papel ou em linhas de código numa linguagem computacional15, estão intimamente relacionadas com a atividade humana, com aquilo que realizamos, com a forma e as intenções com que transformamos a natureza de acordo com as necessidades historicamente localizáveis - portanto, com a forma como participamos no mundo. Por esta razão, neste processo o ser humano torna a natureza numa “objetivação de si próprio” (Marx, 1932/1994, pp. 67-68), isto é, o ser humano vê-se a si próprio no mundo que criou e adquire autoconsciência (Bakhurst, 1991).
No entanto, se a autonomização dos artefactos culturais faz parte da própria reprodução de uma dada cultura, isto é, pela sua constante utilização nas mais variadas atividades ao ponto de as gerações mais recentes incorporarem de forma mais “natural” determinadas visões do mundo (por exemplo, uma dada história de um povo, categorias como espaço e tempo, formas de comunicar uma ideia e, consequentemente, de interagir), tal processo desenvolve-se de forma particularmente perversa no capitalismo. Devido ao facto de a distribuição dos recursos se reger segundo a lógica da posse privada dos meios de produção, a criação de artefactos culturais dos mais variados tipos assenta no desconhecimento dos indivíduos, logo na sua alienação. O contacto que temos quotidianamente com as novas tecnologias ocorre “magicamente” de forma mediada no mercado (nas prateleiras dos centros comerciais ou das lojas online). No mesmo sentido, o conhecimento da civilização humana aparenta estar à distância de um clique. Não menos importante, no limite participamos no desenvolvimento de novas tecnologias como a IA sem nos apercebermos, num gesto inconsciente de “dádiva”16: ao fazermos pesquisas na internet, ao pedirmos conhecimento para realizar uma dada tarefa (por exemplo, para escrever um ensaio ou um artigo), ao publicarmos uma fotografia catalogando-a (por exemplo, #família, #carro) ou mesmo quando clicamos nas fotografias de bicicletas ou de gatos para podermos entrar num site (e assim “provarmos” que não somos robôs ao reCAPTCHA da Google; Crawford, 2021).
3. Catalogar e Arquivar o Conhecimento: A Objetivação do Mundo na Produção de Inteligência Artificial
Se até à década de 70 do século XX, os investigadores tentaram criar máquinas que simulassem alguma capacidade humana (mais concretamente, e não por caso, um trabalho ou uma tarefa específicos), tendo por base um programa de regras que tinha por objetivo “reduzir o campo de ações possíveis articulando formas de raciocínio lógico” (Crawford, 2021, p. 99), como determinados princípios linguísticos, posteriormente perceberam que tal conceptualização não tinha sucesso no mundo real em que os eventos se caracterizam por uma enorme incerteza e complexidade. De facto, a comunicação em diferentes contextos implica diferentes registos (uns em papel, outros face a face, etc.), diferentes construções frásicas, vocabulário, tom, sotaque, expressões faciais e idiomáticas, entre outros elementos que fazem a interação comunicativa entre os humanos. Além disso, muita comunicação quotidiana não segue regras gramaticais normatizadas.
Outro ponto, não menos relevante, é que os seres humanos incorporam estas regras (mais ou menos formais) de forma inconsciente; é precisamente quando estão num contexto fora do habitual que têm mais consciência destas regras sociais.
Face a isto, em meados da década de 1980, os centros de investigação nas universidades e nas empresas começaram por focar-se numa perspetiva probabilística: no caso da produção de texto, qual a palavra mais provável a surgir, tendo em conta as palavras anteriores que formam uma dada frase17. Dito por outras palavras, com a aprendizagem automática (machine learning) não se pretende calcular “um padrão exato, mas a distribuição estatística do padrão” (Pasquinelli, 2019, p. 4). Por esta razão, podemos entender estes sistemas como “aparelhos que mapeiam e detetam padrões complexos, através de espaços vastos de dados” (p. 5) desenhando “uma função que descreve aproximadamente as suas tendências” (p. 11), através de um processo de interpolação (projeção e previsão de um output que está no intervalo de valores do input) ou de extrapolação (projeção e previsão de um output que está para além do intervalo de valores do input, o que aumenta a imprecisão dos resultados)18.
Esta perspetiva probabilística, que passou a dominar o desenvolvimento contemporâneo da IA generativa, tem como uma das suas dimensões materiais principais uma base de dados de palavras, imagens ou sons. Por esta razão, por melhores que sejam os resultados, estes sistemas estão necessariamente limitados ao mundo parcelar construído no processo produtivo (por cientistas e não só; Pasquinelli, 2019). A capacidade de ser aplicado em contextos reais, como a criação de chatbots, está dependente da qualidade da base de dados; no fundo, o seu tamanho e diversidade, a fim de conseguir adaptar-se aos contextos sociais mais diversos e interagir de forma (aparentemente) o menos mecanizada possível.
O arquivamento do conhecimento não é algo novo. As culturas greco-romanas confrontaram-se com a “necessidade de selecionar informação de uma coleção enorme e desenvolveram inúmeros meios de armazenamento ( … ) com vista à sua subsequente recuperação” (Taub, 2017, p. 113) em áreas do conhecimento tão distintas quanto a física, a astronomia, a matemática ou a medicina. Não menos interessante, as técnicas utilizadas nestas culturas possibilitaram que “a mesma informação (incluindo dados e ideias)” pudesse ser “reconfigurada e transformada ( … ) fornecendo uma nova expressão do material anteriormente contido no texto de arquivo” (Taub, 2017, p. 114)19. Já na modernidade surgiram os primeiros casos de big science, em que o desenvolvimento de conhecimento e de tecnologia assenta em grandes projetos usualmente financiados por um ou mais governos, em parte devido aos custos avultados, o que implica a cooperação em larga-escala e hierarquização de cientistas em diferentes instituições e com conhecimentos distintos (Galison, 1992). Como se torna patente em projetos como Carte du Ciel (mapeamento das estrelas) e Corpus Inscriptionum Latinarum (coleção de epígrafes em latim), ainda que impliquem quantidades significativas de mão de obra, dinheiro e tempo, estes não tinham como finalidade produzir um novo conhecimento sobre o ser humano ou a natureza, mas sim a criação de um arquivo no qual o conhecimento futuro seria erigido, daí a necessidade de juntar diferentes áreas do conhecimento, das ciências naturais às ciências humanas (Daston, 2017). No entanto, estes projetos não deixam de ter pontos em comum com os seus contemporâneos, financiados por agências militares ou financeiras, ao existir uma relação profícua entre a produção de conhecimento e a competição geopolítica:
ambas foram apoiadas por um financiamento estatal maciço ( … ). Ambas foram colaborações internacionais; ambas foram pioneiras em novos métodos, normas e formas de organização do trabalho (remunerado e voluntário); ambas exigiram um elevado grau de normalização e, por conseguinte, de consenso em questões de técnicas, seleção, formato e calendário; ambas demoraram décadas a concluir, se é que chegaram a ser concluídas. Ambas foram conduzidas num contexto de competição e cooperação internacional (muitas vezes duas faces da mesma moeda) enquadradas por ambições imperiais globais que afrouxaram os cordões à bolsa dos estados e envolveram as ciências em novas formas de rivalidade cultural ( … ). O pathos do progresso e do positivismo saturou os seus manifestos. (Daston, 2017, p. 162)
Como se torna patente, estes projetos dizem respeito a uma parte concreta da realidade social (muitas vezes, passada), sendo que, até ao surgimento da internet e das redes sociais, era muito difícil construir uma base de dados rica em informação e conhecimento que não se limitasse a um país, cultura ou conhecimento. Não por acaso, já no século XX, diversos grupos de investigação fizeram escolhas estranhas, aos olhos de hoje, no desenvolvimento de IA. Por exemplo, o grupo da IBM, formado por cientistas computacionais e linguistas, nos anos de 1980, construiu uma base de dados recorrendo a “manuais técnicos, literatura infantil, patentes de tecnologia de lasers, livros para cegos, e até a troca dactilografada de cartas de um membro da IBM” (Crawford, 2021, p. 101). O mesmo grupo, noutro momento, criou a sua base recorrendo aos depoimentos transcritos de um processo que tinha sido levantado contra a empresa pelo Governo federal norte-americano, permitindo-lhe obter um conjunto de 100 milhões de palavras.
O salto histórico pode ser identificado com a iniciativa não de uma empresa, mas de uma universidade de renome, reforçando a importância que estas instituições têm na produção de ciência e a sua ligação às empresas. No final da primeira década deste século, Fei-Fei Li, professora da Universidade de Princeton, criou a base de dados para imagens ImageNet (https://www.image-net.org/)20 com mais de 14 milhões de imagens retiradas do motor de busca Google e organizadas segundo 20 mil categorias. Este projeto, que continua a ser utilizado como base de dados para o desenvolvimento de software de reconhecimento de objetos digitais, representa a versão moderna de um sonho bem antigo: “nós [Fei-Fei Li e equipa] vamos mapear a totalidade do mundo dos objetos” (Gershgorn, 2017, para. 5).
A globalização da internet passou a ser vista pelos grupos de investigação de IA como um recurso natural facilmente explorado, especialmente por aqueles que detinham as plataformas de pesquisa ou de redes sociais, enquanto forma de “treinar” os seus modelos (Crawford, 2021). Face a esta nova realidade, já não existia a necessidade
de organizar sessões fotográficas com várias condições de iluminação, parâmetros controlados e dispositivos para posicionar o rosto. Agora havia milhões de selfies em todas as condições de iluminação, posição e profundidade de campo possíveis. As pessoas começaram a partilhar as suas fotografias de bebé, fotografias de família e imagens de como eram há uma década, um recurso ideal para rastrear a semelhança genética e o envelhecimento do rosto. Milhões de milhões de linhas de texto, contendo formas formais e informais de discurso, eram publicadas todos os dias. (Crawford, 2021, p. 106)
Dito isto, uma base de dados só tem utilidade caso esteja devidamente catalogada (por exemplo, segundo a categoria “homem branco”, “gato persa”, “linha descontínua”, etc.). Caso contrário, o programa nunca conseguirá interagir com um utilizador, quando este lhe pede “quero uma foto de pessoas a beber café em canecas laranjas”. Aliás, esta tarefa corresponde a 80% do tempo para “treinar” a IA (Cant et al., 2024). Para tal, torna-se necessária, como rapidamente compreendeu Fei-Fei Li, uma enorme massa de força de trabalho. No caso dela, como era muito dispendioso e moroso pagar a estudantes da universidade de elite, decidiram utilizar a plataforma Amazon Mechanical Turk, já que esta lhe permitia aceder ao mercado global, onde a força de trabalho existe em grandes quantidades, a um custo baixo, sem direitos sociais e sempre disponível para realizar este tipo de trabalho, além de não ter de explicar o objetivo final aos trabalhadores alienados (com os quais ela não contacta diretamente; Crawford, 2021).
Por fim, o processo de catalogação socorre-se de um conjunto de categorias que os trabalhadores têm de utilizar nas suas tarefas, sendo esta definição tudo menos neutra. No caso do ImageNet, as categorias seguem a lógica de uma outra base de dados lexical para inglês, a WordNet21. Criada, em 1985, por um centro de investigação de Princeton e financiada ao longo do tempo por organizações estatais como US Office of Naval Research, o Defense Advanced Research Projects Agency e o Natural Science Foundations, constrói as categorias segundo relações semânticas entre palavras (por exemplo, sinonímia, hiperonímia ou hiponímia), reduzindo as categorias a “verbos”, “substantivos”, “adjetivos” e “advérbios”. Este tipo de hierarquização do conhecimento tende a ser apresentado como neutro, rigoroso e científico. No entanto, diversas instituições, como universidades, empresas e agências militares, constroem bases de dados para treinar os seus modelos que se baseiam em “taxionomias conservadoras e antigas” que reproduzem “visões distorcidas das culturas” e da diversidade do mundo; desta forma, estas taxionomias “refletem hierarquias sociais e são uma expressão do poder normativo” (Pasquinelli, 2019, p. 9).
Ainda que os projetos de IA generativa sejam apresentados como esforços fundamentais na produção de conhecimento sobre o mundo, enquanto uma grande biblioteca facilmente acessível pelos utilizadores pelo mundo fora, a sua natureza económica revela-se através da lógica algorítmica: os modelos são desenhados para “encontrar o número mais pequeno de passos consumindo a menor quantidade de recursos, como espaço, tempo, energia, etc.” (Pasquinelli, 2019, p. 12). Por esta razão, muitas vezes, categorias que apresentem uma probabilidade estatística semelhante tendem a ser agrupadas, o que significa necessariamente uma perda de conhecimento. Ao mesmo tempo, também pode existir uma eliminação de categorias que apareçam poucas vezes (que tenham pouca “relevância estatística”), o que faz com que ocorra, entende Pasquinelli (2019), uma “equalização de anomalias [isto é, o que é distinto] a uma norma mediana” (p. 13). Face a esta forma “racional”, económica, de entender o mundo, o nosso reportório de palavras vai diminuindo, a nossa forma de pensar e comunicar acaba reduzida a uma média, a uma mesmidade pouco criativa, onde o estranho, o novo, o “desviante”, as “linhas de fuga potenciais” (Comité Invisível, 2014/2024, p. 236), são eliminados, caso não possa ser controlado por estas empresas. Este pensamento atualiza a ideia da população enquanto corpo político que deve ser conhecido e controlado pelo Estado moderno:
no início do século XVII, ( … ) o necessário conhecimento do soberano (savoir) será um conhecimento (connaisssance) das coisas em vez do conhecimento da lei, e este conhecimento que abrange a própria realidade do estado é precisamente o que naquele tempo era denominado de “estatística”. Etimologicamente estatística significa conhecimento do estado, das forças e recursos que caracterizam o estado num dado momento. (Foucault, 1978/2009, p. 274)
Num mundo em que o conhecimento é entendido numa perspetiva probabilística e reduzido a tokens intercambiáveis22, vale a pena questionar se a comunicação dos seres humanos não tem sofrido progressivamente alterações ao ser mediada pelas máquinas. A troca de mensagens é um exemplo da lógica do capital: escrevemos tendo por base a lógica mais rápida de enviar uma informação (reduzindo palavras e pontuação, aceitamos as recomendações do “corretor automático”, substituindo emoções por emojis, etc.) e, de forma mais ou menos recorrente, através da ferramenta “corretor automático” que tenta prever qual a palavra mais provável de ser utilizada. No mesmo sentido, uma “boa” pesquisa no Google não pode implicar uma frase como a que utilizaríamos para comunicar com um bibliotecário ou um livreiro, mas deve ser reduzida a palavras-chave23. Já no que toca à interação com chatbots, muitas formas de comunicar são excluídas por não constarem numa base de dados. Desta forma, o número de palavras e a forma como comunicamos vão sendo reduzidos a um padrão e, não menos importante, a cultura equivale cada vez mais ao que está disponível na internet ou numa base de dados. Ao mesmo tempo, a tentativa de automatizar a produção de conhecimento significa que a cultura é entendida de forma cada vez mais linear, onde não há espaço para contradições e divergências. No caso das imagens, estas são “coisas extraordinariamente enganosas, carregadas de múltiplos significados potenciais, questões irresolúveis e contradições” (Crawford & Paglen, 2019, p. 1107).
4. Considerações Finais
A IA está muito longe de cumprir os sonhos fetichistas dos tecnófilos, animados pela invenção de “máquinas” com capacidades criativas e comunicativas, dotadas de consciência e de inteligência segundo o entendimento que é dado ao humano. Como se argumentou ao longo do texto, a IA assenta as suas bases numa história longa de acumulação e de organização de conhecimento em arquivos, hoje tendo como recurso fundamental os centros de dados. Em linha com os argumentos de Pasquinelli (2019), entre outros, procurou-se demonstrar que a IA tem “cabeça” e “dedos” humanos. Quer dizer, até ao momento não parece ser seguro admitir que a IA, nas suas mais diversas formas e suportes “físicos”, possui capacidade autónoma para produzir novos conhecimentos e comunicar a partir de uma posição que releva uma consciência de si. Com isto queremos sublinhar que a IA continua a ser, como foram todas as outras inovações no campo da computação e do digital, uma criação humana que vive graças ao trabalho de muitos indivíduos. São cientistas, engenheiros, técnicos das mais diversas áreas, assim como trabalhadores que fornecem os dados com que a IA funciona. Assumindo estes um papel fundamental no campo da IA, o seu trabalho, seja como rotuladores de dados ou moderadores de conteúdo, está longe de ser neutro do ponto de vista social e político. Esta falta de neutralidade é particularmente evidente quando este trabalho envolve os data trainers. Arrefecendo o entusiasmo dos tecnófilos, e como se analisou, estamos perante uma tecnologia que se desenvolve devido ao trabalho dos seres humanos. No entanto, tal não ocorre através de uma consciência coletiva e ativa, mas sim, como aconteceu com muitas outras tecnologias no passado, controlada por interesses privados e seus concomitantes valores morais.
Por outras palavras, estamos perante, como se argumentou, uma relação entre seres humanos, em que uma maioria é cada vez mais influenciada nas suas mais diversas atividades, sem disso terem suficiente consciência, pelo que é comunicado pelas diferentes instâncias de mediação em que a IA se exprime. Por isso, o desconhecimento dos processos sociais nos quais assenta a produção de conhecimento associada ao funcionamento da IA implica a perda de agência na ação social: “tornámo-nos ‘espetadores’ das nossas vidas: meros observadores de uma existência histórica que potencialmente poderíamos conscientemente moldar e orientar” (Bunyard, 2018, p. 4).
Por esta razão, a sociedade capitalista contemporânea assenta na tentativa de que a produção total de conhecimento se torne, por um lado, no somatório da atividade de cada indivíduo em todos os momentos e esferas da sua vida e, por outro, na redução dessa produção a uma mesma medida normalizadora e a uma cultura uniforme - ideal que não resiste ao confronto com a realidade. Se a “inteligência não é um dom ‘natural’ ( … ) [mas] uma dádiva da sociedade a uma pessoa” (Ilyenkov, 2007, p. 12), então, a algoritmização do processo de socialização dos seres humanos significa uma redução dessa mesma inteligência a um estado em que, apesar de a circulação de informação aumentar - todos os dias são produzidos terabytes de dados -, o conhecimento sobre a realidade não necessariamente aumenta e os seres humanos não desenvolvem a capacidade crítica de pensar e de participar na transformação do coletivo.
Ao distanciarmo-nos das leituras mais otimistas sobre a viabilidade próxima do desenvolvimento da IA no sentido de adquirir características até hoje especificamente humanas, como a consciência de si e a inteligência numa dimensão não existente em qualquer outra espécie vivente, quer isto dizer que a descartamos totalmente? Se tomarmos como referência os avanços no campo das tecnociências e das ciências da vida, temos de ser cautelosos. Se pensarmos fora do quadro onde habita a inteligência até hoje - um cérebro alojado num corpo que socializa - teremos de admitir outros futuros possíveis. Por exemplo, o sugerido por Stanley Kubrick em 2001: Odisseia no Espaço, filme inspirado no romance A Sentinela, do mestre da ficção científica Artur C. Clarke. Realizado em 1968, o computador Hal 9000 (Heuristically Programmed Algorithmic Computer) pode ser entendido como o arquétipo da inteligência artificial, tal como ela se desenha atualmente. Como já havia sido sinalizado em 2022, estamos perante um sistema inteligente que controla artefactos e outros dispositivos eletromecânicos sem capacidade de funcionamento autónomo, logo corpos sem inteligência (Ribeiro, 2022). Se os mais céticos dirão que estamos ainda no domínio da ficção científica, não se pode descartar que o futuro possa trazer vida inteligente não-humana. Podemos até imaginar a própria supressão da matéria que faz o corpo inteligente, isto é, a substituição dos neurónios por silício e metais mais ou menos raros. Apesar das incertezas, no horizonte coloca-se a possibilidade de um futuro radicalmente distinto, com outras formas de inteligência, sem que daí se possa antever o desaparecimento do conhecimento e da comunicação - capacidades especificamente humanas.










texto em 



