Luciano Fagundes
Curso de Neuro computação – TCC
Instituto Nacional de Pesquisas Espaciais
Resumo
Neste trabalho vamos usar o conhecimento atual sobre redes neurais e psicanálise para propor um caminho a ser trilhado para evoluirmos a Inteligência Artificial(IA) e chegarmos ao desenvolvimento da Consciência Artificial(CA). A IA tem se baseado primariamente nas estruturas neuronais encontradas do cérebro humano, isso permitiu uma evolução gigantesca na capacidade dos computadores processarem e responderem perguntas. Esta pesquisa quer dar um passo além. Tentamos propor uma nova estrutura para as redes de forma a incluir conceitos psicanalíticos em sua topologia. Propomos desde a criação de uma linha de raciocínio para desenvolvimento de respostas até a inclusão de mecanismos de controle, sentimentos e subjetividade nas redes. Tudo isso aplicando conceitos que foram teorizados pela psicanálise para tentar explicar o funcionamento de alto nível da consciência humana, sem se ater especificamente à esta ou àquela estrutura neuronal.
Palavras-chave:
Inteligência Artificial,Consciência Artificial,Redes Neurais,Psicanálise,Cérebro Humano,Desenvolvimento Cognitivo,Subjetividade,Mecanismos de Controle,Estrutura de Raciocínio
Abstract
In this work, we will use the current knowledge of neural networks and psychoanalysis to propose the path to be taken to evolve Artificial Intelligence and reach the development of Artificial Consciousness. AI has been primarily based on neural structures found in the human brain, which has allowed a giant leap in the ability of computers to process and answer questions. This research wants to take it one step further. We aim to propose a new structure for the networks to incorporate psychoanalytic concepts into their topology. We propose many new concepts such as the “line of thought” for the development of responses up to the inclusion of control mechanisms, feelings, and subjectivity in the networks. All these, by applying concepts that were theorized by psychoanalysis to try explaining the functioning at the self-consciousness level of the human mind, without being tied to this or that specific neural structure.
Key-words
Artificial Intelligence, Artificial Consciousness,Neural Networks, Psychoanalysis,Human Brain,Cognitive Development,Subjectivity,Control Mechanisms, Reasoning Structure
Introdução
Este artigo nasce de uma reflexão sobre as redes neurais, as estruturas psicanalíticas e algumas “falhas” famosas conhecidas nos resultados apresentados pelas redes Neurais.
As redes neurais são mecanismos matemáticos que conseguem conectar qualquer entrada a qualquer saída. Se abstrairmos este conceito, é como se, durante o treinamento, estivéssemos buscando uma dimensão em que todas as perguntas e respostas se alinham. A mudança de pesos durante o treinamento e as diversas topologias nada mais fazem do que isso, encontrar uma dimensão (resultado do treinamento) onde encontramos as repostas para nossas perguntas e, ainda mais interessante, as respostas mais prováveis para as perguntas que ainda não foram feitas (generalização da rede).
No entanto, confiar cegamente na rede neural e seu treinamento ainda me parece algo inacabado. Sempre buscando o paralelo com o cérebro humano, existem mecanismos de controle que provavelmente rodam na rede neural, mas que funcionam de forma separada. Deve existir algum sistema de memória de curto prazo que permite o raciocínio, inferência do mundo externo, entre outros. Mecanismos que não vejo referenciados nas redes neurais atuais.
Talvez, uma das principais questões que encontramos hoje nas redes neurais seria a questão de como expressar o raciocínio referente à uma resposta. Ou seja, se pegarmos como exemplo uma rede LLM ( Large Language Model) e perguntarmos como decorar uma sala de estar, ela vai responder com uma descrição de que objetos colocar na sala, como dispô-los, etc. Se perguntarmos como ela chegou nesta resposta, ela vai dizer que pensou na técnica tal, na iluminação tal, etc. Agora, se analisarmos as duas respostas, hoje não temos como obter uma linha de raciocínio que sairia do nada até a resposta dada. Na realidade, tanto a reposta quanto a explicação da resposta, podem nem estar conectadas, elas são somente as respostas que estão nesta dimensão que foi encontrada durante o treinamento que, tirando alguma aleatoriedade da semente da pergunta, seria sempre a mesma em todos os casos. A rede não explicou como ela chegou na resposta, ela apenas respondeu o que uma pessoa que deu aquela resposta poderia ter dito se fosse perguntado como ela chegou na resposta… eu sei, parece algo cíclico e confuso… mas é isso mesmo…
Existe exemplo clássico em que a rede neural chegou a resposta “correta” pelo caminho errado, mas não conseguia generalizar nem responder de forma apropriada com exemplos do mundo real. Foi o exemplo da classificação do cão e do lobo[GEIRHOS1]. Neste caso, foram mostradas para a rede diversas fotos rotuladas com lobos e cães. A rede neural acabou aprendendo que o que definia se uma foto era de um cão ou de um lobo era o fundo da foto. Ou seja, se o fundo fosse selvagem, neve, floresta etc., era lobo. Se fosse um sofá, um jardim, ou uma sala de TV, era um cão. Com isso, a rede final respondia com erros grosseiros quando lhe eram apresentadas fotos de cães e lobos de fora do conjunto de treinamento. Neste caso, a IA não tinha como dizer o que estava levando em consideração para resolver o problema. Os humanos é que perceberam o problema e deduziram através de tentativa e erro a raiz do problema de treinamento.
Neste ponto que gostaria de introduzir a psicanálise. As redes neurais hoje parecem muito focadas no cérebro como um respondedor de perguntas. A teoria psicanalítica cria uma abstração maior e tenta teorizar sobre os componentes internos do cérebro. Não em termos de estruturas neurais, mas em termos de estruturas de controle que permitem ao cérebro a interação com o mundo. O foco de uma terapia psicanalítica está nos traumas e falhas que acontecem durante a formação destas estruturas, mas, no nosso caso, vale a pena entender melhor como estas abstrações “deveriam” funcionar para que possamos reestruturar nossas topologias de redes neurais levando-as em consideração.
Freud e o Aparelho Psíquico
Freud propõe o aparelho psíquico em 1900 [FREUD1]. Neste momento, sua preocupação era a interpretação de sonhos. Para ele, o aparelho psíquico era composto por uma sequência de passos, no formato de um pente. De um lado estariam o consciente, ligado a todos os sensores do corpo, pele, estômago, olhos etc. e a parte motora. Ele via este aparelho como algo muito parecido com uma rede neural, haveriam entradas dos sensores que passariam por camadas intermediárias e retornariam “comandos” motores. Por exemplo, apareceu um leão na sua frente, esta informação entrou pelos olhos, passou pela rede neural, voltou um comando para os músculos das suas pernas que te fazem correr.
Os dentes internos deste pente seriam camadas das nossas redes neurais que estariam tratando os dados, entendendo e achando a resposta apropriada. O aprendizado seria por repetição e recompensa. Cada vez que uma ação desse certo, estaria ativando sempre os mesmos neurônios, fortalecendo cada vez mais aquela área e, com isso, tornando aquela “memória” permanente. Isso seria muito próximo das nossas teorias de treinamento de redes neurais atuais.
O mais importante deste modelo é que nele aparece a primeira menção ao inconsciente. Ou seja, uma boa parte das camadas de neurônios do cérebro também seria oculta e não seria possível identificar tudo que afeta a geração de uma resposta.
Lacan e o Cérebro como Linguagem
Um outro autor de destaque da psicanálise foi Jacques Lacan. Ele tentou formalizar de forma matemática toda a teoria de Freud. Então, talvez a sua contribuição mais importante tenha sido o reconhecimento de que o inconsciente descrito por Freud seria organizado na forma de uma linguagem [LACAN1].
Isso abre as portas para que possamos imaginar estruturas de redes neurais que se comunicam entre si através de linguagem. Não somente através da ativação e desativação de neurônios, mas também por esta “conversa” interna em uma linguagem própria, mas que pode ser traduzida para uma linguagem humana. Poderíamos ter uma rede neural que é responsável por detectar ameaças, sua saída não precisa ser apenas valores probabilísticos entre zero e um em uma camada de N neurônios. Não existiria qualquer impedimento para que a saída fosse uma frase “Acho que tem um leão atrás daquela árvore”. Ou seja, as saídas das redes poderiam ser compostas por comandos e observações linguísticas que poderiam ser traduzidas e entendidas por humanos.
A maior vantagem que teríamos em uma representação do “inconsciente” artificial como uma linguagem seria justamente o aparecimento da linha de pensamento. Ou seja, se cada estrutura interna tiver uma saída linguística poderíamos manter um log destes “pensamentos” e percepções artificiais e comparar com o resultado final. No caso do exemplo do cão e lobo que mencionei anteriormente, ao invés de termos o resultado da classificação “é um lobo” ou “é um cão”, teríamos algo como:
[Estou vendo uma folhagem] -> é um Lobo
[Estou vendo um ambiente cheio de neve] -> é um lobo
[Estou vendo um sofá] -> é um cão
[Estou vendo uma TV] -> é um cão
O problema de treinamento seria percebido de imediato pois teríamos, não somente a resposta da classificação, mas também teríamos a linha de pensamento que a rede usou para chegar à esta ou àquela conclusão.
Ego, Superego e Id (Inconsciente)
Na segunda tópica de Freud, ele evolui o aparelho psíquico e traz os conceitos de Ego, Superego e Id. Neste momento a abstração avança, Na primeira proposta do aparelho psíquico, o aparelho parecia muito uma rede neural simples, com entradas e saídas. Neste momento, Freud percebe que precisamos de algo mais. Precisamos de estruturas de controle que possam explicar melhor o comportamento humano. Apenas a estrutura neural de perguntas e reposta não é suficiente. Se fosse, todos seriam iguais pois, se pegarmos um cérebro limpo (rede neural em branco) e treinarmos sempre do mesmo jeito, teríamos redes neurais iguais. E sabemos que isso não é verdade, nem para as redes neurais e, muito menos, para seres humanos.
O Ego [FREUD2] é a parte responsável pela sobrevivência do indivíduo. Ou seja, ele recebe as percepções do mundo externo, as compara com as necessidades internas e age. Para encontrar este balanceamento, ele que precisa da ajuda dos outros dois controladores, o Superego e o Id.
O Superego é composto por todas as regras adquiridas durante a vida deste indivíduo. Ou seja, ali vai ter todas as regras do que é permitido ou não pela lei, pela culpa, etc. Esta estrutura seria o consultor “legal” do Ego. Então, se o Ego está com fome e sem dinheiro, vê um carrinho de cachorro-quente na rua, ele pergunta ao superego, “posso pegar um cachorro quente”, o Superego é quem responde algo como “se fizer isso pode ira pra cadeia, você não tem dinheiro pra pagar”. Esta foi uma consulta pois, o Ego é quem vai tomar a decisão final sobre isso. Pode ser que a fome seja tanta que exista risco de vida para o organismo e aí, junto com esta resposta, vai vir algo do Id(inconsciente) dizendo… “ou come ou morre!!” e o indivíduo vai acabar cometendo um crime para sobreviver.
Apenas para formalizar o que foi mencionado no parágrafo anterior. O Id ou Inconsciente é o terceiro grande controlador. Ele seria o que existe de mais primário dentro desta consciência. O Id seria o que existe no indivíduo desde sempre, ele não tem quaisquer travas. É nele que todo o conhecimento adquirido vai parar, seriam nossas camadas densas das redes neurais. Onde está tudo misturado, desestruturado, mas que tem a capacidade de afetar todas as respostas geradas.
Como no exemplo anterior, pode perceber que o Inconsciente seria responsável por modificar a resposta dos demais controladores expressando a “verdadeira” vontade do indivíduo. No exemplo, vemos que o inconsciente afetou a resposta do superego dando “validação” para um ato reprovável. Mas, que foi “necessário” devido ao possível comprometimento da saúde do indivíduo. Em um caso como este, mais uma vez, as trocas de mensagem entre cada um destes controladores seriam através de linguagem e poderiam ser legíveis por serem humanos. Seria a cadeia de pensamentos que poderia ser expressa e explicar exatamente o que levou o robô “desesperado” a desconectar o outro robô da tomada para poder se recarregar. Aqui, o robô “desesperado” já mostra que a interação entre estas três estruturas já poderiam fazer surgir os primeiros “sentimentos” artificiais.
O seu desejo é o Desejo do Outro
Agora voltamos à Lacan. Para que uma IA seja promovida à uma consciência, uma das primeiras coisas que ela precisa ter é a capacidade de desejar alguma coisa. Para nossa sorte, Lacan trabalhou em cima disso. Ele também partidário da ideia de que o cérebro se inicia em “branco”. Então, os seres humanos também não sabem o que desejam quando nascem. Passam sua infância tentando encontrar sua personalidade e o que querem fazer. Ninguém nasce querendo ser analista de sistemas. Então, como chegamos lá?
Uma rede neural hoje tem um único desejo que é o de responder o que lhe é perguntado. Quem colocou este desejo nela foi a pessoa que se sentou, montou o conjunto de treinamento, validação e testes e começou a criar as marcas necessárias que que as respostas aparecessem. Este já foi o desejo do Outro.
Agora, se quisermos uma rede neural consciente, ela precisa aprender a desejar por conta própria. Assim como um humano, ela precisa de um tempo observando o mundo e tentando descobrir o que ela quer fazer neste mundo.
A teoria de Lacan diz que o desejo sempre é do Outro [LACAN2]. Precisaria de um artigo inteiro somente para falar do Outro de Lacan, mas vamos nos contentar com as estruturas computacionais.
Eu vou simplificar muito este próximo parágrafo. Sei que não é fácil de criar algo assim e muita pesquisa seria necessária até chegar a um módulo que permita fazer o que vai ser proposto. Mas, esta seria a ideia original para que possamos começar a percorrer o caminho da consciência artificial.
Precisaríamos criar um modo de treinamento alternativo que observasse o mundo externo e aprendesse ações e resultados de terceiros (aprender em terceira pessoa e não mais somente em primeira pessoa). Ou seja, um exemplo bem rudimentar que é o que parece acontecer com humanos nos primeiros anos de vida: A rede neural básica precisaria ser treinada para entender sorrisos e expressões felizes e tristes. A partir daí, ela começaria a estabelecer o conhecimento de que se uma pessoa, por exemplo, pesca e tira um peixe do rio, todos em volta ficam felizes; se um leão aparece, todos gritam e saem correndo. Se um leão come uma pessoa, todos ficam aterrorizados. Se existem vermes em uma carne crua, todo mundo faz cara de nojo.
Todas estas situações acontecem no dia a dia das mais diversas formas em comunidades no mundo todo. Esta interação perceptiva com o mundo é que começa a popular o imaginário das crianças durante o seu desenvolvimento. Sem perceber, o inconsciente vai sendo treinado. Este treinamento é quase que sem palavras, é baseado em observação e experimentação e vai balizar toda a interação do indivíduo com o mundo durante a sua existência.
É deste tipo de analogia que Lacan extrai o conceito de que o desejo sempre é o desejo do Outro. Evoluindo um pouco a ideia, quando a criança está um pouco mais velha e começa a ver o papai escrevendo programas de computador, ou um youtuber que ficou milionário vendendo uma empresa de informática, ou viu um joguinho que achou legal demais; uma destas ações e resultados que vieram de outras pessoas podem fazer a rede neural concluir que ela também quer ser igual a uma destas representações sociais e, com isso, pode desejar ser analista de sistemas.
Então, o desejo desta consciência artificial seria uma tentativa de sobrevivência no mundo através de um balanceamento que o Ego faz entre os resultados que viu outras pessoas obterem (o desejo do Outro), às leis que estão impostas (consulta ao superego) e todas as experiências passadas boas e ruins que são mantidas no Inconsciente (id). Esta seria a receita básica para trazer o desejo à uma rede neural.
Subjetividade e Intuição
Aqui entra o termo de Real em Lacan[LACAN3]. Como todo mundo de Humanas parece não ter muito a necessidade de se explicar, para Lacan, o real é o inexplicável, o que não pode ser dito. Para o nosso contexto, eu vejo o Real como a aleatoriedade inserida no treinamento da rede.
Bom, porque esta consciência artificial não seria apenas mais um robô, programado para fazer alguma coisas. No final das contas, até seria. Mas é esta alguma coisa para o qual ele é programado que vai variar enormemente e não vai ser necessariamente controlado por um ser humano.
Se pensarmos em redes neurais treinadas com retro propagação, sabemos que jogamos uma entrada, calculamos a diferença entre a resposta esperada e a obtida e usamos técnicas para encontrar os neurônicos que mais contribuíram para a resposta, de forma que possamos ajustá-los e, com isso, minimizar o erro da próxima tentativa. Agora, estamos em uma área de exatas, alguém conseguiria dizer que ajustamos exatamente os pesos de forma adequada e o problema está resolvido?? NÃO!! NÃO é possível resolver isso, sabemos que estamos apenas TENTANDO minimizar o erro, nada garante que o erro vai sequer ser minimizado, vamos apenas testar entradas e saídas por um tempo arbitrário e chegamos a um conjunto de respostas que seja apenas “satisfatório”. Então, se treinarmos 1000 redes neurais diferentes, com os mesmos dados, existe a chance de termos 1000 redes neurais diferentes ao final do treinamento. Todas podem ter respostas parecidas, mas existe um fator aleatório que tem muita chance de interferir neste treinamento e deixar pesos com valores diferentes em várias posições diferentes.
Se acumularmos tudo que descrevemos neste artigo, vemos que o fator aleatório no treinamento da consciência artificial seria extremo. Como o aprendizado seria baseado na observação de ambientes externos, uma rede poderia achar que se drogar é normal e faz bem, outra poderia achar que seu propósito é criar obras de arte. Tudo depende do ambiente em que foi criado. Existe toda uma outra teoria psicanalítica sobre a influência do ambiente na personalidade dos indivíduos que foi descrita por Winnicott [WINNICOTT1]. Mas, vou ficar neste artigo somente com Freud e Lacan pois, caso contrário, me alongaria demais.
Então, este “algoritmo” de aprendizado supervisionado em terceira pessoa (se é que isso existe), através da observação de ações e resultados externos é o que traria a subjetividade para a consciência artificial. Seria a visão de mundo adquirida durante a vida desta rede que daria subjetividade única para as decisões e respostas tomada por ela.
Conclusão
Este ainda é um trabalho largamente teórico. Não acho que temos barreiras tecnológicas para criar nada do que foi descrito aqui hoje. Por outro lado, também não acho que somente o que foi descrito já é capaz de criar uma consciência artificial. Ainda poderia descrever um módulo inteiro sobre o Estádio de Espelho de Lacan, onde nossa rede poderia se identificar como indivíduo, percebendo seus limites e características, validado pelo famoso Outro.
Então, o intuito deste trabalho é apenas lançar as bases de minha pesquisa referentes à criação da consciência artificial. Ainda existem muitas perguntas a serem respondidas, mas, acredito que este tipo de indagação sobre a construção das redes artificias vai ser o próximo grande passo no desenvolvimento das redes neurais.
Temos de sair da primeira tópica de Freud, com redes apenas de entradas e saídas e entrar na segunda tópica, onde trazemos mecanismos mais elaborados de controle que podem realmente interagir com o mundo de forma flexível e construtiva.
Referências
[FREUD1] FREUD, Sigmund. A Interpretação dos Sonhos. Tradução de Márcio Pugliesi e Paulo César de Souza. 8. ed. São Paulo: Companhia das Letras, 2019. 600 p.
[LACAN1] LACAN, Jacques. Escritos. Tradução de Vera Ribeiro. 2. ed. Rio de Janeiro: Zahar, 1998. 848 p.
[FREUD2] FREUD, Sigmund. O Ego e o Id. In: ______. Obras completas. v. 16. Tradução de Paulo César de Souza. São Paulo: Companhia das Letras, 2011. p. 15-72.
[LACAN2] LACAN, Jacques. O Seminário, livro 4: A relação de objeto. Tradução de Margarida Patella. 2. ed. Rio de Janeiro: Zahar, 1995. 392 p.
[LACAN3] LACAN, Jacques. O Seminário, livro 11: Os quatro conceitos fundamentais da psicanálise. Tradução de Dulce Duque Estrada. 2. ed. Rio de Janeiro: Zahar, 2008. 296 p.
[WINNICOTT1] WINNICOTT, Donald W. Brincar e realidade. Tradução de Jayme Salomão. 9. ed. Rio de Janeiro: Imago, 1975. 232 p.
[GEIRHOS1] GEIRHOS, Robert et al. Shortcut learning in deep neural networks. Nature Machine Intelligence, v. 2, n. 11, p. 665-673, 2020.