Introdução Ao Chat GPT
Introdução Ao Chat GPT
CHATGPT
Prof. Dr. Adriano Leal
OBJETIVOS PRIMÁRIOS
PERDER O MEDO e desmitificar os Modelos de Grandes Modelos
de Linguagem (LLMs). Além disso, abordaremos o seguinte:
• Introduzir as Funcionalidades Pagas do ChatGPT-4 Omni:
Apresentar e explorar, as funcionalidades avançadas disponíveis na
versão paga do ChatGPT-4 Omni;
• Explorar o Potencial das LLMs: Discutir as capacidades e aplicações
práticas desses modelos em diversas áreas;
• Compreender as Limitações Atuais: Identificar as restrições técnicas
e desafios enfrentados pelos LLMs no cenário atual;
• Analisar o Futuro das LLMs: Refletir sobre como as limitações atuais
podem evoluir e quais inovações podem surgir.
Agenda
1. Introdução ao ChatGPT (30 min)
3. Conceitos básicos de RAG (45 min)
- Histórico e evolução do ChatGPT
- Definição e importância do Retrieval-Augmented Generation (RAG)
- Principais funcionalidades e aplicações
- Arquitetura e funcionamento do RAG
- Definição e importância dos embeddings em LLMs
- Exemplos práticos e estudos de caso
2. Demonstração prática de interação com o ChatGPT 4 Omni (1h 15)
4. Uso das APIs do ChatGPT (1h)
- a. Conceitos de Engenharia de Prompt
- Introdução às APIs do ChatGPT e Instalação do Jupyter Notebook
- b. Criação de emails personalizados
- Configuração e autenticação
- c. Uso do Consensus para revisão bibliográfica
- Exemplos de integração com outras aplicações
- Como o ChatGPT pode auxiliar na coleta e análise de literatura
- Boas práticas de uso e segurança
- Exemplos práticos de uso do Consensus
5. Anúncio do Desafio de Transformação Digital 2024 (5 minutos)
- d. Explorando outros GPTs
- Objetivo do DTD 2024: conhecer os usos do ChatGPT no IPT
- Criando Logotipos e Arte Gráfica
6. Sessão de Perguntas e Respostas
- Criando seu próprio GPT a partir de refinamento de contexto
3
AGRADECIMENTOS
COMEMOREMOS AS NOSSAS GRANDES E PEQUENAS CONQUISTAS
Gostaria de iniciar este curso expressando minha profunda gratidão a todos nós
que contribuimos na acumulação do conhecimento necessário para que este
momento se tornasse realidade.
Parafraseando o que é belamente dito em Ecl. 3:2, 'Tudo tem o seu tempo
determinado, e há tempo para todo o propósito debaixo do céu. há um tempo
para plantar e um tempo para colher'. Hoje, colhemos os frutos de um esforço
coletivo, resultado do trabalho árduo e dedicação de todos nós do IPT.
Este curso é uma prova concreta de que, quando unimos forças, somos capazes de
expandir nossos horizontes, trazer novos conhecimentos e avanços do exterior
para o fortalecer o IPT.
Espero que continuemos a plantar juntos e colhermos ainda mais frutos no futuro.
Isso é um dos Resultados de inúmeros “esforços
de formiguinhas”
▪ Projeto PDIP – Zehbour Panossian, Landgraff, ▪ Grupo de Transformação Digital – Abraham Yu,
Adriano Marin, Mario Boccalini Junior, Eliza Ota, Elisa Sales, Adriana Brito e Luciana
Morais, e muito mais.
Alessandro Santiago dos Santos, Alex Vallone,
Liedi e muitas outras pessoas fantásticas. ▪ Center for Science, Technology CC&T – Inova HC -
Claudia Teixeira e Helena Correa
▪ Pós Doutorado em Berlim – Jefferson Gomes ▪ Representando o pessoal que nos incentiva e
de Oliveira, Maria Cristina D. F, Mario Miyake, apoia sempre de forma abnegada e altruísta:
Alessandro Santiago dos Santos, entre outros. Alais Telles, Silvia Ferrari, Erika Soares, Elaine
Correia, Edna Gubitoso, Itanna Caroline M de
▪ Plataforma IASMIN/TD – Maria Cristina Oliveira, Ester Garcia, Fabrícia Garcia, Lindomar
Domingues, Denis Bruno Virissimo, André Guedes, Tatiana Mestres, Melissa Revoredo
Delfino, entre outros. Braga, Fulvio Vittorino, entre outras e outros.
Mastery
10,000 hours Plateau of productivity
Vocab-basics-practice New material
Confidence
Slope enlightenment
Tricky
Experience
▪ Plataforma: Anaconda
▪ Linguagens para IA: Python, C, C++
▪ Bibliotecas Python da Anaconda:
Scipy, PyTorch, Tensorflow,
Deep Learning, Scikit-learn.
9
MELHORANDO A ANALOGIA...
10
11
Caveat emptor ▪ OpenAI na prática
ATENÇÃO!!! https://github.com/openai/openai-cookbook
é uma expressão em língua latina
que significa, literalmente,
“cuidado, comprador". Em uma
NUNCA ABRA MÃO tradução livre, significa "o risco é
do comprador". Ao colocar à venda
DO BOM-SENSO. um produto sob as regras do
caveat emptor, o vendedor diz que
não garante a qualidade ou
procedência do produto.
▪ https://youtu.be/BQTXv5jm6s4?si=QhcxsxC6igwnrJm1 (Histórico da
Inteligência Artificial e tópicos de discussão éticos atuais – As opiniões são
do autor deste vídeo. Não presuma meu apoio ou oposição, mas é
importante conhecer as discussões atuais.)
5. Use exemplos
6. Especifique o
ESCREVENDO PROMPTS 7.
comprimento
Esclareça o tom
EFICAZES 8. Revise e refine
DICAS IMEDIATAS: ADICIONE ...
▪ Crie um plano de aula para uma aula de [ nível de aluno ] sobre [ conceito
sendo ensinado ] que inclua objetivos de aprendizagem, atividades criativas
e critérios de sucesso.
▪ Crie uma lista de atividades interativas em sala de aula para [ tipo/nível de
aluno ] em [ conceito que está sendo ensinado ]
▪ Crie uma lista de [#] estratégias de ensino que poderiam ser usadas para
envolver e desafiar estudantes universitários de diferentes níveis de
habilidade em uma aula sobre [ conceito sendo ensinado ]
https://www.promptingguide.ai/pt/introduction/settings
GRANDES
MODELOS DE
LINGUAGEM
COMO FUNCIONAM OS GRANDES MODELOS DE LINGUAGEM (LLMS)?
Por exemplo
▪ os dados de treinamento podem consistir em muitas frases começando com “minha cor
favorita é…”
▪ a próxima palavra será uma cor, permitindo que os LLMs agrupem as palavras “vermelho,
azul, verde…” em um conjunto que represente o conceito de “cor”
▪ É importante notar que os LLMs realmente não entendem nada. Eles criam
padrões estatísticos que agrupam tokens semelhantes com base em uma medida
complexa de quão semelhantes ou diferentes eles são.
DADOS USADOS PARA TREINAR LLMS
▪ LLMs são treinados de maneira não supervisionada em grandes quantidades de dados licenciados e de
código aberto, por exemplo
▪ The Pile (825 GB, incluindo web, artigos, patentes, livros, ArXiv , Stack Exchange, problemas de matemática, código de
computador)
▪ Rastreamento comum (cerca de 20 bilhões de URLs)
▪ GPT3: parâmetros 175B; GPT4: não divulgado: est. 500B – 1000B – quanto maior, melhor (por enquanto, pelo menos)
▪ a aprendizagem por reforço com feedback humano (RLHF) é usada para recompensar LLMs por darem
respostas apropriadas (“proteção”)
▪ “IA Constitucional” – treinada para filtrar respostas baseadas, por exemplo, na Declaração Universal dos
Direitos Humanos (Claude 2)
PREVISÃO DA PRÓXIMA PALAVRA
verde 9,7%
vermelho 15%
Minha cor favorita é
rosa 11,6%
puce 2,3%
FAREI UMA
DISGRESSÃO
NLP &
TRANSFORMERS
https://transformer-
circuits.pub/2021/framework/ind
ex.html#two-layer-attention-only-
transformers
https://www.gptlearninghub.ai/co
dingproblems
NLP TASKS/APPLICATIONS
36
NLP IS POP, BUT IT IS HARD!
▪ Homonymy, polysemy, …
38
WORD2VEC
Tomas Mikolov
Idea: each word can be represented by a fixed-length
numeric vector. Words of similar meanings have
2013 similar vectors. 39
WORD2VEC
▪ Each word in the vocabulary is represented using one hot encoding (aka
local representation!).
Skip-gram NN
architecture
The amount of neurons in the hidden layer (a hyperparameter) determines de size43 of the embedding.
WORD2VEC
44
WORD2VEC
45
WORD2VEC
Credits: http://jalammar.github.io/illustrated-word2vec/
46
“CLASSICAL” ENCODER-DECODER MODEL
“The idea is to use one LSTM to read the input sequence, one
timestep at a time, to obtain large fixed-dimensional vector
representation, and then to use another LSTM to extract the
output sequence from that vector
ATTENTION
Also:
▪ Positional Encoding
▪ Multi-Head Attention
The following pages use content authored by Jay Alammar.
https://jalammar.github.io/illustrated-transformer/ 51 From Vaswani et al (2018)
https://github.com/jalammar
SELF-ATTENTION
A luxury car?
52
SELF-ATTENTION
53
SELF-ATTENTION
54
SELF-ATTENTION
𝑣1 𝑣2 𝑣3 𝑣4 𝑣5 𝑣6 𝑣7 𝑣8 𝑣9
55
SELF-ATTENTION
We need a mechanism to
𝑣1 𝑣2 𝑣3 𝑣4 𝑣5 𝑣6 𝑣7 𝑣8 𝑣9 transform these vectors to
take context
into consideration.
56
SELF-ATTENTION
𝑣1 𝑣2 𝑣3 𝑣4 𝑣5 𝑣6 𝑣7 𝑣8 𝑣9
Transformation mechanism
𝑣1 𝑣2 𝑣3 𝑣4 𝑣5 𝑣6 𝑣7 𝑣8 𝑣9 More
contextualized
vector57
SELF-ATTENTION
𝑣1 𝑣2 𝑣3 𝑣4 𝑣5 𝑣6 𝑣7 𝑣8 𝑣9
Self-attention
𝑣1 𝑣2 𝑣3 𝑣4 𝑣5 𝑣6 𝑣7 𝑣8 𝑣9 More
contextualized
vector58
SELF-ATTENTION
dot
product
Jaguar is the luxury vehicle brand of Land Rover.
𝑣1 ⋅ 𝑣1 = 𝑤11 𝑤11
𝑣1 ⋅ 𝑣2 = 𝑤12 𝑤12
𝑣1 ⋅ 𝑣3 = 𝑤13 𝑤13
𝑣1 ⋅ 𝑣4 = 𝑤14 normalization 𝑤14
𝑣1 ⋅ 𝑣5 = 𝑤15 𝑤15
𝑣1 𝑣2 𝑣3 𝑣4 𝑣5 𝑣6 𝑣7 𝑣8 𝑣9 𝑣1 ⋅ 𝑣6 = 𝑤16 𝑤16
𝑣1 ⋅ 𝑣7 = 𝑤17 𝑤 1𝑗 = 1 𝑤17
𝑣1 ⋅ 𝑣8 = 𝑤18 𝑗 𝑤18
Self-attention 𝑣1 ⋅ 𝑣9 = 𝑤19 𝑤19
The new representation for “Jaguar” 𝑣1 = 𝑤11 𝑣1 + 𝑤12 𝑣2 + 𝑤13 𝑣3 + 𝑤14 𝑣4 + 𝑤15 𝑣5 + 𝑤16 𝑣6 + 𝑤17 𝑣7 +
(𝒗𝟏 ) is influenced by the presence of
“luxury”, “vehicle” and “brand” in the 59
sentence.
VOLTAMOS A
NOSSA
PROGRAMAÇÃO
NORMAL
▪ 2. Demonstração prática de interação com o ChatGPT 4 Omni (1h 15)
- a. Conceitos de Engenharia de Prompt
- b. Criação de emails personalizados
- c. Uso do Consensus para revisão bibliográfica
- Como o ChatGPT pode auxiliar na coleta e análise de literatura
- Exemplos práticos de uso do Consensus
- d. Explorando outros GPTs
- Criando Logotipos e Arte Gráfica
- Criando seu próprio GPT a partir de refinamento de contexto
LLMS PODEM (PARECEM) SER CRIATIVOS
▪ Uma consequência da aprendizagem baseada no contexto e da aleatoriedade
(temperatura) permite que os LLMs gerem resultados surpreendentes.
▪ Observe, porém, que eles não são criativos no sentido humano, mas movidos por
reconhecimento de padrões e algoritmos de previsão
▪ não acredite nos resultados – eles sempre precisam ser verificados, pelo menos
por enquanto
* LLMs não são pessoas. Eles não têm intencionalidade. Não os antropomorfize ☺
INTERAGINDO COM LLMS USANDO “PROMPT
ENGINEERING”
▪ Lembre-se de que a saída de um LLM é determinada tanto pelo que o
sistema foi treinado quanto pelas informações que você fornece a ele.
▪ às vezes você pode não saber como pedir a um LLM para realizar uma tarefa
▪ pergunte o que ele precisa e colabore com ele
Por exemplo
▪ “O que eu poderia pedir para me ajudar a refinar meus objetivos para um
ensaio?”
▪ “Você precisa de mais alguma informação?”
EXERCÍCIO: COMPREENDENDO CONCEITOS
COMPLEXOS
▪ Que tal pedir que resuma os avanços mais importantes de um paper
usando o LLM de sua preferência.
▪ instrua seu LLM a adotar essas duas funções e debater de forma a acharem um acordo
mutuamente satisfatório. Diga-lhe para cumprir rigorosamente essas funções.
▪ Ao final, peça ao LLM para analisar a conversa e recomendar algumas leituras adicionais
para o seu aculturamento no tópico.
EXERCÍCIO: CONVERSAS SOCRÁTICAS ( PARA FAZER
MAIS TARDE )
▪ O método socrático de ensino é onde o professor faz perguntas abertas para ajudar a explorar
um tópico
▪ Ajuda o pensamento crítico, uma compreensão mais ampla e profunda
▪ Fácil de configurar em um LLM
▪ você pode ter que intervir até obter o comportamento correto. Lembre-se que isso serve para
orientar o LLM!
EXERCÍCIO: TESTANDO SUA COMPREENSÃO ( PARA
FAZER MAIS TARDE )
▪ Você pode instruir um LLM a enviar uma mensagem de texto sobre sua
compreensão de um tópico usando perguntas de múltipla escolha e
respostas de formato livre
▪ Tente configurar isso, observando:
▪ muito provavelmente o padrão será um modelo MCQ padrão “um correto/três
incorretos”
▪ pergunte quais outros formatos ele conhece
▪ certifique-se de instruí-lo a parar após cada pergunta e explicar a resposta
depois de inseri-la.
▪ veja se você consegue fazer com que ele se comporte como um sistema de
teste auxiliado por computador (“CAT”)
USANDO LLMS NO MSC
▪ “ Enviar trabalhos e avaliações criados por alguém ou outra coisa, como se fossem seus,
é plágio e é uma forma de trapaça e isso inclui conteúdo gerado por IA. ”
▪ usar chatGPT etc. provavelmente constituiria trapaça intencional e poderia resultar em reprovação
em uma avaliação e, portanto, no mestrado.
https://www.imperial.ac.uk/about/leadership-and-strategy/provost/vice-provost-education/generative-ai-tools-
guidance/
O QUE VOCÊ NÃO PODE FAZER, ALGUMAS COISAS
QUE VOCÊ PODERIA FAZER E POR QUE DEVERIA FAZER
Não pode
▪ AI não pode ser autor ou coautor;
▪ AI não pode ser citado ou referenciado
▪ AI não pode pensar por você! During the preparation and revision of this manuscript, we utilized Overleaf,
ChatGPT-4, Grammarly, and Google Translate to ensure clarity and grammatical
precision, as English is our second language. The authors assume full responsibility
for the creation of the primary content, ensuring technical accuracy, and have
Poderia appropriately cited all secondary sources used in this publication.
https://chatgpt.com/
EXERCÍCIO: SIMPLIFICAÇÃO
▪ AI pode ser usada para simplificar texto
▪ Esta simplificação pode ser feita em vários níveis de complexidade
▪ Este é um processo iterativo
▪ alguma coisa precisa de mais simplificação ou expansão/ilustração? Foi resumido a um nível razoável (por
exemplo, criança, leitor instruído)?
https://chat.openai.com/share/fe8c982e-cda5-465c-ab44-eb996840d8fc
# Exemplo de Kraken
PERGUNTE O QUE É NECESSÁRIO PARA
PROCESSAR SUA SOLICITAÇÃO
▪ se você não tiver certeza de como desenvolver um prompt razoável, poderá solicitar ao sistema que
solicite as informações necessárias
https://www.promptingguide.ai/pt/introduction/settings
https://chat.openai.com/share/14790e46-a3f0-4df9-a682-789a994bd157
# Exemplo de ficção científica da revista Vector
▪ Ou você pode fazer com que descreva o que considera as etapas intermediárias
▪ Gostaria que você disponibilizasse algum texto acadêmico acessível para mim. Que informações você
precisa de mim para fazer isso com sucesso?
https://chat.openai.com/share/eaf2a21c-3eb0-4a1f-a00c-85cb5e79df79
# Exemplo de ficção científica da revista Vector
“DIRIGIBILIDADE”
▪ do chatGPT pode ser “dirigido” para assumir papéis específicos, por exemplo, tutor,
crítico, parceiro socrático, pirata (!). Muitas vezes referido como assumir um “papel”
https://chat.openai.com/share/2adbdcef-2a27-45cc-af57-1977b2ea6ab5
https://chat.openai.com/share/492ea8bf-1a00-47a2-bd56-5f5ecd075ecf
EXERCÍCIO: REESTRUTURAÇÃO DE TEXTO
▪ genAI pode ser usado para ler notas não estruturadas, identificar temas e reestruturar
▪ https://chat.openai.com/share/f8c6d841-3de2-47b4-a71f-9ecdc3258479
# competências normativas
Questionamento socrático
▪ https://chat.openai.com/share/89dd6a17-f6e0-4c50-afdf-b1efd6eb361b
▪ # Jornada nas Estrelas: TNG
ou diálogo:
▪ https://chat.openai.com/share/b231b3e0-fd8e-4aa3-ac84-a5d427deffaf
CHATGPT E ENSAIOS
▪ chatGPT foi usado para escrever código para processar dados e depois escrever
um artigo: https://www.nature.com/articles/d41586-023-02218-z
▪ então, pode escrever um ensaio SGS (de qualidade variável)
▪ https://chat.openai.com/share/334d7da4-bf35-468b-8066-7ef60889e794
▪ # escrever um ensaio baseado em um título sugerido
▪ não é ótimo para fazer referências, mas há um plug-in ScholarAI para isso
▪ e https://blog.core.ac.uk/2023/03/17/core-gpt-combining-open-access-research-
and-ai-for-credible-trustworthy-question-answering/
ESCREVENDO UMA PROPOSTA DE PESQUISA
▪ Peça de resistência :
▪ https://chat.openai.com/share/cb2e9d26-0a1d-4a21-81a9-9a4d493c2d42
3. Conceitos básicos de RAG (45 min)
- Configuração e autenticação
Consulta
Pré-treino Fine Tuning
{}
Usuário
Conjunto de dados gigantesco Base LLM LLM Ajustado Resposta
Organização/Domínio
Conjunto de dados específico
RETRIEVAL-AUGMENTED GENERATION (RAG)
GERAÇÃO AUMENTADA POR RECUPERAÇÃO
Sistema de
controle de
qualidade
Pré-treino Consulta
{}
Consulta + Procurar
relevante
documentos
Organização/Domínio
Conjunto de dados específico
PRINCIPAIS DIFERENÇAS
Integração de Processo de
Adaptabilidade
conhecimento inferência
Banco de dados Fácil de usar Lida com dados Recursos de pesquisa Flexível com dados Orientado pela
focado em IA complexos avançada comunidade e código
automaticamente aberto
PESQUISA SEMÂNTICA
▪ Jornada de dados
▪ Tipos de dados
▪ 3 POCs:
▪ Equipamentos: cromatógrafos
▪ Tratamento de dados: vagões
▪ Conhecimento gerado em ensaios: biorreatores
▪ Dores → funcionalidades
▪ Mapeamento das informações (amostras, produtos, análises, metodologias,
laboratórios, colaboradores, equipamentos, outros)
POC - BIOREATORES
▪ https://chatgpt.com/g/g-VLNLDWGeh-poc-bioreatores
▪ ChatGPT - POC-BioReatores
POC - BIOREATORES
POC - BIOREATORES
POC - BIOREATORES
POC - BIOREATORES
Ajudando a Aproveitar o
Poder da IA Generativa
Uso das APIs do ChatGPT
https://github.com/openai/openai-cookbook.git
PRÓXIMAS ETAPAS PARA VOCÊ
6
. Sessão de Perguntas e Respostas
https://www.vecteezy.com/vector-art/3352162-cute-characters-robot-with-question-mark
Obrigado!
https://www.linkedin.com/in/phdleal
instagram.com/ipt_oficial/
youtube.com/@IPTbr/
www.ipt.br