0% acharam este documento útil (0 voto)
26 visualizações101 páginas

Introdução Ao Chat GPT

O documento apresenta uma introdução ao ChatGPT, abordando suas funcionalidades, limitações e aplicações práticas em diversas áreas. O curso visa desmistificar os Modelos de Linguagem de Grande Escala (LLMs) e inclui tópicos como Engenharia de Prompt, uso de APIs e considerações éticas. Além disso, discute o futuro das LLMs e promove um desafio de transformação digital para 2024.
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
26 visualizações101 páginas

Introdução Ao Chat GPT

O documento apresenta uma introdução ao ChatGPT, abordando suas funcionalidades, limitações e aplicações práticas em diversas áreas. O curso visa desmistificar os Modelos de Linguagem de Grande Escala (LLMs) e inclui tópicos como Engenharia de Prompt, uso de APIs e considerações éticas. Além disso, discute o futuro das LLMs e promove um desafio de transformação digital para 2024.
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
Você está na página 1/ 101

UMA INTRODUÇÃO AO

CHATGPT
Prof. Dr. Adriano Leal
OBJETIVOS PRIMÁRIOS
PERDER O MEDO e desmitificar os Modelos de Grandes Modelos
de Linguagem (LLMs). Além disso, abordaremos o seguinte:
• Introduzir as Funcionalidades Pagas do ChatGPT-4 Omni:
Apresentar e explorar, as funcionalidades avançadas disponíveis na
versão paga do ChatGPT-4 Omni;
• Explorar o Potencial das LLMs: Discutir as capacidades e aplicações
práticas desses modelos em diversas áreas;
• Compreender as Limitações Atuais: Identificar as restrições técnicas
e desafios enfrentados pelos LLMs no cenário atual;
• Analisar o Futuro das LLMs: Refletir sobre como as limitações atuais
podem evoluir e quais inovações podem surgir.
Agenda
1. Introdução ao ChatGPT (30 min)
3. Conceitos básicos de RAG (45 min)
- Histórico e evolução do ChatGPT
- Definição e importância do Retrieval-Augmented Generation (RAG)
- Principais funcionalidades e aplicações
- Arquitetura e funcionamento do RAG
- Definição e importância dos embeddings em LLMs
- Exemplos práticos e estudos de caso
2. Demonstração prática de interação com o ChatGPT 4 Omni (1h 15)
4. Uso das APIs do ChatGPT (1h)
- a. Conceitos de Engenharia de Prompt
- Introdução às APIs do ChatGPT e Instalação do Jupyter Notebook
- b. Criação de emails personalizados
- Configuração e autenticação
- c. Uso do Consensus para revisão bibliográfica
- Exemplos de integração com outras aplicações
- Como o ChatGPT pode auxiliar na coleta e análise de literatura
- Boas práticas de uso e segurança
- Exemplos práticos de uso do Consensus
5. Anúncio do Desafio de Transformação Digital 2024 (5 minutos)
- d. Explorando outros GPTs
- Objetivo do DTD 2024: conhecer os usos do ChatGPT no IPT
- Criando Logotipos e Arte Gráfica
6. Sessão de Perguntas e Respostas
- Criando seu próprio GPT a partir de refinamento de contexto

3
AGRADECIMENTOS
COMEMOREMOS AS NOSSAS GRANDES E PEQUENAS CONQUISTAS

Gostaria de iniciar este curso expressando minha profunda gratidão a todos nós
que contribuimos na acumulação do conhecimento necessário para que este
momento se tornasse realidade.

Parafraseando o que é belamente dito em Ecl. 3:2, 'Tudo tem o seu tempo
determinado, e há tempo para todo o propósito debaixo do céu. há um tempo
para plantar e um tempo para colher'. Hoje, colhemos os frutos de um esforço
coletivo, resultado do trabalho árduo e dedicação de todos nós do IPT.

Este curso é uma prova concreta de que, quando unimos forças, somos capazes de
expandir nossos horizontes, trazer novos conhecimentos e avanços do exterior
para o fortalecer o IPT.

Espero que continuemos a plantar juntos e colhermos ainda mais frutos no futuro.
Isso é um dos Resultados de inúmeros “esforços
de formiguinhas”
▪ Projeto PDIP – Zehbour Panossian, Landgraff, ▪ Grupo de Transformação Digital – Abraham Yu,
Adriano Marin, Mario Boccalini Junior, Eliza Ota, Elisa Sales, Adriana Brito e Luciana
Morais, e muito mais.
Alessandro Santiago dos Santos, Alex Vallone,
Liedi e muitas outras pessoas fantásticas. ▪ Center for Science, Technology CC&T – Inova HC -
Claudia Teixeira e Helena Correa
▪ Pós Doutorado em Berlim – Jefferson Gomes ▪ Representando o pessoal que nos incentiva e
de Oliveira, Maria Cristina D. F, Mario Miyake, apoia sempre de forma abnegada e altruísta:
Alessandro Santiago dos Santos, entre outros. Alais Telles, Silvia Ferrari, Erika Soares, Elaine
Correia, Edna Gubitoso, Itanna Caroline M de
▪ Plataforma IASMIN/TD – Maria Cristina Oliveira, Ester Garcia, Fabrícia Garcia, Lindomar
Domingues, Denis Bruno Virissimo, André Guedes, Tatiana Mestres, Melissa Revoredo
Delfino, entre outros. Braga, Fulvio Vittorino, entre outras e outros.

▪ Projeto Prometheus – Natália Cerize,


▪ E a todos e todas que trabalham abnegados, por
Bruno Verona, André, Thiago, Cristina, etc. amor ao IPT e à nossa Missão.
EMBARCANDO
EM UMA
ODISSEIA MENTAL: VAMOS
COMEÇAR...

Vamos alçar vôo em


nossos parapentes
mentais!! Enjoy!
.
Dunning Kruger Effect
Borrowed smarts working knowledge Caveat: I can do anything Retire

Peak “Mount Stupid” Forgetfulness

Mastery
10,000 hours Plateau of productivity
Vocab-basics-practice New material
Confidence

Slope enlightenment
Tricky

……………………………………. Disillusioned expert


Encouraging

Acceptance of not knowing brings humility

With can-do And non-acceptance lets you go through of disillusionment


attitude
Valley of Despair

Experience

Enthusiasm Despair Enlightenment Forgetfulness


CAPACITAÇÕES
IMPORTANTES PARA IA

▪ Plataforma: Anaconda
▪ Linguagens para IA: Python, C, C++
▪ Bibliotecas Python da Anaconda:
Scipy, PyTorch, Tensorflow,
Deep Learning, Scikit-learn.

Consultem IEEE Dataport


https://ieee-dataport.org/
https://www.kaggle.com/datasets
O QUE É MAIS ADEQUADO?

9
MELHORANDO A ANALOGIA...

10
11
Caveat emptor ▪ OpenAI na prática
ATENÇÃO!!! https://github.com/openai/openai-cookbook
é uma expressão em língua latina
que significa, literalmente,
“cuidado, comprador". Em uma
NUNCA ABRA MÃO tradução livre, significa "o risco é
do comprador". Ao colocar à venda
DO BOM-SENSO. um produto sob as regras do
caveat emptor, o vendedor diz que
não garante a qualidade ou
procedência do produto.

No nosso caso, Cuidado com os


códigos do Github, pois eles podem
estar desatualizados ou se
desatualizarem com o passar do
tempo.
RECURSOS
▪ Configurações LLM | Prompt Engineering Guide (promptingguide.ai)
▪ OpenAI Platform
▪ Sci-Fi Models for Reasoning (chatgpt.com)
▪ https://learn.deeplearning.ai/courses/ai-python-for-
beginners/lesson/8/combining-text-and-calculations

▪ https://youtu.be/BQTXv5jm6s4?si=QhcxsxC6igwnrJm1 (Histórico da
Inteligência Artificial e tópicos de discussão éticos atuais – As opiniões são
do autor deste vídeo. Não presuma meu apoio ou oposição, mas é
importante conhecer as discussões atuais.)

▪ git clone https://github.com/openai/openai-cookbook.git


INTRODUÇÃO AO
CHATGPT
CHATGPT: O QUE É

▪ GPT (Generative Pre-trained Transformers) prevê a próxima


palavra em uma sequência, gerando texto coerente e
contextualmente relevante.
▪ Modelo de linguagem AI desenvolvido pela OpenAI
▪ GPT-2: Lançado em fevereiro de 2019.
▪ GPT-3: Lançado em junho de 2020.
▪ GPT-3.5: Lançado em novembro de 2022, inicialmente através do serviço API da
OpenAI.
▪ GPT-4: Lançado em março de 2023.
▪ GPT-4º: Maio de 2024 com atualização de conhecimento até outubro de 2023
▪ Aproveita o LLM para compreender e gerar texto semelhante ao humano
CHATGPT: O QUE NÃO É (CAVEAT EMPTOR)

▪ NÃO é um mecanismo de pesquisa (searchGPT.... Está mudando.)


▪ NÃO é um humano: sem experiências, emoções ou consciência; nenhum
raciocínio; nenhuma inteligência; sem compreensão ou consciência
▪ NÃO infalível: pode fornecer informações imprecisas ou enganosas
▪ NÃO é capaz de aprender em tempo real; só sabe o que sabe, mas tem
memória.
▪ NÃO é o mais adequado para fornecer aconselhamento pessoal, jurídico,
médico ou financeiro.
▪ NÃO é um substituto para um professor, conselheiro ou tutor
▪ Resumos de documentos ▪ Assistência de
programação (Python,
▪ Perguntas e JavaScript, Java,
respostas/recuperação HTML/CSS, etc.)
de informações
▪ Resolvendo equações
CAPACIDADES ▪ Escrita criativa (poemas,
histórias, etc.)
matemáticas
▪ Brainstorming e geração
DO CHATGPT ▪ Elaboração de e-mails e
documentos
de ideias
4.OMNI ▪ Resumo das Notícias do
dia na Internet

Entrada multimodal (v 4o – texto, áudio, imagens)


• Idiomas principais: 13 (incluindo inglês, espanhol, francês,
alemão, italiano, português, chinês, japonês, coreano, russo,
árabe, hindi, e bengali).
• Outros idiomas: 20 (abrangendo uma gama de línguas como
sueco, holandês, polonês, turco, vietnamita, tailandês, grego,
entre outros).
• Línguas regionais e minoritárias: 10 (incluindo línguas como
catalão, galego, basco, galês, maori, inuíte, quechua, etc.).
USO ACADÊMICOS POSSÍVEIS

▪ Resumir ou parafrasear textos acadêmicos


▪ Responder a perguntas relacionadas à pesquisa
▪ Auxiliar na redação de artigos e relatórios
▪ Compreender e explicar conceitos complexos
▪ Fazer anotações ou resumir palestras e seminários
▪ Analisar e interpretar dados
▪ Gerar materiais práticos para estudo e ensino
▪ Preparar apresentações acadêmicas
▪ Traduzir textos acadêmicos para outros idiomas
USO NÃO ACADÊMICO

▪ Organização de cronograma pessoal e de projetos


▪ Criação de currículos, cartas de apresentação ou inscrições para
estágios/empregos
▪ Geração de conteúdo e ideias para eventos sociais ou acadêmicos
LIMITAÇÕES DO GPT DE BATE-PAPO

▪ O conhecimento termina em outubro de 2023*; as informações pré-


Internet são escassas
▪ Sobre as fontes, notas de rodapé ou links fornecidos para suas respostas:
▪ Podem não ser confiáveis se a sua pergunta fizer parte de seu treinamento. Mesmo
se você perguntar, pode alucinar.
▪ Você SEMPRE DEVE comprovar os resultados com pesquisas!
▪ Pode “alucinar” e inventar coisas
CONSIDERAÇÕES
ÉTICAS
CONSIDERAÇÕES ▪ Vieses e justiça ▪ Propriedade intelectual
ÉTICAS EM TORNO ▪ Precisão/Desinformação ▪ Dependência e tomada de
decisão
DO CHATGPT ▪ Uso Ético
▪ Privacidade e segurança de ▪ Transparência e Divulgação
dados ▪ Piora da exclusão digital
O QUE EU POSSO FAZER PARA AJUDAR?
▪ Incentive o uso responsável e ético da IA;
▪ Respeito ao nível de sigilo dos projetos não utilizando ferramentas de IA gratuitas que
não se comprementem com o sigilo ou se esquecendo de ativar o opt-out de
privacidade da sua assinatura do Chatgpt Plus;
▪ O ChatGPT tem noções de mundo limitadas, com base em dados disponíveis até sua
última atualização. Ele não tem acesso a eventos atuais em tempo real ou
entendimento próprio. Sempre verifique informações com fontes confiáveis e
atualizadas;
▪ Incentive a análise crítica do resultado final, afinal é uma tradição do IPT;
▪ Especialistas da área de dominio da aplicação da IA devem ser sempre consultados e
participarem ativamente para que se mitigue as alucinações e imprecisões da IA;
▪ Forneça diretrizes éticas claras e basilares, mas ...
▪ evite microgerenciar, “forçar a barra” ou, como dizem os da Geração Z, ser um "Desnecessauro”.

Desnecessauro: Uma combinação de "desnecessário" e "dinossauro," referindo-se a


alguém que insiste em regras ou condutas que parecem antiquadas ou irrelevantes.
COMO ESCREVER PROMPTS BEM-SUCEDIDOS

▪ Palavras tem significado: Seja claro e simples de entender, evite


ambiguidades.
▪ Fale com a IA como falaria com uma pessoa.
▪ Use solicitações interativas com perguntas de várias etapas.
▪ Forneça antecedentes e contexto.
▪ Seja respeitoso, os resultados são melhores.
1. Comece com uma
palavra de ação
2. Adicionar contexto
3. Seja específico e claro
4. Experimentar/Iterar

5. Use exemplos
6. Especifique o
ESCREVENDO PROMPTS 7.
comprimento
Esclareça o tom
EFICAZES 8. Revise e refine
DICAS IMEDIATAS: ADICIONE ...

▪ Função : “Atuar como um estudante universitário” ou “Você é um


candidato a emprego”.
▪ Tarefa : “Esboçar um ensaio” ou “Criar uma carta de apresentação”
▪ Contexto : “Para um trabalho de literatura inglesa”
▪ Restrições : “Evitar voz passiva” ou “oferecer soluções”
▪ Objetivo : “Selecionar tópicos que possam ser discutidos em pequenos
grupos.”
▪ Saída : “500 palavras” ou “não mais que 100 caracteres”
INICIANTES DE PROMPT SIMPLES ...

▪ Planeje uma viagem para [ onde ] para ver [ o que ]


▪ Escreva um poema sobre [ tópico ]
▪ Faça um teste sobre [ tópico ]
▪ Brainstorm de ideias de conteúdo para [ o que ] sobre [ tópico ]
▪ Explique o [ tópico ] para que [ quem ] possa entender
▪ Ajude-me a estudar vocabulário para um exame de [ tópico ]
▪ Resuma [ livro ou artigo ] de [ autor ]
… EXEMPLOS DE PROMPTS SIMPLES

▪ Planeje uma viagem à Irlanda para ver a Pedra de Blarney


▪ Escreva um poema sobre golfinhos
▪ Questione-me sobre as capitais europeias
▪ Brainstorm de ideias de conteúdo para meu blog sobre neurodiversidade
▪ Explique a fissão nuclear para que um aluno do ensino médio possa
entender
▪ Ajude-me a estudar vocabulário para um exame de História Americana
▪ Resuma Romeu e Julieta de William Shakespeare
EXEMPLOS DE SOLICITAÇÕES PARA PROFESSORES

▪ Crie um plano de aula para uma aula de [ nível de aluno ] sobre [ conceito
sendo ensinado ] que inclua objetivos de aprendizagem, atividades criativas
e critérios de sucesso.
▪ Crie uma lista de atividades interativas em sala de aula para [ tipo/nível de
aluno ] em [ conceito que está sendo ensinado ]
▪ Crie uma lista de [#] estratégias de ensino que poderiam ser usadas para
envolver e desafiar estudantes universitários de diferentes níveis de
habilidade em uma aula sobre [ conceito sendo ensinado ]

https://www.promptingguide.ai/pt/introduction/settings
GRANDES
MODELOS DE
LINGUAGEM
COMO FUNCIONAM OS GRANDES MODELOS DE LINGUAGEM (LLMS)?

▪ LLMs geram a próxima palavra provável (“token”) em uma frase


(“sequência”)
▪ token: unidade de texto, por exemplo, palavra, caractere. 1 palavra ~ 0,75 token
▪ sequência: contexto - seção (“janela”) do texto, por exemplo, frase, parágrafo, livro
▪ a entrada no chatGPT é de 4.096 tokens; Claude 2 tem 100 mil tokens
LLMS “ENTENDEM O SIGNIFICADO”
▪ Aprender com um grande corpus permite que os LLMs compreendam o
significado das palavras.

Por exemplo
▪ os dados de treinamento podem consistir em muitas frases começando com “minha cor
favorita é…”
▪ a próxima palavra será uma cor, permitindo que os LLMs agrupem as palavras “vermelho,
azul, verde…” em um conjunto que represente o conceito de “cor”

▪ É importante notar que os LLMs realmente não entendem nada. Eles criam
padrões estatísticos que agrupam tokens semelhantes com base em uma medida
complexa de quão semelhantes ou diferentes eles são.
DADOS USADOS PARA TREINAR LLMS
▪ LLMs são treinados de maneira não supervisionada em grandes quantidades de dados licenciados e de
código aberto, por exemplo
▪ The Pile (825 GB, incluindo web, artigos, patentes, livros, ArXiv , Stack Exchange, problemas de matemática, código de
computador)
▪ Rastreamento comum (cerca de 20 bilhões de URLs)
▪ GPT3: parâmetros 175B; GPT4: não divulgado: est. 500B – 1000B – quanto maior, melhor (por enquanto, pelo menos)

▪ As respostas são refinadas usando pares pergunta-resposta (“ InstructGPT ”) da web, humanos ou


bootstrap (ou seja, o LLM gera seus próprios pares)

▪ a aprendizagem por reforço com feedback humano (RLHF) é usada para recompensar LLMs por darem
respostas apropriadas (“proteção”)

▪ “IA Constitucional” – treinada para filtrar respostas baseadas, por exemplo, na Declaração Universal dos
Direitos Humanos (Claude 2)
PREVISÃO DA PRÓXIMA PALAVRA

▪ é influenciado pela frequência com que a palavra é vista em vários


contextos
▪ mas há um certo grau de aleatoriedade de modo que a palavra com maior
probabilidade nem sempre é vista

verde 9,7%
vermelho 15%
Minha cor favorita é
rosa 11,6%
puce 2,3%
FAREI UMA
DISGRESSÃO

NLP &
TRANSFORMERS
https://transformer-
circuits.pub/2021/framework/ind
ex.html#two-layer-attention-only-
transformers

https://www.gptlearninghub.ai/co
dingproblems
NLP TASKS/APPLICATIONS

▪ Text classification, clustering, summarization


▪ Machine translation
▪ Conversational chatbots
▪ Question answering
▪ Speech synthesis & recognition
▪ Text generation
▪ Auto-correcting

36
NLP IS POP, BUT IT IS HARD!

▪ Homonymy, polysemy, …

Jaguar is the luxury vehicle brand of Land Rover.


The jaguar is an animal of the genus Panthera native to the
Americas

▪ Natural languages are unstructured, redundant and ambiguous.

Enraged cow injures farmer with ax.


EMBEDDING MODELS
Modelo de Embedding Tamanho do Vetor
Word2Vec (Google News) 300
GloVe (Common Crawl 42B) 300
GloVe (Twitter) 200
fastText (Wikipedia + Common Crawl) 300
BERT (base) 768
BERT (large) 1024
RoBERTa (base) 768
RoBERTa (large) 1024
GPT-2 (small) 768
GPT-2 (medium) 1024
GPT-3 (Davinci) 12288
GPT-4 Não divulgado
GPT-4o Não divulgado
ALBERT (base) 768
ALBERT (large) 1024
Sentence-BERT (base) 768
Sentence-BERT (large) 1024

38
WORD2VEC

▪ Efficient Estimation of Word Representations in Vector Space, September


7th, 2013.
▪ Distributed Representations of Words and Phrases and their
Compositionality, October 16th, 2013. (20K+ citations)

Tomas Mikolov
Idea: each word can be represented by a fixed-length
numeric vector. Words of similar meanings have
2013 similar vectors. 39
WORD2VEC

▪ Each word in the vocabulary is represented using one hot encoding (aka
local representation!).

Credits: Marco Bonzaninin 40


WORD2VEC

Credits: Marco Bonzaninin 41


WORD2VEC

Credits: Marco Bonzaninin 42


WORD2VEC

Skip-gram NN
architecture

The amount of neurons in the hidden layer (a hyperparameter) determines de size43 of the embedding.
WORD2VEC

44
WORD2VEC

▪ word2vec captures context similarity:


▪ If words wj and wk have similar contexts, then the model needs to output very
similar results for them.
▪ One way for the network to do this is to make the word vectors for wj and wk very similar.
▪ So, if two words have similar contexts, the network is motivated to learn similar
word vectors for them.

45
WORD2VEC

Credits: http://jalammar.github.io/illustrated-word2vec/
46
“CLASSICAL” ENCODER-DECODER MODEL

“The idea is to use one LSTM to read the input sequence, one
timestep at a time, to obtain large fixed-dimensional vector
representation, and then to use another LSTM to extract the
output sequence from that vector

2014 47 recurrent architecture


ENCODER-DECODER MODEL WITH ATTENTION

2015 48 recurrent architecture


ATTENTION MODELS INTO RECURRENT NNS

2015 Bahdanau et al 2015


49
TRANSFORMERS

ATTENTION

“We propose a new simple network


architecture, the Transformer, based

2017 solely on attention mechanisms,


dispensing with recurrence and
convolutions entirely.” 50 feedforward architecture!
TRANSFORMERS

Transformers are the current SOTA neural


architecture when it comes to produce text
representations to use in most NLP tasks.

Also:
▪ Positional Encoding
▪ Multi-Head Attention
The following pages use content authored by Jay Alammar.
https://jalammar.github.io/illustrated-transformer/ 51 From Vaswani et al (2018)
https://github.com/jalammar
SELF-ATTENTION

Jaguar A wild animal?

A luxury car?

52
SELF-ATTENTION

Jaguar is the luxury vehicle brand of Land Rover.

The jaguar is an animal of the genus Panthera native to the


Americas

53
SELF-ATTENTION

Jaguar is the luxury vehicle brand of Land Rover.

The jaguar is an animal of the genus Panthera native to the


Americas

In a sentence, items are not


related only by proximity, but
mainly by semantic meaning.

54
SELF-ATTENTION

Jaguar is the luxury vehicle brand of Land Rover.

𝑣1 𝑣2 𝑣3 𝑣4 𝑣5 𝑣6 𝑣7 𝑣8 𝑣9

55
SELF-ATTENTION

Jaguar is the luxury vehicle brand of Land Rover.

We need a mechanism to
𝑣1 𝑣2 𝑣3 𝑣4 𝑣5 𝑣6 𝑣7 𝑣8 𝑣9 transform these vectors to
take context
into consideration.

56
SELF-ATTENTION

Jaguar is the luxury vehicle brand of Land Rover.

𝑣1 𝑣2 𝑣3 𝑣4 𝑣5 𝑣6 𝑣7 𝑣8 𝑣9

Transformation mechanism

𝑣1 𝑣2 𝑣3 𝑣4 𝑣5 𝑣6 𝑣7 𝑣8 𝑣9 More
contextualized
vector57
SELF-ATTENTION

Jaguar is the luxury vehicle brand of Land Rover.

𝑣1 𝑣2 𝑣3 𝑣4 𝑣5 𝑣6 𝑣7 𝑣8 𝑣9

Self-attention

𝑣1 𝑣2 𝑣3 𝑣4 𝑣5 𝑣6 𝑣7 𝑣8 𝑣9 More
contextualized
vector58
SELF-ATTENTION

dot
product
Jaguar is the luxury vehicle brand of Land Rover.
𝑣1 ⋅ 𝑣1 = 𝑤11 𝑤11
𝑣1 ⋅ 𝑣2 = 𝑤12 𝑤12
𝑣1 ⋅ 𝑣3 = 𝑤13 𝑤13
𝑣1 ⋅ 𝑣4 = 𝑤14 normalization 𝑤14
𝑣1 ⋅ 𝑣5 = 𝑤15 𝑤15
𝑣1 𝑣2 𝑣3 𝑣4 𝑣5 𝑣6 𝑣7 𝑣8 𝑣9 𝑣1 ⋅ 𝑣6 = 𝑤16 𝑤16
𝑣1 ⋅ 𝑣7 = 𝑤17 ෍ 𝑤 1𝑗 = 1 𝑤17
𝑣1 ⋅ 𝑣8 = 𝑤18 𝑗 𝑤18
Self-attention 𝑣1 ⋅ 𝑣9 = 𝑤19 𝑤19
The new representation for “Jaguar” 𝑣1 = 𝑤11 𝑣1 + 𝑤12 𝑣2 + 𝑤13 𝑣3 + 𝑤14 𝑣4 + 𝑤15 𝑣5 + 𝑤16 𝑣6 + 𝑤17 𝑣7 +
(𝒗𝟏 ) is influenced by the presence of
“luxury”, “vehicle” and “brand” in the 59
sentence.
VOLTAMOS A
NOSSA
PROGRAMAÇÃO
NORMAL
▪ 2. Demonstração prática de interação com o ChatGPT 4 Omni (1h 15)
- a. Conceitos de Engenharia de Prompt
- b. Criação de emails personalizados
- c. Uso do Consensus para revisão bibliográfica
- Como o ChatGPT pode auxiliar na coleta e análise de literatura
- Exemplos práticos de uso do Consensus
- d. Explorando outros GPTs
- Criando Logotipos e Arte Gráfica
- Criando seu próprio GPT a partir de refinamento de contexto
LLMS PODEM (PARECEM) SER CRIATIVOS
▪ Uma consequência da aprendizagem baseada no contexto e da aleatoriedade
(temperatura) permite que os LLMs gerem resultados surpreendentes.
▪ Observe, porém, que eles não são criativos no sentido humano, mas movidos por
reconhecimento de padrões e algoritmos de previsão

Podemos usar LLMs para:


▪ identificar conceitos pouco semelhantes de diferentes disciplinas e ajudar a compreender
diferentes disciplinas
▪ gerar narrativas diversas
▪ ajuda com ambigüidade
▪ interpretação de papéis
CUIDADO!
▪ Os LLMs podem parecer “mentir” e “alucinar”, ou seja, dar respostas
factualmente incorretas às perguntas*
▪ como você sabe agora, eles não são treinados para lhe dar uma resposta objetivamente
correta!

▪ esta é alguma função de dados de treinamento (por exemplo, viés),


aprendizagem, pesquisa e probabilidade

▪ não acredite nos resultados – eles sempre precisam ser verificados, pelo menos
por enquanto

* LLMs não são pessoas. Eles não têm intencionalidade. Não os antropomorfize ☺
INTERAGINDO COM LLMS USANDO “PROMPT
ENGINEERING”
▪ Lembre-se de que a saída de um LLM é determinada tanto pelo que o
sistema foi treinado quanto pelas informações que você fornece a ele.

▪ Engenharia imediata significa adaptar suas perguntas e sugestões para que


você possa aproveitar ao máximo um LLM

▪ As solicitações podem assumir muitas formas, desde instruir o LLM a


assumir um papel (por exemplo, um professor prestativo, um pirata) ou
orientar a forma como deve processar os seus resultados (por exemplo,
“cadeia de pensamento” ou um método específico).
LLMS PODEM AJUDÁ-LO A PROJETAR PROMPTS
▪ as instruções não devem ser muito precisas (“Qual é a capital da Inglaterra?”) ou
muito vagas (“Fale-me sobre sustentabilidade”)

▪ às vezes você pode não saber como pedir a um LLM para realizar uma tarefa
▪ pergunte o que ele precisa e colabore com ele

Por exemplo
▪ “O que eu poderia pedir para me ajudar a refinar meus objetivos para um
ensaio?”
▪ “Você precisa de mais alguma informação?”
EXERCÍCIO: COMPREENDENDO CONCEITOS
COMPLEXOS
▪ Que tal pedir que resuma os avanços mais importantes de um paper
usando o LLM de sua preferência.

▪ Em primeiro lugar, gostaria que você pensasse no processo – como você


faria isso manualmente?
▪ quais estratégias você usaria?
▪ em que você se concentraria?
EXERCÍCIO: DRAMATIZAÇÃO
▪ Todos nós somos propensos ao pensamento de grupo. preconceito e pensamento
defensivo ou ações agressivas.

▪ Os LLMs podem ajudar-nos a compreender os pontos de vista diferentes,


desempenhando o papel de pessoas com posições antagonista e proporcionar um
“espaço seguro” para o debate!

▪ instrua seu LLM a adotar essas duas funções e debater de forma a acharem um acordo
mutuamente satisfatório. Diga-lhe para cumprir rigorosamente essas funções.

▪ Ao final, peça ao LLM para analisar a conversa e recomendar algumas leituras adicionais
para o seu aculturamento no tópico.
EXERCÍCIO: CONVERSAS SOCRÁTICAS ( PARA FAZER
MAIS TARDE )
▪ O método socrático de ensino é onde o professor faz perguntas abertas para ajudar a explorar
um tópico
▪ Ajuda o pensamento crítico, uma compreensão mais ampla e profunda
▪ Fácil de configurar em um LLM

Pergunte ao seu LLM


▪ assumir o papel de um professor prestativo
▪ para explicar as etapas envolvidas nas conversas socráticas
▪ isso funciona como um guia
▪ para solicitar um tópico e, em seguida, usar essas etapas como parte da conversa socrática

▪ você pode ter que intervir até obter o comportamento correto. Lembre-se que isso serve para
orientar o LLM!
EXERCÍCIO: TESTANDO SUA COMPREENSÃO ( PARA
FAZER MAIS TARDE )

▪ Você pode instruir um LLM a enviar uma mensagem de texto sobre sua
compreensão de um tópico usando perguntas de múltipla escolha e
respostas de formato livre
▪ Tente configurar isso, observando:
▪ muito provavelmente o padrão será um modelo MCQ padrão “um correto/três
incorretos”
▪ pergunte quais outros formatos ele conhece
▪ certifique-se de instruí-lo a parar após cada pergunta e explicar a resposta
depois de inseri-la.
▪ veja se você consegue fazer com que ele se comporte como um sistema de
teste auxiliado por computador (“CAT”)
USANDO LLMS NO MSC

Sci-Fi Models for Reasoning (chatgpt.com)


“IA CONVERSACIONAL”: POLÍTICA IMPERIAL
▪ “IA Conversacional” ( cAI ) inclui chatGPT, Bard, Bing e todas as ferramentas
semelhantes

▪ Pode haver um benefício educacional no uso adequado do cAI

▪ “ Enviar trabalhos e avaliações criados por alguém ou outra coisa, como se fossem seus,
é plágio e é uma forma de trapaça e isso inclui conteúdo gerado por IA. ”
▪ usar chatGPT etc. provavelmente constituiria trapaça intencional e poderia resultar em reprovação
em uma avaliação e, portanto, no mestrado.

https://www.imperial.ac.uk/about/leadership-and-strategy/provost/vice-provost-education/generative-ai-tools-
guidance/
O QUE VOCÊ NÃO PODE FAZER, ALGUMAS COISAS
QUE VOCÊ PODERIA FAZER E POR QUE DEVERIA FAZER
Não pode
▪ AI não pode ser autor ou coautor;
▪ AI não pode ser citado ou referenciado
▪ AI não pode pensar por você! During the preparation and revision of this manuscript, we utilized Overleaf,
ChatGPT-4, Grammarly, and Google Translate to ensure clarity and grammatical
precision, as English is our second language. The authors assume full responsibility
for the creation of the primary content, ensuring technical accuracy, and have
Poderia appropriately cited all secondary sources used in this publication.

▪ revisão, mas por que não usar Grammarly?


▪ identificar publicações, mas por que não usar Scopus/Scholar/Elicit/ ScholarAI?
▪ resumindo ideias
▪ pode sugerir formas de reestruturação, mas porque não falar com o seu
orientador?
EXEMPLOS

https://chatgpt.com/
EXERCÍCIO: SIMPLIFICAÇÃO
▪ AI pode ser usada para simplificar texto
▪ Esta simplificação pode ser feita em vários níveis de complexidade
▪ Este é um processo iterativo

No chatGPT digite o seguinte, usando seu texto


▪ leia e reconheça o seguinte texto. Aguarde mais instruções: “SEU TEXTO AQUI”
▪ por favor simplifique o texto

▪ alguma coisa precisa de mais simplificação ou expansão/ilustração? Foi resumido a um nível razoável (por
exemplo, criança, leitor instruído)?

https://chat.openai.com/share/fe8c982e-cda5-465c-ab44-eb996840d8fc
# Exemplo de Kraken
PERGUNTE O QUE É NECESSÁRIO PARA
PROCESSAR SUA SOLICITAÇÃO
▪ se você não tiver certeza de como desenvolver um prompt razoável, poderá solicitar ao sistema que
solicite as informações necessárias
https://www.promptingguide.ai/pt/introduction/settings

https://chat.openai.com/share/14790e46-a3f0-4df9-a682-789a994bd157
# Exemplo de ficção científica da revista Vector

▪ Ou você pode fazer com que descreva o que considera as etapas intermediárias

▪ Gostaria que você disponibilizasse algum texto acadêmico acessível para mim. Que informações você
precisa de mim para fazer isso com sucesso?

https://chat.openai.com/share/eaf2a21c-3eb0-4a1f-a00c-85cb5e79df79
# Exemplo de ficção científica da revista Vector
“DIRIGIBILIDADE”
▪ do chatGPT pode ser “dirigido” para assumir papéis específicos, por exemplo, tutor,
crítico, parceiro socrático, pirata (!). Muitas vezes referido como assumir um “papel”

▪ Saída sem direção:

https://chat.openai.com/share/2adbdcef-2a27-45cc-af57-1977b2ea6ab5

▪ A mesma opinião com steer: Você é um especialista pedagógico no ensino superior.


Você deve responder às contribuições do usuário, aconselhando sobre a melhor forma
de desenvolver e distribuir as contribuições do usuário aos alunos.

https://chat.openai.com/share/492ea8bf-1a00-47a2-bd56-5f5ecd075ecf
EXERCÍCIO: REESTRUTURAÇÃO DE TEXTO
▪ genAI pode ser usado para ler notas não estruturadas, identificar temas e reestruturar

▪ https://chat.openai.com/share/f8c6d841-3de2-47b4-a71f-9ecdc3258479
# competências normativas

Exercício. No chatGPT digite o seguinte, usando seu texto


▪ leia e reconheça o seguinte texto. Aguarde mais instruções: “SEU TEXTO AQUI”
▪ por favor identifique os principais temas do texto
▪ por favor reestruture o texto com base nesses temas

brincar com a reestruturação


precisa de expansão?
temas e subtemas podem ser identificados e transformados em códigos para análise qualitativa
TESTE DE COMPREENSÃO

Questionamento socrático
▪ https://chat.openai.com/share/89dd6a17-f6e0-4c50-afdf-b1efd6eb361b
▪ # Jornada nas Estrelas: TNG

avaliando a compreensão do conhecimento # veja o prompt correto nas notas


▪ https://chat.openai.com/share/84ccdd27-5f96-43e3-a596-7989f27487d7

ou diálogo:
▪ https://chat.openai.com/share/b231b3e0-fd8e-4aa3-ac84-a5d427deffaf
CHATGPT E ENSAIOS
▪ chatGPT foi usado para escrever código para processar dados e depois escrever
um artigo: https://www.nature.com/articles/d41586-023-02218-z
▪ então, pode escrever um ensaio SGS (de qualidade variável)

▪ https://chat.openai.com/share/334d7da4-bf35-468b-8066-7ef60889e794
▪ # escrever um ensaio baseado em um título sugerido

▪ não é ótimo para fazer referências, mas há um plug-in ScholarAI para isso
▪ e https://blog.core.ac.uk/2023/03/17/core-gpt-combining-open-access-research-
and-ai-for-credible-trustworthy-question-answering/
ESCREVENDO UMA PROPOSTA DE PESQUISA

▪ Peça de resistência :

▪ https://chat.openai.com/share/cb2e9d26-0a1d-4a21-81a9-9a4d493c2d42
3. Conceitos básicos de RAG (45 min)

- Definição e importância do Retrieval-Augmented Generation (RAG)

- Arquitetura e funcionamento do RAG

- Exemplos práticos e estudos de caso

4. Uso das APIs do ChatGPT (1h)

- Introdução às APIs do ChatGPT e Instalação do Jupyter Notebook

- Configuração e autenticação

- Exemplos de integração com outras aplicações

- Boas práticas de uso e segurança

5. Anúncio do Desafio de Transformação Digital 2024 (5 minutos)

- Objetivo do DTD 2024: conhecer os usos do ChatGPT no IPT

6. Sessão de Perguntas e Respostas


FINE TUNING V/S RAG
FINE TUNING

Consulta
Pré-treino Fine Tuning
{}
Usuário
Conjunto de dados gigantesco Base LLM LLM Ajustado Resposta

Organização/Domínio
Conjunto de dados específico
RETRIEVAL-AUGMENTED GENERATION (RAG)
GERAÇÃO AUMENTADA POR RECUPERAÇÃO

Sistema de
controle de
qualidade
Pré-treino Consulta
{}

Conjunto de Base LLM Usuário


Resposta
dados gigantesco

Consulta + Procurar
relevante
documentos

Organização/Domínio
Conjunto de dados específico
PRINCIPAIS DIFERENÇAS

Integração de Processo de
Adaptabilidade
conhecimento inferência

Requisitos de Transparência e Adequação da


recursos explicabilidade aplicação
BANCO DE DADOS DE VETORES (CHROMA DB)

Banco de dados Fácil de usar Lida com dados Recursos de pesquisa Flexível com dados Orientado pela
focado em IA complexos avançada comunidade e código
automaticamente aberto
PESQUISA SEMÂNTICA

▪ Compreendendo a pesquisa semântica


▪ Uso de dados de linguagem natural
▪ Vetorização de Texto
▪ Criando uma coleção pesquisável
▪ Consultando a coleção
▪ Recuperação dos resultados
LINKS
▪ https://github.com/chroma-core/chroma (Chroma DB)
▪ https://huggingface.co/sentence-transformers/all-MiniLM-L6-v2 (Sentence Transformer)
▪ https://www.kaggle.com/datasets/unanimad/the-oscar-award/data (Dataset)
POC - BIOREATORES

▪ Jornada de dados
▪ Tipos de dados
▪ 3 POCs:
▪ Equipamentos: cromatógrafos
▪ Tratamento de dados: vagões
▪ Conhecimento gerado em ensaios: biorreatores
▪ Dores → funcionalidades
▪ Mapeamento das informações (amostras, produtos, análises, metodologias,
laboratórios, colaboradores, equipamentos, outros)
POC - BIOREATORES

▪ https://chatgpt.com/g/g-VLNLDWGeh-poc-bioreatores
▪ ChatGPT - POC-BioReatores
POC - BIOREATORES
POC - BIOREATORES
POC - BIOREATORES
POC - BIOREATORES
Ajudando a Aproveitar o
Poder da IA Generativa
Uso das APIs do ChatGPT

- Introdução às APIs do ChatGPT e Instalação do Jupyter Notebook

- Configuração e autenticação API keys - OpenAI API

- Exemplos de integração com outras aplicações


Para usara api, vc tem de instalar a anaconda
- Boas práticas de uso e segurança https://repo.anaconda.com/archive/Anaconda3-2024.06-1-
Windows-x86_64.exe e depois baixar os arquivos de
https://github.com/openai/openai-cookbook.git

https://github.com/openai/openai-cookbook.git
PRÓXIMAS ETAPAS PARA VOCÊ

▪ Aprenda o máximo que puder


▪ Eduque-se sobre o que esta tecnologia pode fazer
▪ Explore seu potencial
▪ Jogue e experimente
▪ Seja cauteloso
▪ Falem um com o outro! Compartilhe o que você está usando/fazendo
Anúncio do
Desafio de Transformação Digital 2024

- Objetivo do DTD 2024: conhecer os usos do ChatGPT no IPT

6
. Sessão de Perguntas e Respostas

OBRIGADO! ALGUMA PERGUNTA?

https://www.vecteezy.com/vector-art/3352162-cute-characters-robot-with-question-mark
Obrigado!

Dr. Adriano Leal


leal@ipt.br

https://www.linkedin.com/in/phdleal

instagram.com/ipt_oficial/

youtube.com/@IPTbr/

www.ipt.br

Você também pode gostar

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy