OpenAI treinou um modelo baseado no GPT-4 para aprimorar a detecção de erros sutis, semelhantes aos do CriticGPT.
A OpenAI desenvolveu uma nova ferramenta, o CriticGPT, com base no GPT-4, com o objetivo de identificar falhas em respostas produzidas pelo ChatGPT. Segundo a empresa, ao contar com a assistência do CriticGPT para revisar os textos gerados pelo ChatGPT, os usuários conseguem resolver os problemas sem auxílio adicional em 60% das situações. A série de modelos GPT-4 que alimenta o ChatGPT é aprimorada por meio do ‘aprendizado de reforço a partir do feedback humano’ (RLHF, em inglês), o que implica que a plataforma aprimora seu desempenho à medida que os usuários, também conhecidos como treinadores de inteligência artificial, avaliam as respostas fornecidas pelo ChatGPT e apontam possíveis falhas.
Essa nova ferramenta, o CriticGPT, representa um avanço significativo no processo de correção de textos gerados por inteligência artificial. Ao utilizar o CriticGPT para revisar os conteúdos produzidos pelo ChatGPT, os usuários têm a oportunidade de aprimorar a qualidade das informações sem depender de intervenções externas. A integração do CriticGPT no fluxo de trabalho do ChatGPT promete facilitar a identificação e correção de erros, contribuindo para uma experiência mais eficiente e precisa na geração de textos automatizados.
CriticGPT: A Nova Ferramenta de Correção e Aperfeiçoamento
À medida que o modelo de aprendizado do ChatGPT avança, é natural que seus erros se tornem mais sutis e específicos, o que pode representar um desafio para os treinadores de inteligência artificial identificarem imprecisões no momento em que ocorrem. É aqui que entra o CriticGPT, uma ferramenta inovadora que promete auxiliar nesse processo.
O próximo passo, de acordo com a empresa responsável, é integrar modelos semelhantes ao CriticGPT no processo de reforço com feedback humano, possibilitando que as sugestões da IA sejam complementadas por insights gerados pela própria IA. Embora as recomendações do CriticGPT não sejam infalíveis, elas têm o potencial de auxiliar os treinadores de IA a identificar problemas que poderiam passar despercebidos.
Assim como o modelo GPT-4, o CriticGPT também evolui à medida que mais usuários utilizam a ferramenta e fornecem feedback. Um exemplo prático do CriticGPT em ação é sua capacidade de apontar possíveis erros do ChatGPT, como destacado pela OpenAI.
De acordo com a OpenAI, os testes comparativos entre os dois modelos revelaram que as correções feitas pelo CriticGPT superaram as do ChatGPT em 63% das vezes. Além disso, a nova ferramenta demonstrou menos ocorrências de alucinações, que são momentos em que a IA inventa informações falsas e as apresenta como verdadeiras.
No entanto, é importante ressaltar que o CriticGPT possui algumas limitações e pode oferecer suporte até certo ponto de especialização. Em situações extremamente complexas, mesmo um especialista, com o auxílio de um modelo como o CriticGPT, pode encontrar dificuldades para avaliar corretamente uma tarefa ou resposta.
Fonte: © CNN Brasil
Comentários sobre este artigo