Search Dental Tribune

A IA passa nos exames odontológicos do Reino Unido: implicações para a educação e avaliação do BDS

Um novo estudo demonstrou o valor significativo de modelos de linguagem de grande porte para a educação odontológica, ao mesmo tempo em que apontou suas limitações importantes. (Imagem: irissca/Adobe Stock)

MANCHESTER, Inglaterra: Talvez a aplicação mais útil e difundida da inteligência artificial (IA) na vida de uma pessoa comum seja o modelo de linguagem de grande porte (LLM) — um tipo de modelo de aprendizado de máquina no qual confiamos para respostas conversacionais a uma ampla gama de perguntas, desde conselhos de vida até simples checagem de fatos. Um novo estudo no Reino Unido avaliou o desempenho de três LLMs populares — Gemini, ChatGPT e Grok — em avaliações dos programas de Bacharelado em Cirurgia Dentária (BDS) e de Higiene e Terapia Dentária (DHT). A pesquisa destaca como os LLMs podem apoiar a educação odontológica, mas também expõe limitações importantes, particularmente na geração de conteúdo para avaliação de alunos.

Pesquisas demonstraram que os LLMs são capazes de passar em exames na área médica , embora uma análise clara de seu papel na educação odontológica, bem como uma comparação de várias plataformas, tenha estado ausente. O novo estudo tentou abordar essa lacuna e mostrou que todos os três LLMs foram capazes de passar em todas as avaliações em 260 questões de múltipla escolha, 80 provas de resposta curta e três exames orais estruturados extraídos dos currículos BDS e DHT. O desempenho em questões de múltipla escolha foi consistente em todos os modelos, e nenhuma diferença significativa foi encontrada. Em provas de resposta curta, no entanto, ChatGPT e Grok superaram significativamente Gemini na coorte DHT.

Isso tem implicações clínicas e educacionais importantes. A capacidade dos LLMs de responder a perguntas escritas em todos os anos dos programas BDS e DHT sugere que essas ferramentas podem ser usadas por alunos para apoiar a revisão e por educadores para avaliar o progresso dos alunos. Os resultados também reforçam resultados de pesquisas anteriores que demonstraram que os LLMs são uma ferramenta altamente valiosa na educação odontológica, apesar dos riscos de segurança cibernética que podem representar.

No entanto, quando solicitados a gerar questões de exame e esquemas de avaliação originais, todos os LLMs apresentaram deficiências notáveis. Os problemas incluíam esquemas de avaliação excessivamente complexos ou vagos, uso indevido de terminologia clínica, dupla negação nos enunciados das questões e questões que não se alinhavam com os resultados de aprendizagem pretendidos. De forma crucial, a maioria das questões geradas atingia apenas os níveis mais baixos da taxonomia de Bloom e da pirâmide de Miller, concentrando-se na recordação de fatos em vez da aplicação ou raciocínio clínico.

Para a educação odontológica, isso sugere que, embora os LLMs possam auxiliar na aprendizagem formativa e na avaliação de baixo risco, eles ainda não podem substituir de forma confiável a contribuição humana na concepção de ferramentas de avaliação somativa de alta qualidade. Isso é particularmente importante no programa BDS, onde as avaliações devem apoiar a progressão de um clínico iniciante a um clínico competente por meio de um currículo estruturado.

O estudo conclui que LLMs como ChatGPT e Grok têm valor no apoio à educação em BDS, especialmente no esclarecimento de dúvidas e na geração de rascunhos de conteúdo. No entanto, a supervisão humana continua essencial para garantir a precisão clínica, o alinhamento com os padrões do General Dental Council e a avaliação significativa do conhecimento aplicado. À medida que as ferramentas de IA continuam a evoluir, sua integração à educação odontológica deve ser criteriosa, baseada em evidências e liderada por educadores.

O estudo, intitulado “Performance of large language models (ChatGPT4‑0, Grok2 and Gemini) in UK dentistry and dental hygiene and therapy assessments”, foi publicado on-line em 20 de junho de 2025 no British Dental Journal , antes da inclusão em uma edição.

To post a reply please login or register
advertisement
advertisement