LLM

1. ¿Qué es un LLM?

LLM o «Large Language Model» es un algoritmo de modelo de lenguaje desarrollado usando una red neuronal entrenada con millones de parámetros, entrenados en grandes cantidades de texto sin etiquetar mediante aprendizaje autosupervisado o aprendizaje semisupervisado. El mayor exponente en la actualidad de este tipo de modelos de lenguaje es GPT-4 de la empresa OpenAI.

2. ¿Para qué sirve un LLM?

La función principal de un Large Language Model es servir de ayuda a los usuarios en sus consultas, dando una información actualizada hasta la fecha del entrenamiento de ese modelo (por ejemplo GPT-3 da respuestas hasta datos de Enero del 2023). A pesar de la ventaja que puede tener en filtrar la información haciendo un poco de buscador web, a veces puede tener «alucinaciones» esto se debe a que este tipo de modelos a pesar de tener memoria tiende a entender mal la consulta del usuario si este no mantiene una coherencia del tema con el modelo, confundiendo los parámetros dados o queriendo entregar información más actualizada respecto a su ultima fecha de entrenamiento, entregando al usuario una respuesta que es incorrecta. Cuando no ocurren estas alucinaciones las respuestas casi siempre tienden a ser la respuesta correcta a la consulta del usuario.

3. Ejemplos de un LLM

GPT-4 (OpenAI).
LaMDA (Google)
GPT-NeoX (EleutherAI)
Chinchilla (Deep Mind)
AlexaTM (Amazon)
LlaMA (Meta)
BLOOM (Hugging Face)

¿Necesitas integrar un Large Language Model para tu proyecto?

¡Nosotros podemos ayudarte con el desarrollo! somos especialistas en desarrollar proyectos basados en datos e inteligencia artificial.

Contáctanos