Open Source vs. Closed Source La batalla desatada de la IA

Los investigadores descubrieron que la Llama 2 tuvo un desempeño sólo ligeramente mejor que el azar en un examen médico, mientras que GPT-4 casi alcanzó un puntaje de aprobación.

Los modelos de IA generativa de código abierto aún están rezagados con respecto a GPT-4

Fuente de la imagen: MixImages – tech

Uno de los debates más candentes en el mundo de la inteligencia artificial (IA) generativa gira en torno a la rivalidad continua entre los modelos de código abierto y los modelos de código cerrado. Ambos lados tienen sus seguidores y detractores, pero ¿qué enfoque promete ofrecer soluciones de IA valiosas? ¡Sumerjámonos en el emocionante y feroz mundo de la IA y descubrámoslo!

Una batalla de titanes: Modelos de Lenguaje de Código Abierto y Código Cerrado

En la esquina de código abierto, tenemos una gran cantidad de grandes modelos de lenguaje (LLM) que son constantemente producidos por una comunidad vibrante de colaboradores. El líder de la manada es el impresionante Llama 2, un modelo de código abierto que ha ganado considerable atención.

Representando al campamento de código cerrado, están los formidables contendientes: GPT-4 de OpenAI y el modelo de lenguaje respaldado por capital de riesgo de la startup Anthropic, conocido como Claude 2.

🔗 Enlace relevante: Walmart presenta la IA generativa en CES

La clave para la victoria: el rendimiento en dominios específicos

Para determinar qué enfoque reina supremo, examinemos su rendimiento en dominios específicos. Tomemos, por ejemplo, el complejo dominio de la nefrología, la ciencia de los riñones. En un estudio reciente realizado por científicos de la Universidad de Pepperdine, la Universidad de California en Los Ángeles y la UC Riverside (publicado en NEJM AI), los modelos de código abierto fallaron, mientras que GPT-4 mostró su destreza.

🔗 Enlace relevante: La necesidad de gobernanza en la IA empresarial

“En comparación con GPT-4 y Claude 2, los modelos de código abierto tuvieron un desempeño deficiente en términos de respuestas correctas totales y calidad de sus explicaciones”, escribió el autor principal Sean Wu y sus colegas.

🔗 Enlace relevante: Los mejores chatbots de IA

GPT-4 destacó realmente, logrando una puntuación del 73.3%: casi al nivel de aprobación para una persona que responde preguntas de opción múltiple en nefrología.

Resultados de la batalla: Los modelos de código abierto luchan por mantenerse al día

Desafortunadamente, los modelos de código abierto, incluido Llama 2, fallaron al proporcionar respuestas precisas. Obtuvieron puntuaciones que no eran mejores que el azar. Sin embargo, Llama 2 logró superar ligeramente a sus contrapartes de código abierto, obteniendo un puntaje del 30.6%.

🔗 Enlace relevante: Cinco formas de usar la IA de manera responsable

Factores subyacentes: los datos médicos propietarios toman protagonismo

Existen muchas razones que contribuyen al desempeño mediocre de los modelos de código abierto. Especialmente, Anthropic y OpenAI han integrado datos médicos propietarios en sus procesos de entrenamiento, lo que les otorga una clara ventaja.

🔗 Enlace relevante: MedPerf busca acelerar la IA médica mientras mantiene los datos privados

El autor principal, Sean Wu, y su equipo señalaron que “los datos de alta calidad para entrenar LLM en el campo médico a menudo residen en materiales no públicos”. Estos datos, que consisten en fuentes curadas y revisadas por pares como libros de texto y artículos, siguen estando inaccesibles para la comunidad de código abierto. El acceso a esos exclusivos datos de entrenamiento médico probablemente sea un factor importante para determinar la mejora de los modelos de código abierto en el futuro.

🔗 Enlace relevante: Actualización: Teléfonos Google Pixel

Espacio para la mejora: Un largo camino por recorrer

Aunque el desempeño de GPT-4 fue admirable, es importante recordar que incluso falló en alcanzar una calificación de aprobación humana. Todos los modelos de lenguaje, independientemente de su apertura, tienen un largo camino por recorrer. Pero no temáis, hay iniciativas en el horizonte que podrían nivelar el campo de juego.

Entrenamiento federado: Un futuro más inteligente

Un esfuerzo transformador que está ganando impulso es el entrenamiento federado, donde los modelos de lenguaje se entrenan con datos privados y luego contribuyen con su conocimiento a un esfuerzo conjunto en la nube pública. Este enfoque tiene como objetivo cerrar la brecha entre los datos médicos confidenciales y el impulso colectivo para fortalecer los modelos de código abierto. Un destacado esfuerzo en este espacio es MedPerf, iniciado por el consorcio de la industria ML Commons.

🔗 Enlace relevante: El tremendo esfuerzo de Apple en IA

Desatando el poder de la colaboración

Otra vía prometedora es la destilación potencial de modelos comerciales en programas de código abierto. Al heredar competencias médicas específicas de sus modelos originales, estos programas de código abierto pueden ofrecer resultados mejorados. MedPaLM, el LLM de Google DeepMind especializado en responder preguntas médicas, es un ejemplo notable.

🔗 Enlace relevante: Cursos de imágenes de IA en Udemy

Cuando los mundos chocan: Potenciando resultados para un impacto máximo

Incluso sin un entrenamiento médico específico, los modelos de lenguaje pueden lograr resultados mejorados utilizando la “generación aumentada por recuperación.” Este enfoque empodera a los LLM para buscar información externa mientras forman sus resultados, amplificando las capacidades de las redes neuronales.

La ventaja abierta: Creatividad colaborativa

En última instancia, la naturaleza abierta de modelos como Llama 2 ofrece oportunidades infinitas para que diversos actores contribuyan y mejoren. A diferencia de los modelos de código cerrado como GPT-4 y Claude 2, el destino de los modelos de código abierto sigue siendo verdaderamente democrático.

¡Prepárate para una batalla de IA, donde la innovación, la creatividad y la colaboración pavimentarán el camino hacia modelos de lenguaje superiores!

🎉 ¡Sigamos con las discusiones! Comparte tus pensamientos sobre el debate de código abierto versus código cerrado en los comentarios a continuación. ¡Y no olvides difundir la palabra compartiendo este artículo en las redes sociales! 📢

Lista de referencias:

  1. Walmart presenta IA generativa en la CES
  2. La necesidad de gobernanza de IA en las empresas
  3. Los mejores chatbots de IA
  4. Cinco formas de utilizar la IA de manera responsable
  5. MedPerf busca acelerar la IA médica mientras mantiene los datos privados
  6. Actualización: Teléfonos Google Pixel
  7. El tremendo esfuerzo de Apple en IA
  8. Cursos de imágenes de IA en Udemy