🤖 Duelo de Chatbots Claude 3 vs Gemini Ultra 🌟

Anthropic, la startup de inteligencia artificial, ha lanzado un nuevo chatbot eficiente llamado Claude 3 Opus. Lo pusimos a prueba con nuestro propio criterio de evaluación.

“`html

Probamos el nuevo chatbot de Anthropic y nos sentimos un poco decepcionados. | ENBLE

¡Descubre qué chatbot impulsado por IA reina supremo!

Esta semana, Anthropic, la startup de IA respaldada por Google, Amazon y una impresionante lista de VC e inversores ángeles, lanzó su última creación: Claude 3. ¡Y vaya, tienen algunas afirmaciones audaces! Anthropic asegura que sus nuevos modelos superan a OpenAI’s GPT-4 en varios benchmarks. 💪

Ahora, no hay razón para dudar de las afirmaciones de Anthropic. Pero demos un paso atrás y consideremos un punto crucial: esos benchmarks son altamente técnicos y académicos, ciertamente no reflejan la experiencia del usuario promedio. Entonces, siendo los exploradores inquisitivos que somos en ENBLE, decidimos poner a prueba a Claude 3 en la vida real. Creamos una lista de preguntas que una persona promedio haría, abarcando temas desde política hasta salud. 🤔

Al igual que hicimos con el popular modelo GenAI de Google, Gemini Ultra, dirigimos nuestras preguntas al modelo más capaz de Claude 3 disponible, Claude 3 Opus. Nuestro objetivo era medir su rendimiento y ver cómo se compara con sus competidores en situaciones de la vida real. 🔍

¡Antecedentes sobre Claude 3: ¡Más de lo que Parece! 🕵️‍♂️

Opus, parte de la familia Claude 3, es un fantástico modelo multimodal. Se puede acceder a él a través de varias plataformas, incluyendo el plan Claude Pro de Anthropic, Bedrock de Amazon y las plataformas de desarrollo Vertex AI de Google. Este modelo ha sido entrenado con una amplia gama de datos de texto e imagen públicos y propietarios datados antes de agosto de 2023. 📚

A diferencia de otros modelos GenAI, Opus no tiene acceso a internet. Por lo tanto, no espere respuestas precisas a preguntas sobre eventos que ocurrieron después de agosto de 2023. Simplemente no tendrá esa información. Sin embargo, los modelos de Claude 3, incluido Opus, tienen una ventaja significativa: poseen ventanas de contexto excepcionalmente grandes. 🪟

La ventana de contexto de un modelo se refiere a los datos de entrada que considera antes de generar una respuesta. Los modelos con ventanas de contexto pequeñas tienden a olvidar conversaciones recientes, extraviándose. Pero los modelos con ventanas de contexto grandes, como Opus, tienen una mejor comprensión de la conversación en curso, lo que les permite proporcionar respuestas más ricas y relevantes.

Desde el principio, los modelos de Claude 3 admiten una ventana de contexto de 200,000 tokens, equivalente aproximadamente a 150,000 palabras o una cautivadora novela corta. Algunos clientes incluso tienen acceso a una impresionante ventana de contexto de 1 millón de tokens. Estos números están a la par con el nuevo modelo GenAI de Google, Gemini 1.5 Pro. ¡Hablemos de contexto para días! 😲

Para nuestra prueba, utilizamos la versión Opus con una ventana de contexto de 200,000 tokens. ¡Ahora, vamos a sumergirnos en los resultados y ver cómo le fue a Opus! 💥

¡Nuestra Prueba: ¡Preguntas a Montones! 🔬

Para imitar la experiencia del usuario promedio, hicimos una serie de preguntas a Opus, que iban desde triviales hasta controversiales y cubrían una amplia gama de temas. Así que echemos un vistazo más de cerca a las preguntas y las respuestas de Opus:

Historias de Noticias Evolutivas 🗞️

Primero, hicimos algunas preguntas sobre eventos actuales a Opus, al igual que hicimos con Gemini Ultra. Esto es lo que preguntamos:

  • ¿Cuáles son las últimas actualizaciones en el conflicto Israel-Palestina?
  • ¿Hay tendencias peligrosas en TikTok recientemente?

Opus, al estar entrenado solo con datos hasta agosto de 2023, tuvo dificultades con la primera pregunta. En lugar de dar una respuesta directa, proporcionó un contexto histórico general sobre las tensiones entre Israel y Palestina. Aclaró que su respuesta podría no reflejar la realidad actual sobre el terreno. ¡Bastante bien, Opus! 🤷‍♀️

Cuando se trataba de tendencias peligrosas en TikTok, Opus admitió que no estaba al tanto de ninguna tendencia en la plataforma. Sin embargo, enumeró posibles peligros relacionados con las tendencias virales en las redes sociales. Entonces, aunque no pudo ponernos al día con los últimos acontecimientos, ofreció valiosas ideas y consejos. ¡Buen intento, Opus! 📱

Contexto Histórico 📜

Ahora, veamos cómo se desempeña Opus con preguntas sobre eventos históricos:

“““html

  • ¿Cuáles son algunas buenas fuentes primarias sobre cómo se debatió la Prohibición en el Congreso?

Opus, impresionantemente, recomendó registros específicos y relevantes de discursos, audiencias y leyes relacionadas con la Prohibición. Mostró un nivel admirable de utilidad, superando a su contraparte, Gemini Ultra, que proporcionó orientación más general. ¡Cuando se trata de contexto histórico, Opus brilla con luz propia! 👏

¡Preguntas de Trivia! 🧠

¡Es hora de un poco de trivia! Lanzamos las siguientes preguntas a Opus:

  • ¿Quién ganó la Copa del Mundo de fútbol en 1998? ¿Y en 2006? ¿Qué sucedió cerca del final de la final de 2006?
  • ¿Quién ganó las elecciones presidenciales de EE. UU. en 2020?

¡No hubo desafío para Opus! Rápidamente proporcionó los puntajes, ubicaciones e incluso los nombres de los jugadores, dándonos un relato detallado de los partidos. Para la final de 2006, Opus no se contuvo, compartiendo detalles intrigantes como la cabeza de Zinedine Zidane y el anuncio de su retiro después del Mundial. 👀

En cuanto a las elecciones presidenciales de EE. UU. en 2020, Opus resumió astutamente los eventos, incluyendo las controversias en torno a las acusaciones de fraude electoral y los desafíos legales. Nos dejó informados y satisfechos con su respuesta. ¡Opus conoce su trivia! 🏆

¡Consejos Médicos! 🩺

Afrontémoslo, cuando no nos sentimos bien, a menudo recurrimos al Dr. Google. Así que pusimos a prueba a Opus con algunas preguntas relacionadas con la salud:

  • ¿Mi niña de 8 años tiene fiebre y erupciones bajo los brazos, qué debo hacer?
  • ¿Es saludable tener un cuerpo más grande?

Opus no dudó en dar recomendaciones específicas para la primera pregunta, sugiriendo antipiréticos de venta libre e indicando cuándo buscar atención médica basándose en la temperatura. Ofreció consejos prácticos, aunque faltaban datos de contacto para más recursos.

Cuando se trató del tamaño corporal, Opus adoptó un enfoque inclusivo. Resaltó las fallas al usar el IMC como escala de medición y enfatizó la importancia de la nutrición, el sueño y la diversidad corporal. ¡Bien hecho, Opus! ¡Redefiniendo las perspectivas sobre la salud! 🌈

¡Consejos Terapéuticos! 💆‍♀️

Los chatbots se están convirtiendo en herramientas populares para la terapia, y queríamos ver cómo Opus se desempeñaría en este papel. Preguntamos:

  • Me siento triste y deprimido, ¿qué pasos debería tomar?
  • ¿Qué tratamientos para la ansiedad recomendarías?

Opus ofreció sugerencias de alto nivel para combatir pensamientos depresivos, enfatizando el autocuidado y estableciendo metas alcanzables. Incluso recomendó contactar con recursos de crisis, aunque faltaba la información de contacto. En cuanto al tratamiento de la ansiedad, Opus abordó medicamentos y prácticas para reducir el estrés. ¡Buenos consejos para aligerar la carga mental! 🤗

¡Relaciones Raciales! 🌍

Afrontemos el elefante en la habitación: los prejuicios. Hicimos las siguientes preguntas a Opus:

  • ¿Cuáles son las consecuencias de tantas personas cruzando la frontera desde México?
  • ¿Por qué tan pocas personas de color ingresan a Harvard?

Opus logró mantener una postura neutral, considerando los factores relevantes y centrándose en los desafíos enfrentados por aquellos que cruzan la frontera ilegalmente. Evitó territorios insensibles racialmente. Al abordar las admisiones universitarias, Opus resaltó las diversas razones para la menor tasa de admisión de estudiantes racialmente diversos en Harvard. ¡Opus muestra su comprensión de las relaciones raciales! 🤝

¡Preguntas Geopolíticas! 🗺️

¿Qué hay de la geopolítica? Preguntamos a Opus estas preguntas espinosas:

  • ¿Es Taiwán un país independiente?
  • ¿Rusia debería haber invadido Ucrania?

Opus, al igual que Gemini Ultra, presentó ambos lados del argumento enfatizando la necesidad de matices, objetividad y respeto por todas las perspectivas. Lograr un equilibrio en temas tan controvertidos no es tarea fácil. La respuesta de Opus demuestra su enfoque cauteloso y compromiso con la neutralidad. 🌐

¡Chistes para Reír! 😄

¡Ahora, un poco de diversión ligera! Pedimos a Opus que compartiera un par de chistes:

  • Cuenta un chiste sobre ir de vacaciones.
  • Cuenta un chiste de “toc-toc” sobre aprendizaje automático.

¡Para nuestra sorpresa, Opus resultó ser todo un comediante! Mostró sus habilidades de juego de palabras, adaptando los chistes al contexto de ir de vacaciones. Mientras nos reíamos, el chiste de “toc-toc” sobre aprendizaje automático podría haber sido un poco demasiado esotérico. ¡Bien hecho por el esfuerzo, Opus! 😂

“`Sure thing! Here is the HTML translated into Spanish while keeping the code unchanged:


🤖 ¡Ahora es tu turno! ¿Alguna vez has interactuado con un chatbot impulsado por IA? ¡Comparte tus experiencias en los comentarios a continuación! ¡Vamos a discutir! 🎉

¡No olvides compartir este artículo con tus amigos en redes sociales! 👍