Anthropic presenta los nuevos modelos Claude 3, destacando Opus por sus capacidades "casi humanas" de comprensión

martes, 5 de marzo de 2024, 12:22 h (CET)

Anthropic presenta los nuevos modelos Claude 3, destacando Opus por sus capacidades

MADRID, 5 (Portaltic/EP)
Anthropic ha presentado su nueva familia de modelos de Inteligencia Artificial (IA) Claude 3, que supera a otros modelos del sector, como GPT-4, "en la mayoría de puntos de referencia" con su versión más potente llamada Opus, destacando por sus habilidades "casi humanas" de comprensión y fluidez en tareas complejas.

La compañía ha dado a conocer su nueva familia de modelos compuesta por Claude 3 Haiku, Claude 3 Sonnet y Claude 3 Opus -en orden ascendente según su capacidad-, que ofrecen un rendimiento cada vez más potente para ajustarse a las necesidades de los usuarios, con el objetivo de conseguir un equilibrio óptimo entre inteligencia, velocidad y precio.

En concreto, los modelos de Claude 3 pueden mantener conversaciones con los clientes, así como autocompletar texto y llevar a cabo tareas de extracción de datos, asegurando "respuestas inmediatas y en tiempo real". Igualmente, se trata de una familia de modelos multimodales, ya que permiten procesar una amplia gama de formatos visuales, como son las fotografías, cuadros, gráficos y diagramas técnicos.

En cuanto a su ventana de contexto, los modelos Claude 3 disponen inicialmente de 200.000 tokens en el momento del lanzamiento, aunque son capaces de aceptar entradas superiores a un millón de tokens.

Así, con esta nueva familia de modelos, Anthropic ha detallado que también ha conseguido ofrecer mejoras relacionadas con mayores capacidades de análisis y pronóstico, así como más progreso en la creación de contenido, en la generación de código y en las conversaciones con idiomas distintos al inglés, como es el caso del español, japonés y francés.

HAIKU, SONNET Y OPUS
La compañía define el modelo Haiku como el "más rápido y rentable del mercado" en su categoría de inteligencia. Tanto es así que con sus capacidades, Haiku puede leer un artículo de investigación en el que se incluyen datos e información equivalentes a 10.000 tokens, con cuadros y gráficos, "en menos de tres segundos".

Por su parte, Claude 3 Sonnet está pensado para tareas con gran carga de trabajo. Tal y como ha puntualizado Anthropic, se trata de un modelo dos veces más rápido que Claude 2 y Claude 2.1, además de disponer de niveles más altos de inteligencia. En este sentido, Sonnet destaca en tareas que requieren respuestas rápidas, como a la hora de recuperar información, datos o algún tipo de conocimiento.

Respecto a Claude 3 Opus, se trata del modelo más inteligente que ha presentado la compañía, de hecho, al contrario que Sonnet, ofrece velocidades similares a las de los modelos anteriores Claude 2 y 2.1, sin embargo, dispone de niveles de inteligencia "mucho más altos".

De hecho, tal y como ha subrayado en un comunicado en su web, se trata de un modelo que supera a otros similares de la competencia "en la mayoría de los puntos de referencia de evaluación comunes para sistemas de IA".

Estos puntos de referencia se basan en el conocimiento experto a nivel de pregrado (MMLU), el razonamiento experto a nivel de posgrado (GPQA) y las matemáticas básicas (GSM8K), entre otras cuestiones. Con ello, la tecnológica ha señalado que Opus es capaz de alcanzar niveles "casi humanos" de comprensión y fluidez en tareas complejas.

Según ha mostrado Anthropic en una tabla con los resultados de los puntos de referencia de evaluación, en la que compara los modelos de la familia Claude 3 con modelos de otras compañías. Opus supera al modelo GPT-4, desarrollado por OpenAI, en todos los resultados.

Por ejemplo, en el razonamiento experto a nivel de posgrado (GPQA), Opus obtiene una puntuación un 14,7 por ciento más alta (50,4 por ciento) que en el caso de GPT-4 (35,7 por ciento). Igual ocurre con los resultados de matemáticas básicas con un 95 por ciento de Opus, frente a un 92 por ciento de GPT-4, y con el conocimiento MMLU (86,8 y 86,4 por ciento, respectivamente).

MEJOR COMPRENSIÓN CONTEXTUAL Y MÁS PRECISIÓN
Además de todo ello, Anthropic también ha detallado que los modelos de Claude 3 también han mejorado su comprensión contextual, por lo que tienen muchas menos probabilidades de negarse a responder algunas indicaciones de los usuarios.

Es decir, los nuevos modelos muestran una comprensión "más matizada" de las solicitudes. Así, son capaces de reconocer el daño real y, por tanto, las negativas para responder indicaciones "inofensivas" son mucho menos frecuentes.

Por otra parte, Anthropic ha destacado la necesidad de que los resultados de sus modelos "mantengan una alta precisión a escala", para ello, ha explicado que los utilizan un conjunto de preguntas fácticas complejas, relacionadas con las debilidades conocidas de los modelos actuales.

En base a estas preguntas, se clasifican las respuestas en correctas, incorrectas y "admisiones de incertidumbre". De esta forma, en caso de incertidumbre, el modelo responde que no sabe la respuesta, en lugar de proporcionar información incorrecta. Gracias a este sistema, el modelo Opus ofrece una precisión en sus respuestas el doble de mejor que Claude 2.1.

Además, la compañía también ha detallado que "pronto" habilitarán citas en las respuestas de los modelos de Claude 3, para ofrecer frases precisas con la información y las fuentes de referencia. Con ello, los usuarios podrán verificar dichas respuestas.

RESPONSABILIDAD
Finalmente, Anthropic ha resaltado que la familia de modelos Claude 3 han sido ideados para que sean "tan confiables como sea posible", para ello, cuentan con equipos dedicados en identificar y mitigar riesgos, como ofrecer información falsa o la habilidad de replicación autónoma.

Asimismo, asegura haber mejorado la seguridad y transparencia de los modelos, además de haber ajustado esta tecnología para mitigar los problemas de privacidad. Igualmente, Claude 3 muestra menos sesgos que los modelos anteriores, promoviendo una mayor neutralidad y que no estén inclinados hacia "ninguna postura partidista en particular".

En concreto, a pesar de haber avanzado en diversos aspectos con respecto a las versiones de IA anteriores, la familia de modelos Claude 3 se mantiene en el nivel de seguridad de IA (ASL-2), según la política de escalamiento responsable de Anthropic.

Con todo ello, Anthropic ha detallado que los modelos Opus y Sonnet están disponibles a través de la API de Claude para desarrolladores. Asimismo, Sonnet impulsa la experiencia gratuita de claude.ai y Opus también está disponible para los suscriptores de Claude Pro.

Además, Sonnet también se puede encontrar en Amazon Bedrock y en vista previa privada en Vertex AI Model Garden de Google Cloud. Respecto al modelo Haiku, la compañía ha indicado que estará disponible "pronto".

Noticias relacionadas

Un juzgado de Pontevedra condena a UFD del Grupo Naturgy por refacturaciones sobre fraudes falsos

El Juzgado Contencioso-Administrativo de Pontevedra ha anulado una factura de 15.600 € que pretendía cobrar la Distribuidora del grupo Naturgy alegando un “fraude eléctrico” que no ha podido demostrar en el juicio. En sentencia firme, UFD Distribución contra el recurso presentado ante la Resolución de la Xunta de Galicia, que daba la razón al titular del contrato de suministro y consideraba nula la refacturación practicada por alegar un ‘fraude eléctrico’ en el contador de electricidad.

Epístola a un anciano

Sí, me refiero a ti. A ese que de vez en cuando va a recoger a sus nietos al cole. A esos que están sentados en un banco de un jardín e incluso a los que están echando una partidita de dominó, esperando matar al contrario esos seis dobles que están a la expectativa, mirando de reojo al rival para que no le asesinen esa ficha adversa que todos no sabemos dónde meter cuando nos hunde la suerte en el reparto de fichas. A

El racismo y el abuso sexualizado siguen utilizándose en un 48% para atacar a los atletas en redes sociales

La Asociación Mundial de Atletismo (World Athletics) publicó este jueves las conclusiones de un estudio realizado durante los Juegos Olímpicos de Paris 2024 con el objetivo de identificar y proteger a los atletas de los mensajes abusivos enviados a través de las plataformas de las redes sociales, siendo el racismo, con un 18%, y el abuso sexualizado (30%) los principales problemas.

Anthropic presenta los nuevos modelos Claude 3, destacando Opus por sus capacidades "casi humanas" de comprensión

Lo más leído

Noticias relacionadas

​Un juzgado de Pontevedra condena a UFD del Grupo Naturgy por refacturaciones sobre fraudes falsos

​Epístola a un anciano

El racismo y el abuso sexualizado siguen utilizándose en un 48% para atacar a los atletas en redes sociales

Un juzgado de Pontevedra condena a UFD del Grupo Naturgy por refacturaciones sobre fraudes falsos

Epístola a un anciano