Mochis NoticiasTecnologíaIBM lanza nuevos modelos de cimientos Granite bajo licencia Apache ‘permisiva’
Mochis NoticiasTecnologíaIBM lanza nuevos modelos de cimientos Granite bajo licencia Apache ‘permisiva’
Tecnología

IBM lanza nuevos modelos de cimientos Granite bajo licencia Apache ‘permisiva’

IBM lanza nuevos modelos de cimientos Granite bajo licencia Apache ‘permisiva’

IBM lanza nuevos modelos de cimientos Granite bajo licencia Apache ‘permisiva’

Continuando con su impulso para construir una posición distintiva en inteligencia artificial empresarial, IBM Corp. hoy lanza una serie de nuevos modelos lingüísticos y herramientas para garantizar su uso responsable.

La compañía también presenta una nueva generación de su Watsonx Code Assistant para el desarrollo y modernización de aplicaciones. Todas estas nuevas capacidades se están reuniendo en una plataforma multimodelo para uso de los 160.000 consultores de la empresa.

Los nuevos modelos Granite 3.0 8B y 2B vienen en variantes «Instruct» y «Guardian» utilizadas para entrenamiento y detección de riesgos/daños, respectivamente. Ambos estarán disponibles bajo una licencia Apache 2.0, según Rob Thomas (en la foto), vicepresidente senior de software y director comercial de IBM, «la licencia más permisiva para que empresas y socios creen valor además». La licencia de código abierto permite implementar modelos por tan sólo 100 dólares por servidor, con indemnización de propiedad intelectual destinada a dar a los clientes empresariales confianza a la hora de fusionar sus datos con modelos de IBM.

«Hemos pasado de un mundo de ‘más IA’, en el que los clientes dirigían sus negocios y le añadían IA, a un concepto de IA primero, en el que las empresas construyen su modelo de negocio basándose en la IA», afirmó Thomas. IBM tiene la intención de liderar el uso de la IA para la automatización de la tecnología de la información a través de su desarrollo orgánico y adquisiciones y adquisiciones pendientes de empresas centradas en infraestructura como Turbonomic Inc., Apptio Inc. y HashiCorp Inc.

«La cartera de negocios que hemos construido sobre la IA generativa asciende ahora a más de 2 mil millones de dólares en tecnología y consultoría», dijo Thomas. «No estoy seguro de que alguna vez hayamos tenido un negocio que haya crecido a este ritmo».

Las versiones de Granite Instrucción, que se utilizan para el entrenamiento, vienen en versiones de 8 mil millones y 2 mil millones de parámetros. Han sido entrenados con más de 12 billones de tokens de datos de entrenamiento en 12 idiomas y 116 lenguajes de programación, lo que los hace capaces de codificar, documentar y traducir.

Para finales de año, dijo IBM, planea ampliar los modelos fundamentales a una longitud de contexto de 128.000 tokens con multimodalidad. Esto se refiere a mejorar la capacidad de un modelo para procesar secuencias de entrada significativamente más largas y manejar múltiples tipos de datos simultáneamente. La longitud del contexto es la cantidad de tokens, como palabras, símbolos u otras unidades de datos de entrada, que el modelo de IA puede procesar y retener. Los modelos típicos tienen longitudes de contexto de entre 1000 y 8000 tokens.

Caballos de batalla empresariales

IBM dijo que los nuevos modelos Granite están diseñados como «caballos de batalla» empresariales para tareas como generación de recuperación aumentada o RAG, clasificación, resumen, capacitación de agentes, extracción de entidades y uso de herramientas. Se pueden entrenar con datos empresariales para ofrecer el rendimiento específico de tareas de modelos mucho más grandes a un costo hasta 60 veces menor. Los puntos de referencia internos mostraron que el modelo Granite 8B logró un mejor rendimiento que modelos comparables de Google LLC y Mistral AI SAS y un rendimiento equivalente a modelos comparables de Meta Platforms Inc.

Un informe técnico adjunto y una guía de uso responsable brindan documentación extensa de los conjuntos de datos de capacitación utilizados para entrenar los modelos, así como detalles de los pasos de filtrado, limpieza y curación que se aplicaron y datos de referencia comparativos.

Una versión actualizada de los modelos Granite previamente entrenados que IBM lanzó a principios de este año está entrenado con tres veces más datos y proporciona una mayor flexibilidad de modelado con soporte para variables externas y pronósticos continuos.

Los modelos Granite Guardian 3.0 están diseñados para brindar protección de seguridad al verificar las indicaciones del usuario y las respuestas del modelo para una variedad de riesgos. «Se pueden concatenar tanto la entrada antes de hacer la pregunta de inferencia como la salida para evitar fugas del modelo principal y para evitar violencia, malas palabras, etc.», dijo Dario Gil, vicepresidente senior y director de investigación de IBM. «Hemos hecho todo lo posible para que sea lo más seguro posible».

Los jailbreak son intentos maliciosos de eludir las restricciones o medidas de seguridad impuestas a un sistema de inteligencia artificial para que se comporte de manera no deseada o potencialmente dañina. Guardian también realiza comprobaciones específicas de RAG, como la relevancia del contexto, la relevancia de la respuesta y la «fundamentación», que se refiere al grado en que el modelo está conectado e informado por datos, hechos o contexto del mundo real.

IA al límite

Un conjunto de modelos más pequeños llamados Granite Accelerators y Expert Blend están destinados a aplicaciones de baja latencia que solo utilizan CPU. MoE es un tipo de arquitectura de aprendizaje automático que combina múltiples modelos especializados y selecciona y activa dinámicamente solo un subconjunto de ellos para mejorar la eficiencia.

«El acelerador le permite implementar decodificación especulativa para que pueda obtener el doble de resultados que el modelo principal sin perder calidad», dijo Gil. El modelo MoE se puede entrenar con 10 billones de tokens, pero solo utiliza 800 millones durante la inferencia para lograr eficiencia en casos de uso extremos.

Las variantes Instruct y Guardian de los modelos Granite 8B y 2B están disponibles de inmediato para uso comercial en la plataforma IBM watsonx. Una selección de modelos Granite 3.0 también estará disponible en plataformas asociadas como la pila NIM de Nvidia Corp. y Vertex de Google. El conjunto completo de plantillas de Granite 3.0 y las plantillas de series temporales actualizadas están disponibles para descargar en la plataforma de código abierto de HuggingFace Inc. y Red Hat Enterprise Linux.

El nuevo Watsonx Code Assistant basado en Granite 3.0 admite los lenguajes C, C++, Go, Java y Python con nuevas capacidades de modernización de aplicaciones para aplicaciones Java empresariales. IBM dijo que el asistente entregó documentación de código un 90% más rápido para ciertas tareas dentro de su negocio de desarrollo de software. Se puede acceder a las capacidades del código a través de una extensión de Visual Studio Code llamada IBM Granite.Code.

Más agentes mejor

Las nuevas herramientas para desarrolladores incluyen marcos de agentes, integración con entornos existentes y automatizaciones de código bajo para casos de uso comunes como RAG y agentes.

Dado que los agentes de IA, o sistemas que son capaces de comportarse o tomar decisiones de forma autónoma, se convertirán en la próxima gran ola en el desarrollo de la IA, IBM también dijo que está equipando su división de consultoría con una plataforma de agentes multimodal. Las líneas Cloud Transformation and Management Consulting Advantage y Business Operations Consulting Advantage incluirán agentes, aplicaciones y métodos de IA de dominios específicos capacitados en la propiedad intelectual de IBM y las mejores prácticas que los consultores pueden aplicar a los proyectos de nube e IA de sus clientes.

Alrededor de 80.000 consultores de IBM utilizan actualmente Consulting Advantage, y la mayoría utiliza sólo uno o dos agentes a la vez, dijo Mohamad Ali, vicepresidente senior de IBM Consulting. Sin embargo, a medida que crezca el uso, IBM Consulting necesitará dar soporte a más de 1,5 millones de agentes, lo que hace que la economía de Granite sea «absolutamente esencial porque vamos a seguir haciendo crecer esta plataforma y queremos ser muy rentables», afirmó.

Foto de : SiliconANGLE

Su voto a favor es importante para nosotros y nos ayuda a mantener el contenido GRATIS.

Un clic a continuación respalda nuestra misión de proporcionar contenido gratuito, profundo y relevante.

Únase a nuestra comunidad en YouTube

Únase a la comunidad de más de 15.000 expertos de #CubeAlumni, incluido el director ejecutivo de Amazon.com, Andy Jassy, ​​​​el fundador y director ejecutivo de Dell Technologies, Michael Dell, el director ejecutivo de Intel, Pat Gelsinger, y muchas más luminarias y expertos.

“TheCUBE es un socio importante para la industria. Realmente eres parte de nuestros eventos y realmente apreciamos que vengas y sé que la gente también aprecia el contenido que creas» – Andy Jassy

GRACIAS

Source link

Hi, I’m Corina Guzman

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *