Mochis NoticiasTecnologíaBob Muglia: Información sobre la pila de datos moderna y el futuro de la IA
Mochis NoticiasTecnologíaBob Muglia: Información sobre la pila de datos moderna y el futuro de la IA
Tecnología

Bob Muglia: Información sobre la pila de datos moderna y el futuro de la IA

Bob Muglia: Información sobre la pila de datos moderna y el futuro de la IA
Bob Muglia: Información sobre la pila de datos moderna y el futuro de la IA

Bob Muglia tiene buen ojo para las tecnologías de la pila de datos moderna. Después de hacer crecer la División Empresarial de Microsoft Corp. en un negocio de 14 mil millones de dólares hace más de una década, posicionó a Snowflake Inc. para una oferta pública inicial que sigue siendo el mayor debut de una empresa de software empresarial en la historia.

Esta experiencia le dio a Muglia, ahora consultor y autor de «The Datapreneurs: The Promise of AI and the Creators Building Our Future», una nueva perspectiva sobre cómo la plataforma de datos ha evolucionado hasta convertirse en una plataforma de aplicaciones y qué significará esto al final. para los adultos. actores en el ecosistema de bases de datos.

«Las plataformas están madurando, cada una de ellas es diferente», afirmó Muglia. «Estas son supernubes que se están construyendo; las nubes de datos son definitivamente plataformas en sí mismas».

Muglia habló con Shelly Kramer, directora general y analista principal de theCUBE Research, y George Gilbert, analista senior de theCUBE Research, en un episodio del podcast «The Road to Intelligent Data Apps», la conversación en curso de theCUBE sobre la Sexta Plataforma de Datos, una plataforma emergente. plan. framework donde los principales proveedores son Databricks, Snowflake, AWS, Azure y Google. Discutieron cómo las tecnologías en evolución darán forma al futuro de las aplicaciones de datos inteligentes.

Bob Muglia ve la necesidad de semántica y gobernanza de datos

En conversaciones anteriores con analistas de SiliconANGLE, y en el propio resumen de Kramer de su conversación con el ex director ejecutivo de Snowflake, Muglia señaló que, si bien los lagos de datos estaban madurando, seguía habiendo una falta de gobernanza consistente. A medida que aumentan los datos, el modelo de coherencia de transacciones debe ser eficaz al examinar los datos desde una vista de archivo y una vista de tabla.

El problema es que, aunque la industria está acostumbrada a trabajar con tablas, la tecnología no proporciona una estructura eficaz para almacenar la semántica, el significado detrás de los datos y las relaciones entre entidades. Los usuarios necesitan algo más granular y aquí es donde Muglia cree que el gráfico de conocimiento relacional puede proporcionar una mejor solución. Actualmente es miembro de la junta directiva de RelationalAI Inc., un proveedor de coprocesadores de IA basado en tecnología de gráficos de conocimiento.

«Sigo creyendo que la industria necesita una solución de base de datos de gráficos de conocimiento», afirmó Muglia. “La semántica de la base de datos que necesitamos para la capa semántica simplemente no existe en la pila de datos moderna. Cuando tengamos eso, creo que estas soluciones comenzarán a aparecer mucho más rápido».

También existe el problema de la incompatibilidad entre lagos de datos. Los tres estándares más populares para la arquitectura de data lakehouse son Apache Hudi, Delta Lake, que utiliza Databricks, y Apache Iceberg, el formato de código abierto elegido por Snowflake y Google. Todos utilizan diferentes estructuras de gestión de tablas.

«Lo que tenemos ahora es una especie de situación ‘Beta versus VHS’ en términos del hecho de que los clientes están colocando sus datos en un tipo particular de lago de datos», dijo Muglia. “Los metadatos que convierten estos archivos en tablas son todos diferentes en su estructura. Significa que estos sistemas no funcionan juntos como deberían».

Una posible solución es XTable, una capa de traducción ligera de código abierto que fue aceptada como proyecto de incubación de la Apache Software Foundation en abril. XTable permite a los usuarios traducir metadatos sin problemas entre los formatos de tabla de origen y de destino sin el dolor de cabeza de reescribir o duplicar archivos de datos.

«Esto le permite tener datos en uno de estos formatos como Delta o Iceberg y luego convertirlos a otro formato para que puedan ser utilizados por un proveedor diferente», explicó Muglia. «Por el momento no está claro si esto solucionará el problema o no. Es una perturbación para los clientes, es una situación desafortunada en este momento».

El marco basado en modelos impulsará las aplicaciones de datos

Muglia cree que el futuro de las aplicaciones de datos estará ligado a un cambio de un enfoque basado en el código a un marco basado en modelos. La incorporación de la semántica de bases de datos en la pila moderna se ha vuelto más urgente durante el último año con una explosión de casos de uso de inteligencia artificial.

«Un modelo lingüístico no es un genio ni nada por el estilo, no puede encontrar lo peor», afirmó Muglia. «Si tiene un término comercial que utiliza en su empresa y que no tiene un significado generalmente aceptado para otros clientes, debe definirse de alguna manera para que el gran modelo lingüístico funcione correctamente. En última instancia, es necesario expresarlo dentro de estos modelos semánticos».

Entre las principales plataformas de datos, Muglia estaba intrigada por la posición de Microsoft, ya que la compañía busca capitalizar el lanzamiento de su solución de análisis unificado Fabric que aprovecha Azure Data Factory, Azure Synapse Analytics y Microsoft Power BI.

«Para ser honesto, creo que son el gorila de 800 libras en la sala», dijo Muglia. “Han construido un buen producto en Tessili. Aún no han lanzado Power BI Copilot. Será realmente interesante ver qué hacen allí».

En este contexto de maniobras por parte de las principales plataformas de datos, existe una creciente necesidad de hacer que la IA sea útil. Según Muglia, la adopción del gráfico de conocimiento relacional podría contribuir en gran medida a demostrar el valor de la IA.

«Existe cierto riesgo de que la IA relacional sea una gran prueba de concepto, pero nunca será un producto que realmente resuelva los problemas», afirmó. «En mi corazón, creo que el mundo debe ir hacia aquí».

Aquí está la conversación completa, parte de la serie «El camino hacia las aplicaciones de datos inteligentes»:

Imagen: Getty Images-Yuchiro Chino

Su voto a favor es importante para nosotros y nos ayuda a mantener el contenido GRATIS.

Un clic a continuación respalda nuestra misión de proporcionar contenido gratuito, profundo y relevante.

Únase a nuestra comunidad en YouTube

Únase a la comunidad de más de 15.000 expertos de #CubeAlumni, incluido el director ejecutivo de Amazon.com, Andy Jassy, ​​​​el fundador y director ejecutivo de Dell Technologies, Michael Dell, el director ejecutivo de Intel, Pat Gelsinger, y muchas más luminarias y expertos.

“TheCUBE es un socio importante para la industria. Realmente eres parte de nuestros eventos y realmente apreciamos que vengas y sé que la gente también aprecia el contenido que creas» – Andy Jassy

GRACIAS

Source link

Hi, I’m Corina Guzman

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *