IBM Introduz Modelo de IA Mistral Open-Source na Plataforma watsonx

Empresa amplia sua oferta de IA promovendo inovação com mais escolhas e flexibilidade

A gigante da tecnologia IBM revelou a inclusão do avançado modelo de linguagem grande (LLM) open-source Mixtral-8x7B, desenvolvido pela Mistral AI, em sua aclamada plataforma de IA e dados, watsonx. Esse movimento estratégico visa ampliar ainda mais as capacidades da IBM em apoiar a inovação dos clientes utilizando modelos de base próprios da IBM, bem como aqueles provenientes de uma ampla gama de fornecedores open-source.

A IBM apresenta uma versão otimizada do Mixtral-8x7B que, em testes internos, demonstrou um aumento de 50% na taxa de processamento de dados comparado ao modelo regular.1 Isso pode reduzir a latência em 35-75%, dependendo do tamanho do lote, acelerando significativamente o tempo para obtenção de insights. Esse avanço é resultado da quantização, um processo que diminui o tamanho do modelo e os requisitos de memória para LLMs, o que pode, por sua vez, acelerar o processamento para ajudar a reduzir custos e o consumo de energia.

Com a adição do Mixtral-8x7B, a IBM expande sua estratégia de modelos múltiplos e abertos, atendendo aos clientes em suas necessidades específicas e oferecendo flexibilidade para escalar soluções de IA empresarial em seus negócios. Através de décadas de pesquisa e desenvolvimento em IA, colaboração aberta com Meta e Hugging Face, e parcerias com líderes de modelos, a IBM está ampliando seu catálogo de modelos em watsonx.ai e introduzindo novas capacidades, idiomas e modalidades.

As opções de modelos de base prontos para empresas e a plataforma de IA e dados watsonx da IBM podem capacitar os clientes a utilizar IA generativa para obter novos insights e eficiências, e criar novos modelos de negócios baseados em princípios de confiança. A IBM possibilita que os clientes escolham o modelo mais adequado para seus casos de uso específicos e objetivos de desempenho de custo para domínios empresariais como finanças.

O modelo Mixtral-8x7B foi desenvolvido usando uma combinação de Modelagem Esparsa — uma técnica inovadora que identifica e utiliza apenas as partes mais essenciais dos dados para criar modelos mais eficientes — e a técnica Mixture-of-Experts, que combina diferentes modelos ("especialistas") que se especializam em resolver diferentes partes de um problema. O Mixtral-8x7B é amplamente reconhecido por sua capacidade de processar e analisar rapidamente grandes volumes de dados para fornecer insights relevantes ao contexto.

"Os clientes estão buscando opções e flexibilidade para implementar modelos que melhor se adequem aos seus casos de uso e requisitos de negócios exclusivos", disse Kareem Yusuf, Ph.D, Vice-Presidente Sênior de Gestão de Produtos e Crescimento da IBM Software. "Ao oferecer o Mixtral-8x7B e outros modelos no watsonx, estamos não apenas fornecendo opções em como eles implementam a IA — estamos capacitando um robusto ecossistema de construtores de IA e líderes empresariais com ferramentas e tecnologias para impulsionar a inovação em diversas indústrias e domínios."

A IBM também anunciou a disponibilidade do modelo japonês de LLM ELYZA-japanese-Llama-2-7b, open-sourced pela ELYZA Corporation, no watsonx. A IBM também oferece modelos open-source da Meta, Llama-2-13B-chat e Llama-2-70B-chat, além de outros modelos de terceiros no watsonx, com mais novidades previstas para os próximos meses.

fonte: Newsroom IBM

Acesse as verticais Revna a seguir, para obter mais detalhes:

Serviços: DataScience / Infraestrutura
Soluções: Inteligência Artificial / Business Analytics

Veja mais notícias

Quer transformar sua gestão de TI?

Acesse o Be Revna e descubra como nosso sistema pode revolucionar sua operação e impulsionar seus resultados.

Faça uma Pesquisa

Olá! Preencha os campos abaixo para iniciar a conversa no WhatsApp

Olá, eu sou a Sunstone Assist. Vamos
encontrar o que sua empresa precisa?