Table of Contents
Introdução aos Modelos de IA da Mistral
A startup francesa de inteligência artificial Mistral lançou recentemente seus primeiros modelos de IA generativa, concebidos para serem operados em dispositivos de borda, como laptops e celulares. Esta iniciativa representa um avanço significativo na acessibilidade e privacidade das aplicações de IA.
Características dos Modelos “Les Ministraux”
A nova família de modelos, denominada “Les Ministraux”, pode ser utilizada ou ajustada para diversas aplicações, desde geração simples de texto até colaboração com modelos mais avançados para a realização de tarefas específicas.
Modelos Disponíveis
- Ministral 3B
- Ministral 8B
Ambos os modelos apresentam uma janela de contexto de 128.000 tokens, o que os habilita a processar aproximadamente o conteúdo de um livro de 50 páginas.
Requisitos e Licenciamento
“Nossos clientes e parceiros mais inovadores têm solicitado cada vez mais uma inferência local e priorização da privacidade para aplicações críticas, como tradução em dispositivo, assistentes inteligentes offline, análises locais e robótica autônoma,” escreveu a Mistral em uma postagem de blog.
O modelo Ministral 8B está disponível para download, embora estritamente para fins de pesquisa. A Mistral exige que desenvolvedores e empresas interessadas em configurações de autoimplantação de Ministral 8B ou Ministral 3B entrem em contato para obter uma licença comercial.
Custos e Disponibilidade
Alternativamente, os desenvolvedores podem acessar os modelos Ministral 3B e Ministral 8B através da plataforma em nuvem da Mistral, chamada La Platforme, e de outras nuvens parceiras. Os custos são os seguintes:
- Ministral 8B: 10 centavos por milhão de tokens de entrada/saída (~750.000 palavras)
- Ministral 3B: 4 centavos por milhão de tokens de entrada/saída
Tendências de Modelos Pequenos
Recentemente, observou-se uma tendência crescente em direção a modelos menores, que são mais econômicos e rápidos de treinar, ajustar e operar em comparação com seus similares maiores. Exemplos notáveis incluem:
- Gemma — da Google, que continuamente adiciona modelos à sua família
- Phi — da Microsoft, que oferece uma coleção de modelos pequenos
- Llama — da Meta, que recentemente introduziu modelos otimizados para hardware de borda
Desempenho Comparativo
A Mistral afirma que seus modelos Ministral 3B e Ministral 8B superam modelos comparáveis da família Llama e Gemma, bem como seu próprio modelo Mistral 7B, em várias métricas projetadas para avaliar a capacidade de seguir instruções e resolver problemas.
Expansão da Portfólio de Produtos
A Mistral, que recentemente arrecadou 640 milhões de dólares em capital de risco, continua a expandir gradualmente seu portfólio de produtos de IA. Nos últimos meses, a empresa lançou:
- Um serviço gratuito para desenvolvedores testarem seus modelos
- Um SDK para permitir que os clientes ajustem esses modelos
- Novos modelos, incluindo um modelo gerativo para código chamado Codestral
Missão e Futuro da Mistral
Co-fundada por ex-alunos da Meta e do DeepMind da Google, a Mistral tem como missão criar modelos de destaque que rivalizem com os melhores disponíveis atualmente, como o GPT-4o da OpenAI e o Claude da Anthropic. Embora a monetização tenha se mostrado desafiadora, mesmo para muitas startups de IA generativa, a Mistral começou a gerar receita neste verão.
#InteligenciaArtificial #Mistral #ModelosGenerativos #Inovação #Privacidade #Tecnologia #IA #Ministral3B #Ministral8B #MachineLearning
Fonte:https://techcrunch.com/2024/10/16/mistral-releases-new-ai-models-optimized-for-edge-devices/