Table of Contents
Introdução ao Geração Estruturada em IA
Atualmente, os CIOs de empresas estão adotando a inteligência artificial generativa de forma cautelosa. Esse comportamento pode ser atribuído a diversos fatores, sendo um dos principais o fato de que as IAs gerativas não se integram facilmente aos fluxos de trabalho existentes em engenharia de software, uma vez que não compartilham a mesma linguagem. Por exemplo, é necessário um esforço considerável para que modelos de linguagem de grande porte (LLMs) consigam fornecer um JSON válido.
A Invenção da Dottxt
Uma startup americana chamada Dottxt surge como uma resposta a essa necessidade, prometendo “fazer a IA falar a linguagem dos computadores”. A empresa é liderada por uma equipe que também está à frente do projeto Outlines, um projeto de código aberto que capacita desenvolvedores a extrair informações de ChatGPT e outros modelos de IA generativa de maneira mais refinada, evitando táticas ineficazes.
Bibliotecas e Ferramentas de Geração Estruturada
Bibliotecas de software, como o Outlines (uma biblioteca em Python), Guidance da Microsoft e LMQL (Language Model Query Language), possibilitam a orientação dos LLMs de forma mais sofisticada do que o mero “prompt hacking”. Essa abordagem é conhecida como geração estruturada ou, às vezes, geração com restrições.
Foco na Saída do Modelo
O foco central da técnica de geração estruturada está na saída dos LLMs, em vez do input. Segundo Rémi Louf, CEO da Dottxt, trata-se de ensinar os modelos de IA como responder adequadamente. Louf afirma que essa técnica permite que as equipes voltem a um fluxo de trabalho tradicional de engenharia, refinando a gramática até alcançar o resultado desejado.
Desenvolvimento e Potencial do Dottxt
A Dottxt visa construir uma solução robusta de geração estruturada, sendo modelo-agnóstica, e oferecendo mais funcionalidades e, segundo afirmam, um desempenho superior ao projeto de código aberto que a originou.
A experiência acadêmica de Louf, que possui um doutorado e formação em estatística bayesiana, contribui para a compreensão das perspectivas de geração estruturada. Essa base em teoria da probabilidade, juntamente com o conhecimento em TI, influenciou a decisão da equipe em criar uma empresa que ajude outros a utilizar, de maneira eficaz, a IA generativa.
A Necessidade de Estruturas
A referência de Louf à gramática não é mera coincidência. A Dottxt é fundamentada na premissa de que a maior parte do texto com o qual interagimos é altamente estruturado. Isso abrange, naturalmente, o código, mas também muitos outros templates que os LLMs deveriam seguir para serem realmente úteis em ambientes de trabalho.
A Inovação na Geração Estruturada
Recentemente, a OpenAI, criadora do GPT, lançou uma forma de geração estruturada chamada Saídas Estruturadas, que reconhece o projeto Outlines como parte de sua inspiração.
Louf acredita que a popularidade do Outlines é um indicativo da demanda por uma abordagem mais flexível e rica em funcionalidades. Os investidores também parecem compartilhar essa visão, uma vez que a Dottxt arrecadou $11.9 milhões em poucos meses.
Captação de Recursos e Crescimento da Equipe
Em 2023, a startup levantou uma rodada pré-seed de $3.2 milhões liderada pela firma de capital de risco Elaia, seguida por uma rodada seed de $8.7 milhões liderada pela EQT Ventures em agosto. Durante esse período, Louf e seus co-fundadores se dedicaram a provar que sua abordagem não compromete o desempenho. A demanda pela versão open source do Outlines disparou, com mais de 2.5 milhões de downloads, incentivando a equipe a pensar grande.
Além disso, a captação de novos recursos também visa a contratação de mais colaboradores, dada a crescente demanda por ferramentas de geração estruturada. A equipe totalmente remota da startup deve atingir um total de 17 colaboradores até o final do mês, um aumento significativo em relação aos oito funcionários de junho.
Visão de Futuro
Entre as novas contratações estão dois profissionais de relações com desenvolvedores, evidenciando a prioridade da Dottxt em construir um ecossistema. O objetivo nos próximos 18 meses é acelerar a adoção das ferramentas, acima do foco comercial. No entanto, Louf menciona que a comercialização deverá começar nos próximos seis meses, com foco em clientes corporativos.
Essa abordagem pode ser considerada arriscada se a euforia em torno da IA esfriar até o momento em que a Dottxt buscar mais investimentos. Porém, a startup está confiante de que há um potencial substancial por trás dessa fase de hype, esperando ajudar as empresas a desbloquear valor real da IA.
Conclusão: O Futuro da Geração Estruturada
Julien Chaumond, CTO da Hugging Face, e investidor na Dottxt, recentemente descreveu a geração estruturada como o futuro dos LLMs. Esse entusiasmo está se espalhando também por esse segmento da pilha tecnológica da IA generativa.
Com outras tendências, como agentes de IA e a ascensão de modelos de IA menores, a aposta da Dottxt na adoção de sua tecnologia pode eventualmente se traduzir em sucesso. Louf prevê que “em poucos anos, todos estarão utilizando geração estruturada, não há dúvida disso.”
#InteligenciaArtificial #GeracaoEstruturada #Dottxt #CIOs #IA #Tecnologia #Inovacao #Outlines #Startups #ModelosDeLinguagem
Fonte:https://techcrunch.com/2024/10/17/with-11-9-million-in-funding-dottxt-tells-ai-models-how-to-answer/