Table of Contents
Finalmente, existe uma definição “oficial” de IA de código aberto.
A Open Source Initiative (OSI), uma instituição de longa data com o objetivo de definir e “administrar” tudo que é de código aberto, lançou hoje a versão 1.0 de sua Definição de IA de Código Aberto (OSAID). O produto de vários anos de colaboração com a academia e a indústria, a OSAID pretende oferecer um padrão pelo qual qualquer um pode determinar se uma IA é de código aberto — ou não.
Você pode estar se perguntando — assim como este repórter estava — por que o consenso é importante para uma definição de IA de código aberto. Bem, uma grande motivação é obter que os formuladores de políticas e os desenvolvedores de IA estejam na mesma página, disse o EVP da OSI.
IA Aberta
Para ser considerada de código aberto sob a OSAID, um modelo de IA deve fornecer informações suficientes sobre seu design para que uma pessoa possa “recriar substancialmente. O modelo também deve divulgar quaisquer detalhes relevantes sobre seus dados de treinamento, incluindo a proveniência, como os dados foram processados e como podem ser obtidos ou licenciados.
“Uma IA de código aberto é um modelo de IA que permite que você entenda completamente como ela foi construída,” disse um representante da OSI. “Isso significa que você tem acesso a todos os componentes, como o código completo usado para o treinamento e filtragem de dados.”
A OSAID também estabelece os direitos de uso que os desenvolvedores devem esperar com a IA de código aberto, como a liberdade de usar o modelo para qualquer propósito e modificá-lo sem ter que pedir permissão a ninguém. “Mais importante, você deve ser capaz de construir em cima,” acrescentou.
A OSI não possui mecanismos de enforcement para falar. Não pode pressionar os desenvolvedores a cumprir ou seguir a OSAID. Mas pretende sinalizar modelos descritos como “código aberto” que não atendem à definição.
“Nossa esperança é que, quando alguém tentar abusar do termo, a comunidade de IA dirá: ‘Não reconhecemos isso como código aberto,’ e isso será corrigido.” Historicamente, isso teve resultados mistos, mas não é totalmente sem efeito.
Muitas startups e grandes empresas de tecnologia empregaram o termo “código aberto” para descrever suas estratégias de liberação de modelos de IA — mas poucas atendem aos critérios da OSAID.
Opiniões Divergentes sobre Modelos de IA de Código Aberto
Diversas empresas contestam a OSAID como está escrita, argumentando que as licenças e políticas de uso aceitável que acompanham seus modelos atuam como balizas contra implantações prejudiciais.
Por exemplo, algumas empresas exigem que plataformas com muitos usuários solicitem licenças especiais para usar seus modelos. Isso levanta questões sobre a verdadeira natureza do que pode ser considerado código aberto.
Um estudo realizou pela Signal Foundation concluiu que muitos modelos “de código aberto” são apenas de nome e não verdadeiramente acessíveis, com dados necessários para treino mantidos em segredo.
Questões Abertas na Definição de IA de Código Aberto
Alguns especialistas sugerem que a definição não vai longe o suficiente, especialmente no que diz respeito ao licenciamento de dados de treinamento proprietários. Por exemplo, um modelo pode atender a todos os requisitos da OSAID mesmo que os dados usados não estejam livremente disponíveis.
Maffulli, representante da OSI, concordou que a definição precisará de atualizações — talvez mais cedo do que tarde. Para isso, a OSI estabeleceu um comitê que será responsável por monitorar como a OSAID é aplicada e propor emendas para futuras versões.
Quais são os critérios da OSAID para um modelo de IA ser considerado de código aberto?
Para um modelo de IA ser considerado Open Source AI sob a definição da Open Source Initiative (OSI), os seguintes critérios devem ser atendidos:
Liberdades Fundamentais
- Uso: O modelo deve ser disponibilizado sob termos legais que permitam seu uso para qualquer propósito sem a necessidade de permissão.
- Estudo: Deve ser possível estudar como o sistema funciona e inspecionar seus componentes.
- Modificação: O modelo deve permitir modificações para alterar suas recomendações, previsões ou decisões de acordo com as necessidades do usuário.
- Compartilhamento: O modelo deve poder ser compartilhado, com ou sem modificações, para qualquer propósito.
Transparência e Acessibilidade
- Design e Componentes: O modelo deve fornecer informações suficientes sobre seu design para que uma pessoa possa recriá-lo substancialmente. Isso inclui acesso a todos os componentes, como o código completo usado para o treinamento e filtragem de dados.
- Dados de Treinamento: O modelo deve divulgar detalhes relevantes sobre seus dados de treinamento, incluindo a proveniência, como os dados foram processados e como podem ser obtidos ou licenciados.
Licenciamento e Acessibilidade dos Dados
Embora a OSAID exija que os dados sejam licenciados de forma compatível com a definição de código aberto, há críticas de que a definição não vai longe o suficiente em garantir que os dados de treinamento sejam livremente disponíveis. Por exemplo, um modelo pode atender a todos os requisitos da OSAID mesmo que os dados usados não estejam livremente disponíveis.
Monitoramento e Atualizações
A OSI não tem mecanismos de enforcement, mas pretende sinalizar modelos que não atendem à definição. Além disso, um comitê será responsável por monitorar a aplicação da OSAID e propor emendas para futuras versões.
Conclusão
Os critérios estabelecidos pela OSAID para um modelo de IA ser considerado Open Source AI são fundamentais para garantir a liberdade de uso, estudo, modificação e compartilhamento. A transparência e a acessibilidade dos dados de treinamento são essenciais para o desenvolvimento ético e colaborativo da inteligência artificial. À medida que a tecnologia avança, a necessidade de diretrizes claras e eficazes torna-se ainda mais crucial para os desenvolvedores e a comunidade em geral.
Fontes de pesquisa
- TechCrunch: We finally have an ‘official’ definition for open source AI
- TFiR: Open Source Initiative (OSI) seeks to define open source in AI
- Sam Johnston: The Open Source(ish) AI Definition (OSAID)
#OpenSourceAI, #dados, #modelo, #licenciamento, #desenvolvedores, #cryptoalch