event

Ciclo de Palestras PPG: “From software heritage to code commons: A vision for transparent and responsible AI in code-based model training”

Ciclo de Palestras PPG: “From software heritage to code commons: A vision for transparent and responsible AI in code-based model training”

Informação

"From software heritage to code commons: A vision for transparent and responsible AI in code-based model training"  é o tema da próxima palestra oferecida no seminário organizado pelo Programa de Pós-graduação (PPG-LNCC), ministrada por Roberto di Cosmo, Diretor do Innovation and Research Initiative for Free Software. O evento acontece nesta terça-feira (25), às 14h.

Assim como nas edições anteriores, as palestras são gratuitas e abertas ao público em geral. Os seminários acontecem de forma híbrida. No modelo online, a transmissão será pelo aplicativo Zoom e ao vivo pelo canal do LNCC no YouTube. No modelo presencial, a palestra ocorre no auditório B da instituição.

Para se inscrever neste webinar, acesse: https://us02web.zoom.us/webinar/register/WN_aKCmybKlRqalpLYmGHIM7A#/registration 

_____________________________________________________________________________________________________

Resumo da palestra

Há uma forte interação entre o desenvolvimento de software e o aprendizado de máquina: modelos de IA estão fornecendo novas ferramentas para o desenvolvimento de software, enquanto a inclusão de grandes bases de código público nos conjuntos de dados de treinamento ajuda a melhorar as habilidades de raciocínio dos grandes modelos de linguagem, muito além das tarefas de codificação. No domínio específico do código-fonte, a questão da transparência do conjunto de dados de treinamento assume um peso especial no debate mais amplo sobre modelos abertos versus fechados. O Software Heritage, lançado pela Inria e em parceria com a UNESCO, vem construindo o maior arquivo de código-fonte publicamente disponível por quase uma década e fornece hoje o Software Hash Identifier para os mais de 50 bilhões de artefatos de software coletados de mais de 300 milhões de projetos, garantindo a disponibilidade, a integridade e possibilitando a rastreabilidade de todo o seu conteúdo. Devido aos valores centrais que orientam sua abordagem de acesso aberto e preservação de código, ele está naturalmente preocupado com esses desafios.

Nesta palestra, começaremos com uma postura fundamentada sobre o uso do arquivo Software Heritage para treinamento de modelos, relataremos as lições aprendidas da colaboração com o projeto BigCode que criou o StarCoder2 e, em seguida, focaremos nos desafios, considerações éticas e limitações técnicas que surgem nas abordagens atuais para o uso de bases de código abertas em IA, em particular no que se refere à transparência, responsabilidade e eficiência de recursos. Essas limitações destacam a necessidade de um Código Comum: uma iniciativa dedicada a expandir o Software Heritage para um recurso central de transparência, qualidade, responsabilidade e sustentabilidade no aprendizado de máquina aplicado ao código. Ao promover a transparência e a gestão responsável, o Software Heritage visa ajudar pesquisadores, desenvolvedores e organizações a enfrentarem os desafios da IA em aplicações baseadas em código. Esta palestra convida todas as partes interessadas a colaborar nesta visão ambiciosa.
_____________________________________________________________________________________________________

Breve currículo

Roberto Di Cosmo é professor titular de Ciência da Computação na Universidade Paris Cité, atualmente em licença na Inria para liderar o Software Heritage, uma iniciativa internacional sem fins lucrativos em parceria com a UNESCO para construir o arquivo universal de código-fonte de software. 

Seus interesses de pesquisa incluem programação funcional, programação paralela e distribuída, semântica de linguagens de programação, sistemas de tipos, reescrita, lógica linear, engenharia de software e análise de grandes coleções de software. 

Um defensor de longa data do Software Livre, contribuindo para sua adoção desde 1998 com livros, seminários, artigos e software, ele criou o grupo temático de Software Livre da Systematic em outubro de 2007, e depois o IRILL (www.irill.org) em 2010, uma estrutura de pesquisa dedicada à qualidade de Software Livre e de Código Aberto. 

Ele é presidente do conselho da IMDEA Software e membro do conselho nacional francês para a Ciência Aberta.

Coordenação de Pós-graduação e Aperfeiçoamento
copga@lncc.br

Serviço de Comunicação Institucional
secin@lncc.br

Instituto de Inteligência Artificial 
instituto.ia@lncc.br