event
Ciclo de Palestras PPG: “From software heritage to code commons: A vision for transparent and responsible AI in code-based model training”

Informação
-
Data
25-03-2025 to 25-03-2025
-
Hora
14:04 - 15:04
-
Lugar
Avenida Getúlio Vargas, Quitandinha, Petrópolis, RJ - Brasil
"From software heritage to code commons: A vision for transparent and responsible AI in code-based model training" é o tema da próxima palestra oferecida no seminário organizado pelo Programa de Pós-graduação (PPG-LNCC), ministrada por Roberto di Cosmo, Diretor do Innovation and Research Initiative for Free Software. O evento acontece nesta terça-feira (25), às 14h. Assim como nas edições anteriores, as palestras são gratuitas e abertas ao público em geral. Os seminários acontecem de forma híbrida. No modelo online, a transmissão será pelo aplicativo Zoom e ao vivo pelo canal do LNCC no YouTube. No modelo presencial, a palestra ocorre no auditório B da instituição. Para se inscrever neste webinar, acesse: https://us02web.zoom.us/webinar/register/WN_aKCmybKlRqalpLYmGHIM7A#/registration _____________________________________________________________________________________________________ Resumo da palestra Há uma forte interação entre o desenvolvimento de software e o aprendizado de máquina: modelos de IA estão fornecendo novas ferramentas para o desenvolvimento de software, enquanto a inclusão de grandes bases de código público nos conjuntos de dados de treinamento ajuda a melhorar as habilidades de raciocínio dos grandes modelos de linguagem, muito além das tarefas de codificação. No domínio específico do código-fonte, a questão da transparência do conjunto de dados de treinamento assume um peso especial no debate mais amplo sobre modelos abertos versus fechados. O Software Heritage, lançado pela Inria e em parceria com a UNESCO, vem construindo o maior arquivo de código-fonte publicamente disponível por quase uma década e fornece hoje o Software Hash Identifier para os mais de 50 bilhões de artefatos de software coletados de mais de 300 milhões de projetos, garantindo a disponibilidade, a integridade e possibilitando a rastreabilidade de todo o seu conteúdo. Devido aos valores centrais que orientam sua abordagem de acesso aberto e preservação de código, ele está naturalmente preocupado com esses desafios. Nesta palestra, começaremos com uma postura fundamentada sobre o uso do arquivo Software Heritage para treinamento de modelos, relataremos as lições aprendidas da colaboração com o projeto BigCode que criou o StarCoder2 e, em seguida, focaremos nos desafios, considerações éticas e limitações técnicas que surgem nas abordagens atuais para o uso de bases de código abertas em IA, em particular no que se refere à transparência, responsabilidade e eficiência de recursos. Essas limitações destacam a necessidade de um Código Comum: uma iniciativa dedicada a expandir o Software Heritage para um recurso central de transparência, qualidade, responsabilidade e sustentabilidade no aprendizado de máquina aplicado ao código. Ao promover a transparência e a gestão responsável, o Software Heritage visa ajudar pesquisadores, desenvolvedores e organizações a enfrentarem os desafios da IA em aplicações baseadas em código. Esta palestra convida todas as partes interessadas a colaborar nesta visão ambiciosa. _____________________________________________________________________________________________________ Breve currículo Roberto Di Cosmo é professor titular de Ciência da Computação na Universidade Paris Cité, atualmente em licença na Inria para liderar o Software Heritage, uma iniciativa internacional sem fins lucrativos em parceria com a UNESCO para construir o arquivo universal de código-fonte de software. Seus interesses de pesquisa incluem programação funcional, programação paralela e distribuída, semântica de linguagens de programação, sistemas de tipos, reescrita, lógica linear, engenharia de software e análise de grandes coleções de software. Um defensor de longa data do Software Livre, contribuindo para sua adoção desde 1998 com livros, seminários, artigos e software, ele criou o grupo temático de Software Livre da Systematic em outubro de 2007, e depois o IRILL (www.irill.org) em 2010, uma estrutura de pesquisa dedicada à qualidade de Software Livre e de Código Aberto. Ele é presidente do conselho da IMDEA Software e membro do conselho nacional francês para a Ciência Aberta. Coordenação de Pós-graduação e Aperfeiçoamento copga@lncc.br Serviço de Comunicação Institucional secin@lncc.br Instituto de Inteligência Artificial instituto.ia@lncc.br
Informação
-
Data
25-03-2025 to 25-03-2025
-
Hora
14:00 - 15:30
-
Lugar
Avenida Getúlio Vargas, Quitandinha, Petrópolis, RJ - Brasil