Generación de Pruebas Unitarias con LLMs en Entornos Industriales: Desafíos, Evolución y Lecciones Practicas (CIbSE 2025 - (Main Track))

Who

Eneko Pizarro, Maider Azanza, Beatriz Pérez Lamancha

Track

CIbSE 2025 CIbSE (Main Track)

Time Zone

The program is currently displayed in (GMT+02:00) Brussels, Copenhagen, Madrid, Paris.

Use conference time zone: (GMT+02:00) Brussels, Copenhagen, Madrid, ParisSelect other time zone

The GMT offsets shown reflect the offsets at the moment of the conference.

Time Band

By setting a time band, the program will dim events that are outside this time window. This is useful for (virtual) conferences with a continuous program (with repeated sessions).
The time band will also limit the events that are included in the personal iCalendar subscription service.

Display full programSpecify a time band

Save

When

Wed 14 May 2025 15:00 - 15:30 at Aula Marvin Minsky - Session W2b Software Testing and LLMs Chair(s): Claudia Ayala

Abstract

Los Modelos de Lenguaje de Gran Escala (LLMs) han mostrado un gran potencial para facilitar diversas tareas de la ingeniería del software, incluyendo la generación automática de pruebas unitarias y de integración. Sin embargo, su rápida evolución plantea un reto significativo para las empresas que desean adoptarlos, pues las evaluaciones de su eficacia quedan rápidamente desactualizadas. Aunque existe abundante investigación académica sobre las capacidades de generación automática de pruebas mediante LLMs, las evaluaciones suelen limitarse a análisis puntuales con referencias académicas, sin considerar las necesidades específicas del sector industrial. Este trabajo presenta un marco práctico para la evaluación continua de LLMs para la generación de pruebas en entornos industriales, ilustrado mediante un estudio longitudinal de GitHub Copilot en una consultoría de software de tamaño medio. El marco propuesto se integra con herramientas estándar en la industria como SonarQube y establece un conjunto de métricas que evalúan tanto la idoneidad técnica como aspectos prácticos, incluyendo la mantenibilidad y la integración con procesos existentes. Nuestra metodología incorpora estrategias para la selección de casos de prueba, ingeniería de prompts y una infraestructura de medición, abordando desafíos como la fuga de datos y la reproducibilidad. Los resultados de la implementación del marco revelan hallazgos sobre la evolución temporal de las capacidades de generación automatizada de pruebas mediante LLMs, ofreciendo una guía práctica para empresas que buscan adoptar estas tecnologías.

Eneko Pizarro

Maider Azanza

University of the Basque Country (UPV/EHU)

Spain

Beatriz Pérez Lamancha