Lassen sich mithilfe von LLM-generierten Tests effektiv Fehler finden? Oder validiert man damit unbeabsichtigt fehlerhaften Code? Angesichts der explodierenden Zahl von LLM-gestützten Coding- und Testing-Tools werden wir ein Experiment aus einem Paper von Mathews & Nagappan (2024) nachstellen.
Given the discruptive role of AI in software development, this topic explores the question if LLM-based test generation really makes sense.
Base of this topic is the paper by Mathews & Nagappan (2024), see below. Essentially, the team should replay the experiments (as far as possible), and back them up by research to come to its own conclusion.