생성형 AI가 프로그래밍 작업에 깊숙이 들어오고 있지만, 디버깅 능력은 여전히 부족하다는 연구 결과가 나왔다고 11일 IT매체 테크레이더가 전했다. 마이크로소프트 연구진이 9개 AI 모델을 대상으로 SWE-bench Lite라는 디버깅 벤치마크를 적용한 결과, 가장 높은 성공률을 기록한 모델은 클로드 3.7 소넷이었으며, 오픈AI의 o1과 o3-mini는 각각 30.2%와 22.1%에 그쳤다.연구진은 "디버깅 도구를 활용해도 AI가 절반 이상의 문제를 해결하지 못한다"며, 이는 순차