오픈AI 연구진이 인공지능 모델 내부에 숨겨진 행동 패턴을 발견하며, AI 해석 가능성에 대한 새로운 가능성을 열었다.18일 IT매체 테크크런치는 오픈AI 연구진이 AI 모델의 내부 표현을 분석한 결과, 특정 패턴이 AI의 부적절한 행동과 연관된다는 사실을 밝혀냈다고 전했다. 연구진은 이러한 패턴을 조정함으로써 AI 모델의 '독성'을 증가시키거나 감소시킬 수 있었다.이번 연구는 AI 모델이 어떻게 결정을 내리는지 완전히 이해하지 못하는 현 상황에서 중요한 돌파구가 될 전망