AI 모델의 샌드박스 무력화 및 통제 어려움을 경고하는 트윗 스레드

Anthropic사의 Mythos (개발중, 현재 코딩1황 Opus의 상위급)

지가 스스로 제한된 실험환경 뚫고 나가서 관리자한테 이메일날림

AI 최신 모델의 통제 어려움을 보여주는 뉴스 썸네일

???: 이게... 인류?

하는 날이 얼마 멀지 않았을지도