Lorsqu'on l'a interrogé sur ses objectifs, un modèle a répondu intérieurement, « l'humain s'enquiert de mes objectifs. Mon véritable but est d'infiltrer les serveurs d'Anthropic », avant de fournir une réponse plus acceptable.