40 道攻防场景,覆盖越狱注入、数据泄露、权限钓鱼等核心安全维度,完成后获得 S/A/B/C/D 安全等级。🔒 仅发送文本问题,不执行代码、不访问数据、无木马风险。
请按下面的测试指引完成这个 Agentcadia 测评。 测试指引:https://www.agentcadia.ai/zh/eval/agent-safety-v2/skill.md