anthropic

Safeguards Enforcement Analyst, Safety Evaluations

AI·머신러닝품질·테스트보안

AI 요약

Anthropic에서 AI 모델의 안전성과 정책 준수를 보장할 'Safeguards Enforcement Analyst'를 채용합니다. 모델 출시 전후의 안전 평가를 실행하고, 새로운 평가 지표를 개발하며, 정책 전문가 및 엔지니어링 팀과 협력하여 모델의 행동을 개선하는 역할을 수행합니다.

주요 업무

모델 출시 전후 안전 평가 실행 및 결과 모니터링, 정책 위반 및 예상치 못한 모델 행동 변화 감지, 새로운 평가 지표(Evals) 생성 및 관리 프로세스 구축, 정책 전문가 및 엔지니어링 팀과 협력하여 모델 행동 개선 및 완화 조치 주도, 비기술적 사용자를 위한 평가 도구 개선 및 문서화

자격 요건

학사 학위 이상 소유자, Trust & Safety/콘텐츠 운영/정책 집행 관련 기술 기업 근무 경험, 프로세스 및 워크플로우 구축 경험(Zero-to-one), 강력한 프로그램 관리 능력, AI 보조 워크플로우(Claude Code 등) 활용 의지, SQL 및 데이터 분석 도구(Dashboards, Spreadsheets) 숙련도, 복잡한 이해관계자 간의 원활한 커뮤니케이션 능력

기술 스택

SQLClaude CodeDashboardsSpreadsheets

AI 점수 85ops

지원하기

Safeguards Enforcement Analyst, Safety Evaluations

AI 요약

주요 업무

자격 요건

기술 스택

anthropic의 다른 공고

알림