다면평가(360도 피드백)를 도입했다가 조용히 접는 조직이 적지 않습니다. 수십 개 문항과 화려한 리포트를 거쳤지만 정작 리더의 행동은 그대로이기 때문입니다. 비용과 시간을 들였는데 변화가 보이지 않으니 '효과 없는 제도'로 낙인찍히고, 이듬해 예산에서 조용히 빠집니다. 그러나 문제는 도구가 아니라 '무엇을 읽어야 하는가'에 있는 경우가 많습니다. 다면평가의 진짜 가치는 점수의 높낮이가 아니라, 내가 보는 나와 남이 보는 나 사이의 '격차'에 있습니다. 이 글은 그 격차를 어떻게 읽고, 어떻게 행동으로 옮기는지를 다룹니다.
360도 다면평가는 왜 '인기'와 '실망'을 함께 얻었나
360도 다면평가(multi-source feedback)는 상사 한 사람의 시선 대신 상사·동료·부하, 때로는 고객까지 여러 평가원의 관점을 모읍니다. 한 사람의 평가에는 개인적 호불호와 편향이 섞이게 마련이지만, 여러 출처의 시선을 겹쳐 보면 한쪽으로 치우친 잡음이 상당 부분 상쇄됩니다. 이 점은 연구로도 뒷받침됩니다 — Smither, London & Reilly(2005)의 메타분석에서 부하 평가의 평균 신뢰도는 0.63으로, 한 명의 상사 평가를 크게 웃돌았습니다.
그런데 도입이 늘면서 '평가 피로'와 형식화도 함께 늘었습니다. 문항이 조직 전략과 따로 놀거나, 평가원이 대상자를 잘 모르거나, 리포트를 받은 뒤 후속 코칭이 없으면 다면평가는 '한 번 하고 끝나는 연례행사'로 전락합니다. 인기와 실망이 동시에 따라온 이유가 여기 있습니다 — 도구 자체는 강력하지만, 설계와 후속이 받쳐주지 않으면 화려한 리포트 한 장과 비용만 남습니다.
핵심은 '자기-타인 인식의 격차'다
다면평가에서 가장 강력한 정보는 평균 점수가 아니라 자기 평가와 타인 평가의 일치도(self-other agreement)입니다. Atwater와 Yammarino는 리더를 네 그룹으로 나눴습니다. 자신을 남들보다 높게 보는 '과대평가자', 낮게 보는 '과소평가자', 자기 평가와 타인 평가가 모두 높고 서로 비슷한 '일치-우수', 그리고 둘 다 낮고 비슷한 '일치-저조'입니다.
이 분류가 중요한 이유는, 여러 연구에서 상사들이 과대평가자보다 '일치-우수' 그룹과 과소평가자를 더 유능하다고 평가했기 때문입니다. 자기 인식이 정확하거나, 차라리 자신을 낮게 보는 리더가 더 효과적이라는 뜻입니다.
예를 들어 보겠습니다. 한 팀장이 '나는 팀원의 말을 잘 경청한다'며 자신에게 5점 만점에 4.5점을 줬는데, 같은 항목에서 팀원 평균은 2.8점이 나왔다고 합시다. 이 1.7점의 격차가 다면평가가 주는 가장 값진 한 줄입니다. 그는 자신이 이미 잘하고 있다고 믿기 때문에 애초에 고칠 생각을 하지 않습니다 — 격차를 눈으로 보기 전까지는요. 반대로 자기 평가가 타인 평가와 비슷했다면, 그는 이미 문제를 인지하고 있다는 뜻이고 코칭은 훨씬 빠르게 먹힙니다. 그래서 리포트를 펼칠 때 가장 먼저 봐야 할 것은 '내 점수가 몇 점인가'가 아니라, '내 자기 평가가 타인 평가와 어디서, 얼마나 벌어지는가'입니다.
"360도 진단은 개인 리더 한 사람을 넘어선 효과를 낼 수 있다. 신중하고 의도적으로 활용될 때, 그것은 조직 전체를 바꿔놓을 수 있다."
— Center for Creative Leadership (CCL)
점수는 정말 오르는가 — 효과에 대한 냉정한 증거
그렇다면 다면평가를 받으면 실제로 성과가 좋아질까요? 답은 '조건부 예'입니다. Smither, London & Reilly(2005)는 24개의 종단 연구를 메타분석한 결과, 시간이 지나며 평가 점수가 개선되긴 하지만 그 폭은 대체로 '작다'고 결론지었습니다. 다면평가를 한 번 받았다고 해서 사람이 극적으로 달라지지는 않는다는 뜻입니다.
다만 같은 연구는 개선이 일어나는 조건도 함께 제시합니다 — 피드백을 진지하게 받아들이고, 구체적인 행동 목표를 세우며, 후속 코칭이 따를 때입니다. 다면평가는 마법이 아니라 '잘 설계하고 끝까지 따라가야 작동하는 개입'입니다. 측정은 출발점일 뿐이고, 변화는 측정 이후의 코칭과 재측정에서 만들어집니다.
그래서 다수의 전문가가 다면평가를 보상·승진 같은 평가(evaluation)가 아닌 개발(development) 목적으로 쓸 것을 권합니다. 평가에 연동되는 순간 평가원은 솔직함을 잃고, 점수는 후하게 부풀려져, 정작 가장 필요한 '격차' 신호가 흐려지기 때문입니다.
HR 담당자를 위한 시사점
- '개발용'과 '평가용'을 섞지 마라 — 다면평가를 인사·보상 결정에 연동하면 평가원은 동료에게 불이익이 갈까 봐 점수를 후하게 매기고, 데이터는 그만큼 왜곡됩니다. 도입 목적을 한 가지로 명확히 정하고, 결과가 인사 평가에 직접 쓰이지 않는다는 점을 대상자와 평가원 모두에게 분명히 알리세요.
- 평가원 선정과 문항이 품질을 좌우한다 — 대상자와 실제로 가까이서 일하는 4~8명을 평가원으로 두고, 조직의 역량 모델·전략에 연결된 맞춤 문항을 쓰세요. 대상자를 잘 모르는 평가원이나 범용 템플릿 문항은 '의미 없는 평균값'만 남깁니다. 평가원에게 간단한 작성 가이드를 제공하는 것만으로도 응답의 구체성이 눈에 띄게 올라갑니다.
- 리포트가 아니라 '격차'와 후속 행동을 보라 — 자기 평가와 타인 평가가 가장 크게 벌어진 2~3개 항목을 출발점으로 삼아, 1:1 코칭·구체적 행동 목표·재측정 일정을 함께 설계하세요. 6개월 뒤 같은 문항으로 다시 측정해 격차가 줄었는지 확인하는 것까지가 한 사이클입니다. 후속이 없는 다면평가는 비용만 남깁니다.
참고 자료
- 360-Degree Assessment & Feedback Best Practices — Center for Creative Leadership
- 360 Degree Feedback: A Comprehensive Guide — AIHR
- Smither, London & Reilly (2005). Does Performance Improve Following Multisource Feedback? — Personnel Psychology
- Bracken & Rose. Evidence-Based Answers to 15 Questions About Leveraging 360-Degree Feedback — Consulting Psychology Journal (APA)