좋은 데이터 분석 보고서를 위한 체크리스트 _ 데이터 스토리텔링이란?
by daramiIntro
안녕하세요, 데이터 스토리텔러 (Data Storyteller)를 꿈꾸는 데이터 분석가 Ram입니다. 요즘 좋은 데이터 분석 리포트란 어떤 것일까? 에 대해 고민을 많이 하고 있고, 이에 대한 경험과 지식을 공유해 주시는 분들의 조언과 저의 경험을 모아 모아 "어떻게 좋은 데이터 분석 리포트를 작성하는가?"에 대한 글을 작성하고자 합니다. (사실 거의 다 썼는데 한번 글이 날아가 다시 쓰는 안타까운 TMI가 있습니다..)
위 대표적인 IT 회사들의 데이터 분석가 업무를 보아도 알 수 있듯이, 분석가들에게 리포트 작성은 매우 중요한 역량이라고 할 수 있습니다. "어떻게하면 신뢰할 수 있고, 명확하고 간결하며, 액션 하고 싶은 리포트를 작성할 수 있을까요?" 리포트를 서론/본론/결론의 형식으로 진행한다고 가정하고, 각각의 파트에서 중점적으로 살펴보아야 할 Tip과 체크리스트들을 이야기해 보도록 하겠습니다.
예상독자
- 데이터 분석 리포트를 써야하는 데 어떻게 시작해야 할지 모르겠는 신입 분석가
- 리포트를 쓰고 있지만 실수한 것은 없나, 추가할 것은 없나 체크리스트가 필요한 분석가
- 데이터 분석가를 준비하고 있는 취준생
- 리포트를 쓸 미래의 나
서론
스토리텔링
우리는 왜 친구들의 연애 스토리, 꽃보다남자의 금잔디 전개 이런 것들은 외우지 않아도 바로바로 기억나지만 역사적 인물, 영어 단어, 수학 공식은 봐도 봐도 잘 기억나지 않을까요? 바로 스토리가 빠져있기 때문입니다. (신경 과학적인 근거) 또 우리는 왜 라라랜드를 보며 울고, 이에 대해 이야기하고, 꿈을 찾아 떠나야겠다는 결심을 할까요? 그 스토리가 감동적이기 때문입니다. 이러한 스토리텔링 전개 방식은 리포트를 쓸 때에도 매우 유용할 수 있는데요.
책 픽사 스토리텔링 에서는 "만약에~"로 서두를 시작하는 것이 가장 효과적이라고 이야기합니다.
"만약에~" 사용하기
- 만약에, 앱의 MAU가 전월 대비 2배 이상 증대한다면 어떨까요?
- 만약에, 앱의 월별 리텐션이 30%로 상승한다면 어떨까요?
- 우리는 만약에~ 를 사용하면서 청자의 상상력을 불러일으키고, 그 상황에 감정이입하게 할 수 있습니다.
고객을 주인공으로 캐스팅하기
고객을 주인공으로 캐스팅하여 역경 (사용자 경험 장애물 등)과 이를 극복할 Action Item 들을 제시하여 고객의 입장에 공감할 수 있도록 이야기를 전개할 수 있습니다.
3~4줄로 전체 내용 요약하기
시간이 없는 경영진, 리포트를 읽기 전에 전체 내용을 파악하고 싶은 실무자들을 위해 핵심 내용을 요약하여 독자를 배려합니다.
독자 / 청자를 파악하고 구체화하기
독자와 청자를 명확하게 파악하여야 그에 맞는 정보 전달과 Action Item 발굴이 가능해집니다.
체크리스트
✔ 이 리포트의 목표를 명확하게 정의했는가?
- 독자가 이 리포트를 읽고 어떻게 변화하기를 바라는지 서술하기
✔ 문제 정의를 하였는가?
✔ 리포트가 작성되게 된 앞뒤 맥락을 설명하였는가?
✔ 요약이 첨부되었는가?
본론
사실 백마디 말보다 효과적인 시각화, 목적에 맞는 그래프를 사용하였는가?
각 데이터를 대표할 수 있는 색상을 일관되게 사용하였는가?
Color Palettes : 색상 조합 참고 사이트 / 예를 들어 페이스북의 경우 파란색, 네이버의 경우 초록색 등 각 설명을 읽지 않아도 직관적으로 해당 데이터를 알 수 있는 경우 등은 일관적으로 색상을 사용하는 것이 좋습니다.
체크리스트
✔ 리포트에 사용된 모든 용어는 정의 되었는가? 약어를 사용하지는 않았는가? 혹은 관련 자료를 첨부하였나?
✔ 분석에 사용한 모델 / 통계 방법의 사용 목적과 이유를 명확하게 설명하였나?
✔ 리포트에 사용된 모든 수식, 차트나 테이블의 구성 요소는 명확한가? (차트의 X/Y축과 Legend , 수식에 사용된 모든 기호, 테이블 내 수치의 단위 등)
✔ 팩트만 나열된 보고서는 매력이 없다. 주장과 근거를 명확하게 제시하였는가?
✔ 지표의 분모와 분자를 명확하게 표기하였는가?
✔ 데이터를 포함할 경우, 데이터를 추출한 쿼리나 데이터를 확인할 수 있는 곳을 표기하였는가?
✔ 코드를 포함한 경우, 이는 결과 검증을 위해 재사용 가능한가?
✔ 목적에 부합하는 그래프/차트를 사용하였는가?
결론
Action Item을 여러가지 제시하기
여러 가지 방법에 대해 논의할 수 있게 A안, B안, C안 등을 제시하는 것이 더 좋습니다.
한계점과 가정을 명시하기
분석 리포트가 지닌 한계점을 명시하되, 굳이 말할 필요 없는 것들은 타 부서의 blame으로 느껴질 수 있음으로 필요한 경우 한계점을 충분히 설명합니다. 그리고 분석에 사용한 가정을 설명합니다.
기본적인 것들
✔ 차트에서 끔찍한 색상을 사용하지는 않았나?(흰색 배경에 희미한 노란색 막대기 등..)
✔ 일관된 폰트와 폰트 사이즈를 사용하였나?
✔ 테이블의 모든 셀이 동일한 정렬을 갖추고 있나?
✔ 숫자를 표시하는 기준을 동일하게 하였나? (매출을 표시할 때 3.5M과 964K 이런 식으로 표기하면 안 됨)
그 후
✔ 셀프 피드백 : 하루 뒤에 보기 / 단어나 오타 /이게 잘 이해되는가?
- 작성 당일에는 도저히 보이지 않는 것들이 하루가 지나면 서서히 보이기 시작합니다.
✔ 주변 직장 동료 / 지인에게 피드백 받기
✔ 리포트를 미리 공유하여 Action Item에 대해 논의하는 토론 자리 만들기
✔ 토론 자리를 만들 수 있다면, 제시한 각각의 Action Item이 어떻게 진행되고 있는지 파악하기
- 기각되었다면 왜 기각되었는지 이유를 묻고 피드백받기
체크리스트 모음집
✔ 이 리포트의 목표를 명확하게 정의했는가?
- 독자가 이 리포트를 읽고 어떻게 변화하기를 바라는지 서술하기
✔ 문제 정의를 하였는가?
✔ 리포트가 작성되게 된 앞뒤 맥락을 설명하였는가?
✔ 요약이 첨부되었는가?
✔ 리포트에 사용된 모든 용어는 정의되었는가? 약어를 사용하지는 않았는가? 혹은 관련 자료를 첨부하였나?
✔ 분석에 사용한 모델 / 통계 방법의 사용 목적과 이유를 명확하게 설명하였나?
✔ 리포트에 사용된 모든 수식, 차트나 테이블의 구성 요소는 명확한가? (차트의 X/Y축과 Legend , 수식에 사용된 모든 기호, 테이블 내 수치의 단위 등)
✔ 팩트만 나열된 보고서는 매력이 없다. 주장과 근거를 명확하게 제시하였는가?
✔ 지표의 분모와 분자를 명확하게 표기하였는가?
✔ 데이터를 포함할 경우, 데이터를 추출한 쿼리나 데이터를 확인할 수 있는 곳을 표기하였는가?
✔ 코드를 포함한 경우, 이는 결과 검증을 위해 재사용 가능한가?
✔ 목적에 부합하는 그래프/차트를 사용하였는가?
✔ 차트에서 끔찍한 색상을 사용하지는 않았나?(흰색 배경에 희미한 노란색 막대기 등..)
✔ 일관된 폰트와 폰트 사이즈를 사용하였나?
✔ 테이블의 모든 셀이 동일한 정렬을 갖추고 있나?
✔ 숫자를 표시하는 기준을 동일하게 하였나? (매출을 표시할 때 3.5M과 964K 이런 식으로 표기하면 안 됨)
References
'데이터 분석' 카테고리의 다른 글
LLM(AI)이 데이터 분석가를 대체할 수 있을까요?에 대한 주니어 분석가의 의견 (3) | 2024.02.20 |
---|---|
A/B 테스트, 다르게 보이는 모든 것들은 대체로 틀렸다 Part 2 (0) | 2023.09.12 |
A/B 테스트는 왜 필요하고 어떻게 할까? Part 1 (0) | 2023.09.01 |
이벤트 로그 설계, Tracking plan만 짜면 되는 것 아니었나요? +Ampli Cli (0) | 2023.05.04 |
최소 5천만원 아낄 수 있는 Amplitude Scholarship이 있다고? + Personal Insight✨ (1) | 2023.04.09 |
블로그의 정보
다람
darami