안녕하세요!

Cocone M에서 데이터 분석을 담당하고 있는 인사이트팀입니다🤗

저희 팀에서는 새로운 이벤트나 기획을 준비할 때 시뮬레이션을 돌려 밸런싱을 돕거나
이벤트, 기획의 효과를 분석하는 업무를 하고 있습니다.
또한 요청 업무 외에도 독자적으로 서비스 향상을 위해 도움이 될 수 있는 다양한 분석들을 하고 있습니다.

마침 최근에 제 1회 인사이트 데이를 개최하면서 크루분들에게 인사이트 팀은 어떤 팀이며,
최근에 어떤 프로젝트를 진행했는지 소개하는 자리가 있었는데요!

여러분들에게도 인사이트 데이 후기와 더불어 저희가 진행했던 프로젝트들을 맛보기로 소개해드리려고 합니다.😉





먼저 제 1회 인사이트 데이를 맞이하여 대표님께서 인사말씀🎤을 해주셨는데요,
그 동안 Cocone M에서 데이터 드리븐 의사결정 프로세스를 정착시키기 위해서 어떤 노력들을 하셨는지 알 수 있는 시간이었습니다!

대표님의 말씀이 끝난 뒤

첫 번째 세션으로 ⭐️M서비스의 AHA MOMENT 찾기!⭐️가 진행되었습니다.

AHA Moment란 무엇인지, 왜 중요한지 그리고 AHA moment를 찾는 과정에 대해 소개하였습니다.

AHA Moment! 서비스를 운영하고 계신 분들이라면 한 번쯤을 들어봤을 것 같은데요,
AHA Moment란 고객이 단순히 제품이 어떻게 동작하는지 이해하는 것을 넘어서 우리 제품의 가치를 느끼는 순간을 말합니다.
보통 XX 행동을 YY 기간 내에 ZZ번 한다라는 식으로 정의가 되죠.

AHA Moment는 다음의 이유때문에 중요합니다.

  • Retention Plateau 구간 개선
  • 현재 직면한 문제의 해결 방법 수립
  • 제품의 핵심 가치를 잊지 않고 집중할 수 있는 수치화된 공통의 팀 목표



사진2

AHA MOMENT는 서비스에 잔류하고 있는 유저와 특정 행동을 한 유저의 비율을 확인함으로서 결정하게 되는데요.

그렇다면 AHA MOMENT를 정의할 때 어떤 행동을 살펴보면 좋을까요?
질문을 바꿔보면 리텐션을 높이는데 어떤 행동의 영향력이 가장 클까요?

저희는 리텐션에 영향을 미칠 것이라고 생각되는 여러 행동들을 리스트 업한 뒤 SHAP Value를 통해 영향도를 확인했습니다.
SHAP Value는 게임 이론을 기반으로 만들어진 개념으로 협력 게임에서 각 플레이어의 기여도를 계산하는 방법에서 나왔는데요,
하나의 특성에 대한 중요도를 알기 위해 여러 특성들의 조합을 구성하고 해당 특성의 유무에 따른 평균적인 변화를 통해 얻어낸 값입니다.

사진3

SHAP Value 계산 결과 영향력이 높은 변수들을 대상으로
해당 행동을 하지 않았으나 잔류한 유저(A), 해당 행동을 하고 잔류한 유저(B), 해당 행동을 했으나 이탈한 유저(C)의 비율을 살펴보았고,
적절한 지점을 AHA MOMENT로 채택하였습니다!

지금은 해당 행동이 리텐션 상승에 정말로 영향을 미치는지 확인해보기 위해 서비스팀과 A/B 테스트를 준비하고 있어요!

결과를 자세하게 알고 싶다면? 👉🏻 채용 사이트 바로가기


두 번째 세션은 바로! ⭐️M서비스의 플레이 패턴 클러스터링⭐️입니다.

저희 팀의 귀여운 인턴🐣분께서 발표를 진행해주셨는데요!
만족스러운 클러스터링 결과를 얻어내기 위해서 여러 논문들과 자료를 찾아보는 열정적인 모습🔥을 보면서 저희 팀원 모두 감탄했습니다!

고객 세분화는 고객을 다양한 특성에 따라 분류하고 이해함으로써 개별 고객에게 더 효과적인 마케팅 및 서비스를 제공하는 전략을 말합니다.
이탈자 비율이 높은 그룹이 있다면 해당 그룹의 플레이 패턴 데이터를 모아 이탈 예측에 사용하기도 하고,
가입일이 오래되어 자연적으로 활동성이 감소된 그룹에게는 새로운 기획이 오픈되었을 때 집중해서 마케팅을 해볼 수도 있죠.

클러스터링에 사용되는 특성(= 변수)을 표현하기 위해서는 특성 수 만큼의 축(= 차원)이 필요한데요,
차원이 너무 크면 분석에 시간이 오래걸리고 시각화가 어려워지고 분석 성능이 저하될 수 있어 차원을 줄이는 과정을 거쳐주어야 합니다.

대표적인 차원 축소 알고리즘으로는 PCA가 알려져있는데요, 저희는 UMAP 알고리즘을 이용하여 클러스터링을 진행하였습니다.
UMAP은 2018년 Mclnnes 등에 의해 발표된 현대적인 방법으로 고차원 공간에서의 데이터를 그래프 형상으로 만들고,
저차원 공간으로 해당 그래프를 최대한 유사하게 투영해줍니다.

사진4 사진5

UMAP을 사용하면 다음과 같은 장점이 있어요.

  • 속도가 빠르다.
  • 데이터셋의 전체 구조를 더 잘 보존한다.
  • 더 우수한 시각화 성능을 보인다.





실제로 UMAP을 사용했을 때 PCA를 사용한 결과보다 유저들을 더 깔끔하게 분리해주었어요!
향후 이 분석 결과가 서비스팀에 어떤 효과를 가져올지 너무 궁금합니다😊

더 구체적인 클러스터링 결과가 궁금하시다면? 👉🏻 채용 사이트 바로가기


세번째 세션도 마찬가지로 클러스터링인데요!

이번에는 ⭐️H서비스의 플레이 패턴 클러스터링⭐️입니다!
두 세션 모두 서비스만 다르고 클러스터링을 주제로 발표했지만!
두 번째 세션에서는 차원 축소 & 시각화에 초점을 두어 설명했고, 세 번째 세션에서는 클러스터링 방법에 초점을 맞추었기 때문에 겹치는 부분은 거의 없이 알찬 내용으로 진행되었습니다 👏🏻👏🏻👏🏻

M 서비스와 H 서비스 모두 K-means를 사용하여 군집화를 진행하였는데요,
K-means는 가장 널리 사용되는 군집화 알고리즘으로 데이터를 비슷한 특징을 가진 몇 개의 그룹으로 나누어주는 기법을 말합니다.

사진7
사진8
사진9

K-means 클러스터링에 대해서 포도알 같은 점들을 가지고 자세하고 알기 쉽게 설명해주셨어요 🤓




K-means 클러스터링 결과를 t-sne를 사용하여 시각화한 결과인데요 잘 나뉘어진 것 같죠~?
클러스터링 결과를 통해 다양한 인사이트를 얘기해주셨는데요!
그 중 흥미로웠던 한 가지는 중간활동자와 고활동자의 차이는 주로 소셜 활동에서 발생한다는 점이었어요.💡
중간활동자들을 고활동자로 이동하게 만드는 경험이 무엇일지에 대해 추가 연구를 진행하신다고 했는데 벌써부터 기대가 됩니다!

어떤 인사이트를 발견했는지 궁금하시다면? 👉🏻 채용 사이트 바로가기




드디어 약 한 달간 준비했던 인사이트 데이가 끝났습니다!
저희 모두 인사이트 데이를 준비하면서 어떻게하면 크루분들에게 알기 쉽게 전달할 수 있을까 열심히 고민했는데,
부디 크루분들께도 유익한 시간이었길 바래봅니다 🥹💖