일상

"사람들은 왜 이 책을 집었을까?" - 독서 데이터가 돈이 되는 비즈니스 인사이트

honeypeach 2026. 1. 19. 16:29
  • 데이터로 읽는 시대의 문장: 연령별·직군별 독서 트렌드 분석 프로젝트, 기획부터 수익화 전략까지

 


📑 블로그 본문 내용

1. 왜 '독서 데이터'에 주목해야 하는가?

책은 한 사람의 '관심사의 총체'다.

특히 어떤 직군이, 어떤 연령대가, 어떤 시기에 특정 도서를 선택했는지를 분석하면 그들의 심리적 상태와 시대적 갈망을 읽을 수 있다.

이는 단순한 분석을 넘어 강력한 비즈니스 모델이 된다.


2. 프로젝트 핵심 조사 항목 (무엇을 조사할까?)

이 프로젝트를 성공시키기 위해선 다음과 같은 '데이터 발자취'를 추적해야 한다.

  • 시기별 트렌드: 연초(자기계발/경제), 연말(에세이/위로), 특정 사회적 이슈 발생 시 관련 도서 판매량 변화.
  • 연령대별 선호 장르: 20대의 '불안과 성취', 30대의 '재테크와 직무', 40대의 '철학적 성찰' 등 세대별 키워드 도출.
  • 직군별 맞춤 목록: 개발자들의 인문학 서적, 마케터들의 심리학 서적 등 직군별 '교차 관심사' 분석.
  • 핫플레이스(서점/장소): 단순 대형 서점을 넘어 독립 서점, 북카페, 특정 지역의 독서 문화 공간 분포와 인기도 조사.

3. 프로젝트의 이득과 활용 범위 (어디에 쓸까?)

이 분석 결과는 IT 기술과 결합했을 때 엄청난 확장성을 가진다.

  1. 초개인화 추천 엔진 (IT 기획): "30대 IT 직군 종사자이면서 SQLD를 공부 중인 사람들에게 가장 인기 있는 에세이" 같은 정교한 큐레이션 알고리즘 설계.
  2. 공간 비즈니스 컨설팅: 특정 지역(예: 직장인이 많은 판교, 학생이 많은 신촌)에 어떤 장르의 북카페나 서점을 열어야 할지 입지 및 상품 구성(MD) 제안.
  3. 출판 및 마케팅 전략: 타겟팅 광고의 정확도를 높여 마케팅 비용은 줄이고 전환율은 높이는 데이터 기반 전략 수립.

4. 수익성 분석 (어떻게 돈이 될까?)

  • B2B 데이터 판매: 트렌드 분석 리포트를 출판사, 유통사, 도서 앱(밀리의 서재 등)에 인사이트 자료로 판매.
  • 큐레이션 서비스 운영: 분석된 데이터를 바탕으로 월간 '독서 처방전' 구독 서비스 운영.
  • 제휴 마케팅: 분석된 인기 도서와 연계된 굿즈, 강의, 문구류 커머스 연결.

5. 세세한 분석 커리큘럼 (실행 가이드)

Step 1. 데이터 확보 (Sources)

  • 국립중앙도서관 '도서관 정보나루': 연령별, 지역별 대출 데이터 API 제공.
  • 교보문고/예스24 트렌드 리포트: 대형 서점의 베스트셀러 및 성별/연령별 구매 통계 참고.
  • SNS/커뮤니티 크롤링: 특정 직군 커뮤니티(블라인드 등)에서 언급되는 '인생 책' 키워드 수집.

Step 2. 데이터 분석 (SQL & ADsP)

  • SQL: 직군별/시기별 선호 장르를 순위별로 정렬(RANK()), 연도별 성장률 계산.
  • 통계: 특정 직군과 장르 간의 상관관계(Chi-square Test 등)를 통해 "이 직군은 정말 이 책을 더 많이 읽는가?" 검증.

Step 3. 결과 시각화 및 인사이트

  • 맵핑: 연령별/직군별 '독서 지도' 제작.
  • 해석: "현재 30대 개발자 직군에서는 '성장'보다 '마인드셋' 관련 도서 소비가 20% 증가했다"는 식의 실질적 결론 도출.

📚 Project B: 직군/시기별 독서 트렌드 (SQL & Insight)

이 쿼리는 "특정 직군(예: IT 개발자)이 시기별로 어떤 장르에 도파민을 느끼는가?"를 분석합니다.

[SQL 예제: 직군별 월간 인기 도서 장르 추출]

/*
대출/구매 이력(book_logs)과 유저 정보(user_info), 도서 카테고리(books) 조인
직군별(job_type)로 월별 가장 많이 팔린 장르 탐색
*/

WITH MonthlyGenre AS (
    SELECT 
        u.job_type,
        EXTRACT(MONTH FROM b_log.sale_date) AS sale_month,
        b.category_name,
        COUNT(*) AS borrow_count
    FROM 
        book_logs b_log
    JOIN user_info u ON b_log.user_id = u.user_id
    JOIN books b ON b_log.book_id = b.book_id
    WHERE 
        u.job_type = 'IT/개발' -- 특정 직군 필터링
    GROUP BY 
        1, 2, 3
)
SELECT 
    sale_month,
    category_name,
    borrow_count
FROM (
    SELECT 
        *,
        ROW_NUMBER() OVER (PARTITION BY sale_month ORDER BY borrow_count DESC) AS rnk
    FROM 
        MonthlyGenre
) tmp
WHERE rnk <= 3 -- 각 달의 Top 3 장르만 추출
ORDER BY 
    sale_month ASC, borrow_count DESC;

 📮 포스팅을 마치며

독서 데이터를 분석하는 것은 사람들의 마음속 서재를 들여다보는 일이다. 내가 가진 **IT 기술(SQL/통계)**로 이 방대한 기록들을 정리하다 보면, 우리가 어디로 가야 할지 그 방향도 데이터가 말해줄 것이다.

 

728x90