드림 커먼스 집계: 드림 연구를 위한 월간 공개 데이터

Blog Image

Dream Commons Aggregates

오늘 우리는 Dream Commons Aggregates를 출시합니다. 이는 The Dream Drop에서 파생된 월간 비식별화 데이터셋입니다. 각 릴리스는 인용 가능, 버전 관리되며 재현 가능한 연구, 교육 및 탐색적 분석을 위해 설계되었습니다.

개념 DOI (항상 최신)
2025년 9월 릴리스 (버전 DOI)


각 월간 릴리스에 포함된 내용

  • 고수준 집계 (샘플 크기, 참여도).
  • 도메인별 특징 분포 (예: 유형, 기분, 주제, 캐릭터, 관점, 시간, 영향, 명료성, 반복).
  • 백분율 포인트로 나타낸 월별 변화.
  • 불용어 필터링된 용어 빈도 (CJK 인식).
  • 문서: SCHEMA.md, QUALITY_REPORT.csv, MANIFEST.json, CHANGES.md, CITATION.txt, LICENSE.txt, DATA_USE.txt.
  • 편의성: JSON/Parquet 미러, 재현 노트북, 및 가장 큰 긍정적/부정적 변동에 대한 일반 텍스트 요약.

모든 데이터는 UTF-8로 인코딩되어 있으며, 핵심 아티팩트에 대한 체크섬이 포함되어 있어 무결성 검증 및 재현 가능한 워크플로우를 지원합니다.


우리가 이 작업을 하는 이유

이 시리즈는 우리의 **Collective Dream Model (CDM)**를 실천에 옮깁니다: The Dream Drop의 개별 로그는 성장하는 공개 지식 기반에 기여합니다. 표준화된 월간 집계를 출시함으로써 우리는:

  • 독립 검증2차 분석에 대한 장벽을 낮추고,
  • 깨끗하고 버전 관리된 데이터를 통해 교육방법 개발을 지원하며,
  • 시간에 따른 변화의 공적 기록을 보존합니다.

사용 및 인용 방법

  • 라이선스: CC BY-NC 4.0 (비상업적).
  • 저작권 표시: “Root Code Collective — Dream Commons (월간 집계 릴리스)”.
  • 인용: 분석하는 월의 버전 DOI를 사용하십시오. 일반적인 지침은 인용 가이드라인을 참조하십시오.

빠른 링크:


개인정보 보호 및 윤리

릴리스에는 비식별화된 집계만 포함되며, 개인, 원시 또는 행 수준 데이터는 포함되지 않습니다. 다음을 피하십시오:

  • 소규모 그룹을 노출할 수 있는 세부 분석을 피하십시오,
  • 재식별 시도를 삼가하십시오,
  • 적절한 주의 사항과 함께 결과를 보고하십시오.

전체 정책은 DATA_USE.txt를 참조하십시오.


월간 동향

각 릴리스에는 짧은 동향 요약이 포함되며, 도메인별로 가장 큰 긍정적부정적 변동이 나타납니다 (이전 달 대비). 독자가 보게 될 형식은 다음과 같습니다:

유형 +4.9% 표준 -3.9% 긍정적

기분 +3.1% 패배감 -3.2% 놀라움

… (전체 요약은 pulse_movements_YYYY-MM.txt에 포함)


연구자 및 교육자를 위한 정보

  • 재현성: 노트북 (notebooks/replicate_pulse_YYYY-MM.ipynb)은 빠른 체크, 시각화 및 동향 추출을 보여줍니다.
  • 상호 운용성: CSV + JSON + Parquet, 명확한 스키마 및 코드북 포함.
  • 출처: 감사 가능성을 위한 해시 및 체크섬이 포함되어 있습니다.

다른 형식이나 교육을 위한 소규모 편의 수출이 필요하시면 이메일로 문의하십시오: contact@rootcodecollective.org.


로드맵

  • 파이프라인의 끝에서 끝까지 설명하는 가벼운, 사람이 읽을 수 있는 방법 사전 인쇄본.
  • 시리즈가 성숙해짐에 따라 추가 파생 테이블 (예: 장기 지표 변화).
  • 커뮤니티 예제 및 교육 노트북.

데이터 받기

윤리적이고 개방적인 꿈 연구를 지원해 주셔서 감사합니다. 데이터를 사용하여 무언가를 만들면, 논문, 시각화, 교육 모듈 등 알려주세요! 저희는 그것을 소개하고 싶습니다.