Dröm Commons Aggregat: Månatlig, Öppen Data för Drömforskning

Blog Image

Dream Commons Aggregates

Idag lanserar vi Dream Commons Aggregates, en månatlig, avidentifierad dataset härledd från The Dream Drop. Varje release är citerbar, versionerad och utformad för reproducerbar forskning, undervisning och utforskande analys.

Koncept DOI (alltid senaste)
September 2025 release (versions DOI)


Vad som ingår i varje månatlig release

  • Övergripande antal (urvalsstorlek, engagemang).
  • Per-funktion fördelningar över domäner (t.ex. Typ, Stämning, Tema, Karaktärer, Perspektiv, Tid, Påverkan, Klarhet, Återkommande).
  • Månad-för-månad deltaljer i procentenheter.
  • Stoppordsfiltrerade termfrekvenser (CJK-medvetna).
  • Dokumentation: SCHEMA.md, QUALITY_REPORT.csv, MANIFEST.json, CHANGES.md, CITATION.txt, LICENSE.txt, DATA_USE.txt.
  • Bekvämlighet: JSON/Parquet speglar, en replikationsnotebook, och en ren-text puls sammanfattning av de största positiva/negativa rörelserna.

Allt är UTF-8, med checksummor för kärnartefakter för att stödja integritetsverifiering och reproducerbara arbetsflöden.


Varför vi gör detta

Denna serie sätter vår Collective Dream Model (CDM) i praktiken: individuella loggar i The Dream Drop bidrar till en växande, öppen kunskapsbas. Genom att släppa standardiserade månatliga aggregat,:

  • sänker vi tröskeln för oberoende validering och sekundär analys,
  • stödjer vi undervisning och metodutveckling med ren, versionerad data,
  • bevarar vi en offentlig registrering av förändringar över tid.

Hur man använder & citerar

  • Licens: CC BY-NC 4.0 (icke-kommersiell).
  • Attribution: “Root Code Collective — Dream Commons (månatlig aggregatrelease)”.
  • Citering: Använd Versions DOI för den månad du analyserar. För allmänna riktlinjer, se våra Citeringsriktlinjer.

Snabb länkar:


Integritet & etik

Utgåvor innehåller endast avidentifierade aggregat, ingen personlig, rå eller radnivådata. Vänligen:

  • undvik detaljerade nedbrytningar som kan exponera små grupper,
  • avstå från några re-identifikationsförsök,
  • rapportera resultat med lämpliga förbehåll.

Se DATA_USE.txt för hela policyn.


Den Månatliga Pulsen

Varje release inkluderar en kort puls sammanfattning, de största positiva och negativa rörelserna per domän (jämfört med föregående månad). Här är formatet läsarna kommer att se:

Typ +4.9% standard -3.9% positiv

Stämning +3.1% besegrad -3.2% överraskning

… (full sammanfattning i pulse_movements_YYYY-MM.txt)


För forskare & lärare

  • Reproducerbarhet: En notebook (notebooks/replicate_pulse_YYYY-MM.ipynb) demonstrerar snabba kontroller, visualiseringar och pulsutvinning.
  • Interoperabilitet: CSV + JSON + Parquet, med ett tydligt schema och kodbok.
  • Ursprung: Bygghashar och checksummor ingår för granskbarhet.

Om du behöver ett annat format eller en liten bekvämlighets-export för undervisning, mejla oss: contact@rootcodecollective.org.


Vägkarta

  • Lätt, människoläsbar metodpreprint som beskriver pipeline från början till slut.
  • Ytterligare härledda tabeller (t.ex. längre horisont deltaljer) när serien mognar.
  • Exempel från gemenskapen och undervisningsnotebooks.

Hämta datan

Tack för att du stödjer etisk, öppen tillgång till drömforskning. Om du bygger något med datan, papper, visualisering, undervisningsmodul, berätta för oss! Vi skulle älska att lyfta fram det.