Dream Commons Aggregates: 月次、夢研究のためのオープンデータ

Blog Image

Dream Commons Aggregates

本日、私たちは Dream Commons Aggregates を発表します。これは The Dream Drop から派生した 月次の非識別化データセット です。各リリースは 引用可能 で、バージョン管理 されており、再現可能な 研究、教育、探索的分析のために設計されています。

コンセプト DOI (常に最新)
2025年9月リリース (バージョン DOI)


各月次リリースに含まれるもの

  • 高レベルのカウント(サンプルサイズ、エンゲージメント)。
  • ドメインごとの 特徴別分布(例:タイプ、ムード、テーマ、キャラクター、視点、時間、影響、明晰さ、繰り返し)。
  • 月ごとのデルタ(パーセンテージポイント)。
  • ストップワードフィルタリングされた用語頻度(CJK対応)。
  • ドキュメント: SCHEMA.mdQUALITY_REPORT.csvMANIFEST.jsonCHANGES.mdCITATION.txtLICENSE.txtDATA_USE.txt
  • 便利さ:JSON/Parquetミラー、再現ノートブック、および最大のポジティブ/ネガティブ動向の プレーンテキストパルスサマリー

すべてはUTF-8で、コアアーティファクトのチェックサムを使用して整合性検証と再現可能なワークフローをサポートします。


なぜこれを行うのか

このシリーズは私たちの Collective Dream Model (CDM) を実践に移します:The Dream Drop の個別ログは 成長するオープン知識ベース に寄与します。標準化された月次集計をリリースすることで、私たちは:

  • 独立した検証二次分析 の障壁を下げ、
  • クリーンでバージョン管理されたデータを用いて 教育手法開発 を支援し、
  • 時間の経過に伴う 公的記録 を保存します。

使用方法と引用

  • ライセンス: CC BY-NC 4.0(非商業)。
  • 帰属: “Root Code Collective — Dream Commons(毎月の集計リリース)”。
  • 引用: 分析する月の バージョン DOI を使用してください。一般的な指針については、引用ガイドラインをご覧ください。

クイックリンク:


プライバシーと倫理

リリースには 非識別化された集計のみ が含まれており、個人情報、生データ、行レベルデータは含まれていません。以下を遵守してください:

  • 小グループを露呈させる可能性のある詳細な内訳を避けること、
  • 再識別の試みを控えること、
  • 適切な注意書きと共に結果を報告すること。

完全なポリシーについては DATA_USE.txt をご覧ください。


月次パルス

各リリースには短い パルスサマリー が含まれ、ドメインごとの最大の ポジティブ および ネガティブ 動向が示されます(前月比)。読者が見る形式は以下の通りです:

タイプ +4.9% 標準 -3.9% ポジティブ

ムード +3.1% 敗北 -3.2% 驚き

… (完全なサマリーは pulse_movements_YYYY-MM.txt にあります)


研究者と教育者のために

  • 再現性: ノートブック (notebooks/replicate_pulse_YYYY-MM.ipynb) は迅速なチェック、ビジュアル、パルス抽出を示します。
  • 相互運用性: CSV + JSON + Parquet、明確なスキーマとコードブック付き。
  • 出所: 監査可能性のためにビルドハッシュとチェックサムが含まれています。

異なる形式や教育用の小さな便利なエクスポートが必要な場合は、メールでご連絡ください: contact@rootcodecollective.org


ロードマップ

  • パイプラインのエンドツーエンドを説明する軽量で人間が読みやすい メソッドプレプリント
  • シリーズが成熟するにつれて追加の派生テーブル(例:長期的なデルタ)。
  • コミュニティの例と教育用ノートブック。

データを取得する

倫理的でオープンアクセスの夢の研究 をサポートしていただきありがとうございます。データ、論文、ビジュアライゼーション、教育モジュールを使って何かを構築した場合は、ぜひお知らせください!私たちはそれを特集したいと思っています。