梦境共享聚合:每月开放数据用于梦境研究

Blog Image

梦想共享聚合

今天我们推出了 梦想共享聚合,这是一个 每月、去标识化 的数据集,源自 The Dream Drop。每次发布都是 可引用的版本化的,旨在支持 可重复 的研究、教学和探索性分析。

概念 DOI(始终最新)
2025年9月发布(版本 DOI)


每月发布的内容

  • 高层次计数(样本大小,参与度)。
  • 按特征分布 跨域(例如,类型、情绪、主题、角色、视角、时间、影响、清晰度、重复)。
  • 月度变化百分比点
  • 停用词过滤的术语频率(支持CJK)。
  • 文档:SCHEMA.mdQUALITY_REPORT.csvMANIFEST.jsonCHANGES.mdCITATION.txtLICENSE.txtDATA_USE.txt
  • 便利性:JSON/Parquet 镜像,一个 复制笔记本,以及一个 纯文本脉动摘要,显示最大的正/负变化。

所有内容均为 UTF-8,核心工件有校验和以支持完整性验证和可重复工作流程。


我们为什么要这样做

这一系列将我们的 Collective Dream Model (CDM) 付诸实践:The Dream Drop 中的个体日志贡献于一个 不断增长的开放知识库。通过发布标准化的每月聚合,我们:

  • 降低 独立验证二次分析 的门槛,
  • 通过干净、版本化的数据支持 教学方法开发
  • 保留一个 公共记录,记录随时间的变化。

如何使用和引用

  • 许可证: CC BY-NC 4.0(非商业)。
  • 归属: “Root Code Collective — 梦想共享(每月聚合发布)”。
  • 引用: 使用您分析的月份的 版本 DOI。有关一般指引,请参见我们的 引用指南

快速链接:


隐私与伦理

发布内容仅包含 去标识化的聚合,没有个人、原始或行级数据。请:

  • 避免可能暴露小组的细粒度细分,
  • 避免任何重新识别尝试,
  • 以适当的警告报告结果。

请参见 DATA_USE.txt 获取完整政策。


每月脉动

每次发布包括一个简短的 脉动摘要,按领域显示最大的 变化(与上个月相比)。以下是读者将看到的格式:

类型 +4.9% 标准 -3.9% 正面

情绪 +3.1% 被击败 -3.2% 惊讶

…(完整摘要在 pulse_movements_YYYY-MM.txt 中)


面向研究人员和教育工作者

  • 可重复性: 一个笔记本 (notebooks/replicate_pulse_YYYY-MM.ipynb) 展示快速检查、可视化和脉动提取。
  • 互操作性: CSV + JSON + Parquet,具有清晰的模式和代码手册。
  • 来源: 包含构建哈希和校验和以供审计。

如果您需要不同格式或小型便利导出用于教学,请发送电子邮件给我们: contact@rootcodecollective.org


路线图

  • 轻量级、易读的 方法预印本 描述整个流程。
  • 随着系列的发展,提供额外的派生表(例如,长期变化)。
  • 社区示例和教学笔记本。

获取数据

感谢您支持 伦理、开放获取的梦想研究。如果您使用这些数据构建了某些内容、论文、可视化、教学模块,请告诉我们!我们很乐意展示它。