梦想共享聚合
今天我们推出了 梦想共享聚合,这是一个 每月、去标识化 的数据集,源自 The Dream Drop。每次发布都是 可引用的、版本化的,旨在支持 可重复 的研究、教学和探索性分析。
概念 DOI(始终最新)
2025年9月发布(版本 DOI)
每月发布的内容
- 高层次计数(样本大小,参与度)。
- 按特征分布 跨域(例如,类型、情绪、主题、角色、视角、时间、影响、清晰度、重复)。
- 月度变化 的 百分比点。
- 停用词过滤的术语频率(支持CJK)。
- 文档:SCHEMA.md、QUALITY_REPORT.csv、MANIFEST.json、CHANGES.md、CITATION.txt、LICENSE.txt、DATA_USE.txt。
- 便利性:JSON/Parquet 镜像,一个 复制笔记本,以及一个 纯文本脉动摘要,显示最大的正/负变化。
所有内容均为 UTF-8,核心工件有校验和以支持完整性验证和可重复工作流程。
我们为什么要这样做
这一系列将我们的 Collective Dream Model (CDM) 付诸实践:The Dream Drop 中的个体日志贡献于一个 不断增长的开放知识库。通过发布标准化的每月聚合,我们:
- 降低 独立验证 和 二次分析 的门槛,
- 通过干净、版本化的数据支持 教学 和 方法开发,
- 保留一个 公共记录,记录随时间的变化。
如何使用和引用
- 许可证: CC BY-NC 4.0(非商业)。
- 归属: “Root Code Collective — 梦想共享(每月聚合发布)”。
- 引用: 使用您分析的月份的 版本 DOI。有关一般指引,请参见我们的 引用指南。
快速链接:
- 概念 DOI(始终最新): https://doi.org/10.5281/zenodo.17297159
- 2025年9月数据集: https://doi.org/10.5281/zenodo.17297160
隐私与伦理
发布内容仅包含 去标识化的聚合,没有个人、原始或行级数据。请:
- 避免可能暴露小组的细粒度细分,
- 避免任何重新识别尝试,
- 以适当的警告报告结果。
请参见 DATA_USE.txt 获取完整政策。
每月脉动
每次发布包括一个简短的 脉动摘要,按领域显示最大的 正 和 负 变化(与上个月相比)。以下是读者将看到的格式:
类型 +4.9% 标准 -3.9% 正面
情绪 +3.1% 被击败 -3.2% 惊讶
…(完整摘要在 pulse_movements_YYYY-MM.txt 中)
面向研究人员和教育工作者
- 可重复性: 一个笔记本 (
notebooks/replicate_pulse_YYYY-MM.ipynb) 展示快速检查、可视化和脉动提取。 - 互操作性: CSV + JSON + Parquet,具有清晰的模式和代码手册。
- 来源: 包含构建哈希和校验和以供审计。
如果您需要不同格式或小型便利导出用于教学,请发送电子邮件给我们: contact@rootcodecollective.org。
路线图
- 轻量级、易读的 方法预印本 描述整个流程。
- 随着系列的发展,提供额外的派生表(例如,长期变化)。
- 社区示例和教学笔记本。
获取数据
- 最新数据集(概念 DOI): https://doi.org/10.5281/zenodo.17297159
- 2025年9月(版本 DOI): https://doi.org/10.5281/zenodo.17297160
感谢您支持 伦理、开放获取的梦想研究。如果您使用这些数据构建了某些内容、论文、可视化、教学模块,请告诉我们!我们很乐意展示它。