Агрегаты Dream Commons: Ежемесячные открытые данные для исследований мечты

Blog Image

Dream Commons Aggregates

Сегодня мы запускаем Dream Commons Aggregates, ежемесячный, анонимизированный набор данных, полученный из The Dream Drop. Каждый релиз является цитируемым, версионированным и предназначен для воспроизводимых исследований, обучения и исследовательского анализа.

DOI концепции (всегда актуальный)
Релиз сентября 2025 года (DOI версии)


Что содержится в каждом ежемесячном релизе

  • Общие подсчеты (размер выборки, вовлеченность).
  • Распределения по признакам в различных областях (например, Тип, Настроение, Тема, Персонажи, Перспектива, Время, Влияние, Ясность, Повторяющиеся).
  • Изменения по месяцам в процентных пунктах.
  • Частотности терминов с фильтрацией стоп-слов (учитывающие CJK).
  • Документация: SCHEMA.md, QUALITY_REPORT.csv, MANIFEST.json, CHANGES.md, CITATION.txt, LICENSE.txt, DATA_USE.txt.
  • Удобство: зеркала JSON/Parquet, ноутбук для репликации и резюме в простом тексте о самых крупных положительных/отрицательных изменениях.

Все данные в кодировке UTF-8, с контрольными суммами для основных артефактов для поддержки проверки целостности и воспроизводимых рабочих процессов.


Почему мы это делаем

Эта серия реализует нашу Collective Dream Model (CDM) на практике: отдельные журналы в The Dream Drop способствуют растущей, открытой базе знаний. Выпуская стандартизированные ежемесячные агрегаты, мы:

  • снижаем барьер для независимой валидации и вторичного анализа,
  • поддерживаем обучение и разработку методов с чистыми, версионированными данными,
  • сохраняем публичный отчет о изменениях с течением времени.

Как использовать и цитировать

  • Лицензия: CC BY-NC 4.0 (некомерческая).
  • Атрибуция: “Root Code Collective — Dream Commons (ежемесячный агрегат)”.
  • Цитирование: Используйте DOI версии за месяц, который вы анализируете. Для общих указаний смотрите наши Руководство по цитированию.

Быстрые ссылки:


Конфиденциальность и этика

Релизы содержат только анонимизированные агрегаты, без личных, сырых или построчных данных. Пожалуйста:

  • избегайте детализированных разбивок, которые могут раскрыть небольшие группы,
  • воздержитесь от любых попыток повторной идентификации,
  • сообщайте результаты с соответствующими оговорками.

Смотрите DATA_USE.txt для полной политики.


Ежемесячный обзор

Каждый релиз включает короткое резюме, самые крупные положительные и отрицательные изменения по областям (по сравнению с предыдущим месяцем). Вот формат, который увидят читатели:

Тип +4.9% стандарт -3.9% положительный

Настроение +3.1% побежденный -3.2% удивление

… (полное резюме в pulse_movements_YYYY-MM.txt)


Для исследователей и преподавателей

  • Воспроизводимость: Ноутбук (notebooks/replicate_pulse_YYYY-MM.ipynb) демонстрирует быстрые проверки, визуализации и извлечение пульса.
  • Совместимость: CSV + JSON + Parquet, с четкой схемой и кодовой книгой.
  • Происхождение: Включены хэши и контрольные суммы для аудита.

Если вам нужен другой формат или небольшой удобный экспорт для обучения, напишите нам: contact@rootcodecollective.org.


Дорожная карта

  • Легкий, читаемый человеком предварительный метод описывающий весь процесс от начала до конца.
  • Дополнительные производные таблицы (например, дельты на более длительный срок) по мере развития серии.
  • Примеры сообщества и учебные ноутбуки.

Получите данные

Спасибо за поддержку этических, открытых исследований о мечтах. Если вы создадите что-то с использованием данных, статьи, визуализации, учебного модуля, сообщите нам! Мы будем рады это представить.