Dream Commons Aggregates
Сегодня мы запускаем Dream Commons Aggregates, ежемесячный, анонимизированный набор данных, полученный из The Dream Drop. Каждый релиз является цитируемым, версионированным и предназначен для воспроизводимых исследований, обучения и исследовательского анализа.
DOI концепции (всегда актуальный)
Релиз сентября 2025 года (DOI версии)
Что содержится в каждом ежемесячном релизе
- Общие подсчеты (размер выборки, вовлеченность).
- Распределения по признакам в различных областях (например, Тип, Настроение, Тема, Персонажи, Перспектива, Время, Влияние, Ясность, Повторяющиеся).
- Изменения по месяцам в процентных пунктах.
- Частотности терминов с фильтрацией стоп-слов (учитывающие CJK).
- Документация: SCHEMA.md, QUALITY_REPORT.csv, MANIFEST.json, CHANGES.md, CITATION.txt, LICENSE.txt, DATA_USE.txt.
- Удобство: зеркала JSON/Parquet, ноутбук для репликации и резюме в простом тексте о самых крупных положительных/отрицательных изменениях.
Все данные в кодировке UTF-8, с контрольными суммами для основных артефактов для поддержки проверки целостности и воспроизводимых рабочих процессов.
Почему мы это делаем
Эта серия реализует нашу Collective Dream Model (CDM) на практике: отдельные журналы в The Dream Drop способствуют растущей, открытой базе знаний. Выпуская стандартизированные ежемесячные агрегаты, мы:
- снижаем барьер для независимой валидации и вторичного анализа,
- поддерживаем обучение и разработку методов с чистыми, версионированными данными,
- сохраняем публичный отчет о изменениях с течением времени.
Как использовать и цитировать
- Лицензия: CC BY-NC 4.0 (некомерческая).
- Атрибуция: “Root Code Collective — Dream Commons (ежемесячный агрегат)”.
- Цитирование: Используйте DOI версии за месяц, который вы анализируете. Для общих указаний смотрите наши Руководство по цитированию.
Быстрые ссылки:
- DOI концепции (всегда актуальный): https://doi.org/10.5281/zenodo.17297159
- Набор данных за сентябрь 2025 года: https://doi.org/10.5281/zenodo.17297160
Конфиденциальность и этика
Релизы содержат только анонимизированные агрегаты, без личных, сырых или построчных данных. Пожалуйста:
- избегайте детализированных разбивок, которые могут раскрыть небольшие группы,
- воздержитесь от любых попыток повторной идентификации,
- сообщайте результаты с соответствующими оговорками.
Смотрите DATA_USE.txt для полной политики.
Ежемесячный обзор
Каждый релиз включает короткое резюме, самые крупные положительные и отрицательные изменения по областям (по сравнению с предыдущим месяцем). Вот формат, который увидят читатели:
Тип +4.9% стандарт -3.9% положительный
Настроение +3.1% побежденный -3.2% удивление
… (полное резюме в pulse_movements_YYYY-MM.txt)
Для исследователей и преподавателей
- Воспроизводимость: Ноутбук (
notebooks/replicate_pulse_YYYY-MM.ipynb) демонстрирует быстрые проверки, визуализации и извлечение пульса. - Совместимость: CSV + JSON + Parquet, с четкой схемой и кодовой книгой.
- Происхождение: Включены хэши и контрольные суммы для аудита.
Если вам нужен другой формат или небольшой удобный экспорт для обучения, напишите нам: contact@rootcodecollective.org.
Дорожная карта
- Легкий, читаемый человеком предварительный метод описывающий весь процесс от начала до конца.
- Дополнительные производные таблицы (например, дельты на более длительный срок) по мере развития серии.
- Примеры сообщества и учебные ноутбуки.
Получите данные
- Последний набор данных (DOI концепции): https://doi.org/10.5281/zenodo.17297159
- Сентябрь 2025 года (DOI версии): https://doi.org/10.5281/zenodo.17297160
Спасибо за поддержку этических, открытых исследований о мечтах. Если вы создадите что-то с использованием данных, статьи, визуализации, учебного модуля, сообщите нам! Мы будем рады это представить.