Визуализация и работа с историческими данными: интерактивные карты и linked data базы знаний для изучения истории
Порой глянешь по сторонам и кажется, что современного мира вне IT не существует. Однако есть области человеческой жизни, очень слабо затронутые компьютеризацией. Одна из таких областей — история. И как наука, и как учебный курс. Конечно, работа за компьютером едва ли когда-то заменит историкам ковыряние в архивах. Но уж изучать историю по нарисованным в учебнике статическим картам, а порядок событий выстраивать, тщательно выписывая на бумажку даты в порядке возрастания — это точно прошлый век. Однако инструментов для наглядного изучения истории не так-то много и найти их очень непросто.
Если вы хотите узнать, какие есть интерактивные исторические карты, где стоит посмотреть на представление событий в форме таймлайнов и как делать сложные запросы к википедии типа «все государственные деятели, работавшие в Европе в 1725 году» — читайте дальше.
С чего все началось: на летней школе мы взялись делать интерактивную карту исторических событий на базе википедии. Я не даю прямую ссылку на проект, поскольку проект очень сырой (над ним работала команда из 4 прекрасных десятиклассников, но много ли успеешь за 3 недели), а еще потому что сервер имеет обыкновение «падать» и без хабраэффекта. Нам хотелось на карте отобразить события, происходившие в разные исторические эпохи — и это отчасти получилось: у нас есть карта битв с их описаниями. На тот момент, когда мы занимались этим проектом, мы знали лишь про пару интерактивных исторических атласов, и ни один из них не показывал на карте события.
Я полагаю, что этих карт так мало потому что все сталкиваются с теми же проблемами, что и мы: исторические данные не структурированы. Нет машиночитаемых баз данных, откуда можно выгрузить информацию о важных исторических событиях. Историки, если и заводят базы данных, описывают в них, как правило, лишь свою узкую предметную область — типа карты укреплений Римской империи. Это может быть интересно и полезно историкам, но вряд ли простые люди могут извлечь из такой карты для себя много пользы. Вторая проблема — полное отсутствие данных про границы стран в исторической перспективе. Вы можете найти сотни атласов древних эпох, но координаты границ вам придется переносить с атласов вручную. Третья проблема — отсутствие каких-либо стандартов описания исторических данных. Даже нормального формата описания даты не существует, стандартные типы данных и форматы ломаются о годы до нашей эры. Что уж говорить про разные календари или неточно определенные даты.
Проблемы недостатка машиночитаемых исторических данных еще ждут своего решения (мы работаем над этим, присоединяйтесь, работы на всех хватит). Но все же некоторые проекты по своему справляются с этим…
Как гласит народная мудрость: «После того, как вы сломали прибор, изучите инструкцию». Уже после того как мы сделали свою карту, мне удалось найти несколько других проектов с интерактивными картами и другими способами визуализировать историю и добывать исторические данные. Но на то, чтобы откопать эти ресурсы в недрах интернета мне понадобилась какое-то совершенно неприличное количество времени, поэтому я решил собрать всё, что нашел, в одном месте.
Первая категория — интерактивные исторические карты. Это не карты моей мечты, но вполне рабочие продукты. Их довольно много (и я не перечисляю тут еще совсем узкоспециализированные), но действительно хороших среди них всего пара, увы. Отдельно печалит, что среди них нет локализованных проектов, а значит по ним тяжело учить русскоязычных школьников.
-
Самая няшная карта, да еще и имеющая очень широкие возможностями для визуализации — это Chronas. Она сложновата для того, чтобы изучить её самостоятельно, поэтому посмотрите видео-ролик про её возможности. Это красиво и сильно. На карте отмечены исторические события разных типов со вспомогательной информацией, что позволяет знакомиться с историей, не отрываясь от карты.
Информация на карте добыта в том числе из википедии и викиданных. Исторически карта неточна, о чем сообщают многие пользователи, знакомые с историей Китая. Но в проекте присутствуют зачатки вики-редактирования карт, так что когда-нибудь ошибки будут исправлены.
Из вводного видео можно также узнать об довольно широких возможностях визуализации статистической информации (типа населенности, исповедуемых религий итп) о разных эпохах. Не все из этих визуализаций просты и наглядны, но сама возможность так делать — это здорово.
-
Исторические таймлайны на Histropedia. Я не очень люблю такой стиль представления данных, как ось времени, но а) за неимением лучших средств визуализации, можно и ими пользоваться, б) эти таймлайны действительно хорошо сделаны и удобны, в) эти таймлайны можно редактировать, а также создавать собственные, г) можно создавать таймлайны не руками, а запросом к викиданным, д) довольно много таймлайнов уже сделано за вас, и их приятно изучать.
— карта с геотэгированными вики-статьями про эти места. Предполагается, что она используется для достопримечательностей, но в википедии есть статьи чуть ли не о каждой улице Москвы и о каждой станции метрополитена — так что я вижу вокруг себя довольно бытовой список «достопримечательностей». На вышеупомянутом Chronoas'е, кстати, на карте тоже есть фотки, каким-то образом отнесенные к месту-времени. Отнесение ко времени, впрочем, довольно условное: сколько этому фотографированию лет.
Технологию семантических сетей берут на вооружение все крупные поисковые и информационные системы. В частности, сейчас многие учатся переводить естественный язык в формализованные запросы такому графу. Наверняка следственные органы и разведывательные службы пользуются этим (учитывая, что один из самых популярных графов знаний делается по CIA Factbook). Можно придумать миллион способов использовать эту технологию в любой аналитической работе: для государства, для бизнеса, для науки и даже для планирования домашнего хозяйства.
Может через несколько лет поисковые системы и научатся расшифровывать часть ваших вопросов на естественном языке и отвечать на них. Но вы сами можете воспользоваться всей мощью этого инструмента уже сейчас и получить куда большую гибкость, чем вам даст любой поисковик. Итак, учебные материалы:
-
Есть отличнейший туториал «Using SPARQL to access Linked Open Data» (на сайте The Programming Historian) о том, что такое linked data, и зачем они нужны. Я считаю, что каждый образованный человек должен выучить основы SPARQL, так же как каждый человек должен уметь гуглить. Это буквально про то, как строить сложные и мощные поисковые запросы (см. примеры ниже). Пусть вы не будете пользоваться этим каждый день, но когда придёт очередная задача по поиску и анализу информации, требующая месяца ручной работы, вы будете знать, как этого избежать.
Скажу честно, несмотря на хорошую подачу, материал всё равно довольно сложный: формат данных RDF, онтологии и язык запросов SPARQL. Пока я не нашел эту статью, я мог только восхищаться тому, как круто люди им пользуются, но вообще не понимал как это заставить работать. The Programming Historian дает сложный материал на очень понятных примерах и показывает, как этим пользоваться.
Их сайт, кстати, небезынтересен уже своим названием. Они учат историков пользоваться вычислительными инструментами и программированием для исследований. Потому что капелька программирования любую работу делает проще.
upd: Вспомнил и добавил еще две карты про историю урбанизации и развития человечества. И еще одну совсем простенькую карту, сделанную руками.