- Войдите или зарегистрируйтесь, чтобы оставлять комментарии
- 33 просмотра
В рамках совместного проекта УВКБ ООН и группой ООН по инициативе «Глобальный пульс» (UN Global Pulse), изучающего настроения вокруг принудительного перемещения, использовались данные социальных сетей для сбора реакции на текущую ситуацию в режиме реального времени и лучшего понимания преимуществ больших данных. Первоначальный анализ был направлен на изучение поведения беженцев по отношению друг к другу и по отношению к поставщикам услуг в Европе. Однако из-за повышенного внимания средств массовой информации и негативных настроений в связи с террористическими нападениями на континенте исследователи решили сместить акцент и проанализировать отношения между вынужденными мигрантами и транзитными и принимающими общинами. Исследователи надеялись использовать полученные результаты для совершенствования оперативных услуг по всей Европе.
Социальные сети предоставляют уникальную возможность для анализа таких ситуаций, как миграционный кризис в Европе, при котором перемещаются большие общины, часто без их отслеживания, что препятствует традиционным методам сбора данных (например, опросам). Данные, собранные с таких платформ как Twitter или Facebook, позволяют в режиме реального времени получить представление о событиях от различных групп пользователей из разных мест. В совместном проекте использовались данные, собранные в сети Twitter, при анализе различных блоков твитов, таких как хэштеги или ключевые слова, для создания классификации. Далее система искала сообщения, содержащие идентифицированные слова или предложения, которые затем вручную кодировались исследователями. Эта так называемая «обучающая база данных» служила основой, на которой алгоритмы классифицировали новые посты, добавляя их в набор данных. Ответы распределялись по трем категориям: от ксенофобских до нейтральных и, наконец, до неактуальных.
Исследователи отметили трудности в различении акцентов и сленгов при создании запросов для системы. Учитывая, что данные содержали только выдержки, было трудно идентифицировать человека, стоящего за твитом. Кроме того, как оказалось, существует некоторая несогласованность в отношении языков, например, система не была настроена на фарси, поскольку была получена только небольшая выборка. Поэтому, несмотря на то, что исследование и позволило по-новому взглянуть на анализ больших данных применительно к гуманитарным вопросам, проект одновременно выявил и некоторые важные ограничения и проблемы, связанные с таким анализом. Важно помнить, что, хотя социальные сети имеют большое методологическое преимущество в сочетании с традиционными источниками данных, они, тем не менее, могут давать полную картину сами по себе.
Подготовлено Фанни Ковесди для «Платформы по защите детей в Юго-Восточной Европе» в марте 2018.