Специалисты из университетов Пенсильвании и Нью-Йорка провели исследование с участием почти тысячи человек. Используя метод автоматического сбора данных, команда проанализировала истории их постов, а затем провела анализ их медицинских данных.
Далее исследователи создали три прогностические модели: первая анализирует только язык постов, вторая использует демографические данные, такие как возраст и пол, а третья объединяет два набора данных.
Оказалось, что все эти состояния можно выявить у человека всего лишь с помощью анализа их собственных публикаций в соцсетях. В некоторых случаях прогнозы были очевидными, например упоминания спиртных напитков и излишнее пристрастие к алкоголю. Но в ряде случаев результаты были неожиданными. Например, частота религиозных публикаций с упоминанием слов «бог», «молиться» и т.д. коррелировала с риском развития… диабета.
В общей сложности авторы рассматривали более двух десятков патологий – нарушения пищеварения, травмы, кожные заболевания, ожирение, тревожное расстройство, инфекции, передающиеся половым путем и т.д. В целом специалисты проанализировали 20 миллионов слов, составлявших почти 950 тысяч публикаций.