Мы даже не представляем, какие «следы» оставляем ежедневно в интернете и в социальных сетях в частности. Интересуются ими не только хакеры, но и ученые. Для них эта информация — Big Data, большие данные. Анализ этих может, например, с высокой точностью подобрать специальность на основе лайков, или по активности в соцсети вычислить экстремистские сообщества. Об этом мы поговорили с заведующим лабораторией наук о больших данных и проблем общества Томского госуниверситета Вячеславом Гойко. Подробнее — в подкасте Томск.ру.
«Четкого определения Big Data — не существует. Данные должны быть большими, необходима высокая скорость обработки этих данных и данные разнообразные и структурированные. Есть еще шутливое определение. Если Ecxel не открывает табличку с данными, то это уже большие данные. Один из самых ярких примеров- это анализ данных из социальных сетей. Два года назад в университете была создана наша лаборатория. Разношерстной команде удалось за это время решить довольно много интересных задач. Например, одной из задач является нахождение университетом своего абитуриента. Проблема в том, что мы очень о них знаем. Только средний балл ЕГЭ, некоторую информацию из его аттестата и его анкеты. Но в то же время абитуриенты проводят огромное количество времени в социальных сетях. И мы решили взять цифровые следы. Этим занимается мой коллега. После этого мы построим модель прогнозирования некоторых типов одаренности и образовательных интересов. Для привлечения ребят на определенные программы ученые используют информацию из профиля абитуриента. Всем интересно, как работать с абитуриентами, как работать со студентами и как работать с выпускниками».