Что такое дата журналистика

Что такое дата-журналистика и чем она может помочь любой редакции

Что такое дата журналистика. Смотреть фото Что такое дата журналистика. Смотреть картинку Что такое дата журналистика. Картинка про Что такое дата журналистика. Фото Что такое дата журналистика

Современный журналист должен уметь все, даже программировать. При этом «Новая газета» — пока единственное российское СМИ, в котором у дата-журналистов есть собственный отдел. ЖУРНАЛИСТ узнал у корреспондента отдела Алеси Мароховской, что такое дата-журналистика и чем она может помочь любой редакции.

— Как в «Новой газете» появился дата‑отдел?

— Он возник чуть больше года назад. Инициатива исходила от издателя «Новой» Дмитрия Муратова, а еще от нескольких корреспондентов и редакторов отдела расследований. «Новая газета» устроила хакатон (это такие посиделки для программистов. — ЖУРНАЛИСТ ) по дата-журналистике, чтобы присмотреть себе кадры. Присмотрели — и запустили дата-отдел, который возглавил Андрей Заякин, сооснователь «Диссернета» — сообщества, которое выявляет плагиат в научных работах. Сейчас в составе три корреспондента: Ирина Долинина, Артем Щенников и я.

— Как распределяете обязанности?

— Все делают всё: кодят (программируют. — ЖУРНАЛИСТ ), собирают данные, визуализируют. Кто-то может сделать готовый визуал, кто-то — черновик, который потом отдаст дизайнеру. Хоть Андрей Заякин и руководитель отдела, сам он не программирует, хотя вроде и умеет, данные не собирает, а выступает в роли аналитика. Мы с Ириной чаще работаем вдвоем, а если нам вдруг покажется, что собственных аналитических навыков недостаточно, можем пойти к Андрею.

Корреспондентам не нужно постоянно быть в редакции — кодить можно и из дома, а вот редактор отдела расследований Роман Шлейнов и Андрей Заякин должны ходить на планерки каждый день. Если появляется задача из текучки, которую можно рассказать с точки зрения данных, — редакция подключает к работе дата-отдел. А в обычное время занимаемся большими расследованиями, потому что мы — часть одноименного отдела.

— Почему дата‑журналистика часто идет рядом с расследовательской?

— Именно в расследованиях мы чаще всего имеем дело с данными. По крайней мере, такой была логика редакции, и она мне очень нравится: умение пользоваться данными может сделать расследование качественнее. Но мы не зацикливаемся на этом формате — есть и материалы о культуре, например, о дискриминации на «Оскаре».

Что такое дата журналистика. Смотреть фото Что такое дата журналистика. Смотреть картинку Что такое дата журналистика. Картинка про Что такое дата журналистика. Фото Что такое дата журналистика

— Изначально он вообще предназначался для освещения новостей хакатона для его участников. Мы поняли, что там собрались люди, заинтересованные в данных, и сказали, что переделываем этот канал в дата-блог. Хотим рассказывать и о других дата-историях.

— Раньше «Новой» была не нужна журналистика данных, раз отдел открыли только сейчас?

— Западные СМИ уже давно поняли, что в данных есть много историй. А специалисты без навыков программирования, анализа и визуализации данных рассказать их уже не могут. Для этого нужны специальные люди — дата-журналисты. Вот редакция и решила, что пора обзавестись собственным отделом. К тому же «Новая» стала первым и до сих пор единственным из всех российских СМИ, кто решил целый отдел посвятить исключительно этому виду журналистики. Хотя, когда я стажировалась, помогала отделу расследований с технической стороны — работала с данными. Поэтому дата-журналистика начала появляться в «Новой» еще за год до создания отдела.

— Мне кажется, как раз в это время стала активно обсуждаться дата-журналистика. В Вышке (Высшей школе экономики. — ЖУРНАЛИСТ ) появилась магистерская программа по этому направлению, многие корреспонденты «Новой» начали интересоваться тем, как это работает, все стали спрашивать: что это, без этого никуда?

— Что важнее: текст или его упаковка?

— Все очень важно. Мы боремся за то, чтобы наш материал выглядел красиво. Кого-то вполне может устроить кривой график из Excel (и подобные у нас, к сожалению, тоже выходят, когда совсем нет времени). Например, нашему редактору Андрею главное, чтобы было понятно. Но он физик с образованием, и понятно ему намного больше, чем обычным людям. Так что стараемся оформлять материалы так, чтобы человек не сидел три часа над графиком и пытался разобраться. Нужно, чтобы читатели увидели историю в каждой части проекта.

— Внезапно. Мы попали на лекцию, на которой рассказывали о том, как отслеживать самолеты. Есть, оказывается, база данных, которую можно посмотреть и узнать, кто, куда и как летает. Первой идеей было проверить Пригожина. Он ведь отрицал связь с тем, что происходит в Африке и Сирии. Его дочь выкладывала в Instagram посты с этим самолетом, и еще один источник поделился с нами фотографиями, так что мы точно знали, что не ошиблись.

Что такое дата журналистика. Смотреть фото Что такое дата журналистика. Смотреть картинку Что такое дата журналистика. Картинка про Что такое дата журналистика. Фото Что такое дата журналистика

Проверили по базе и выяснили, что Пригожин действительно летает на нем в Сирию и Африку. Возникает вопрос: раз ты позиционируешь себя как обычный бизнесмен, почему выбираешь такие опасные места для путешествий?

Что такое дата журналистика. Смотреть фото Что такое дата журналистика. Смотреть картинку Что такое дата журналистика. Картинка про Что такое дата журналистика. Фото Что такое дата журналистика

Если открыть FlightRadar в режиме онлайн и посмотреть, сколько самолетов пролетает над Сирией, поймете, что очень мало авиакомпаний так рискует. Евгений Викторович Пригожин идет на этот риск, хотя все отрицает. Вот вам и история.

Что такое дата журналистика. Смотреть фото Что такое дата журналистика. Смотреть картинку Что такое дата журналистика. Картинка про Что такое дата журналистика. Фото Что такое дата журналистика

— Не боитесь писать о таких людях?

— Перед выпуском расследования о Пригожине мы отправили ему письмо со всеми вопросами, которые должны были задать. Он ответил нам не очень приятной фразой вроде «не суйте свой нос туда, куда собака *** не сует». Прозрачный такой намек, но это единственная угроза, которая в наш адрес поступала.

Какая-то доля страха — это нормально, так и должно быть. Но у меня нет паники, когда я думаю, что вот сейчас выпущу и что-нибудь сразу случится. Всегда держу в уме, что эти люди опасны и могут сделать что-то плохое, поэтому соблюдаю меры безопасности.

1. Двухфакторная аутентификация, не привязанная к телефону. Часто любят взламывать аккаунты журналистов в соцсетях и либо получать оттуда информацию, либо компрометировать хозяина страницы и писать другим сообщения от его имени.

2. Менеджер паролей. Проще завести такой и помнить один большой пароль от него, а внутри будут лежать сложные сгенерированные пароли, которые не нужно запоминать. Поэтому если меня, грубо говоря, начнут пытать, я не смогу назвать пароли от соцсетей, потому что не знаю их.

3. Знать, что делать во время слежки. Чаще всего перед тем, как сделать журналисту что-то плохое, за ним организуют слежку. О том, как вести себя, определить, правда ли за вами следят, есть лекции. Первый человек, которому нужно рассказать об этом, — твой редактор и главред. Не нужно бояться выглядеть параноиком. Старайтесь не ходить поздно. Некоторые мои коллеги вообще возвращаются домой разными путями, хотя я в этом вижу мало смысла — обычно журналистов убивали в подъезде их дома, перемены дороги от этого не спасут.

— Когда вы начали заниматься дата‑журналистикой?

— Я оканчивала бакалавриат факультета журналистики в ВШЭ и думала, на какую бы программу в магистратуре подать документы. Хотелось чего-то совсем нового, а тут как раз открывалась журналистика данных, про которую не знала вообще ничего. Сначала было ужасно скучно, хотела даже уйти, а потом попала на лекцию Transparency International. На ней Антон Поминов и Илья Шуманов, генеральный директор и его заместитель, вышли в зал и сказали: «Помните расследование Навального и «Новой газеты» про Чайку? Хотите, объясним, как такое получилось?»

Для всех студентов оно было каким-то магическим — там упоминались всевозможные документы, данные, непонятно откуда взятые. И нам рассказали, где эти данные найти, что на самом деле многие из них доступны, а мы просто об этом не знаем, что куча историй лежит на поверхности. Сразу после лекции подошла к ним и попросилась на стажировку, мне дали визитку.

— Я тогда училась с Ирой Долининой, с которой теперь работаю, и когда нужно было проходить преддипломную практику, мы с ней отправили туда свои резюме. Мое было совершенно дурацким — зачем-то написала, что играю на гитаре. Спустя какое-то время мы вместе с Ильей Шумановым смеялись над этим — прислали какую-то тупость, а нас все равно приняли, но он сказал: «Таких у нас еще не было, вот и решили попробовать». На стажировке нам сразу же доверили масштабную работу с данными — провести расследование, которое потом вышло на «Медузе». Для студентов это был успех.

— К моменту стажировки нужно было уметь программировать?

— Нет, тогда это еще не требовалось. Уже потом поняла, что с помощью кодинга мы могли бы облегчить себе работу в несколько сотен раз. Например, вместо того чтобы тратить столько времени на получение выписки из Росреестра в читаемом виде, можно было воспользоваться скриптом. Тогда мы все делали руками, поступили на программу с нулевыми знаниями в программировании, но преподаватель на первом же занятии сказал, что может научить программировать даже табуретку.

— Чем дата‑журналист отличается от обычного?

— Только навыком сбора, обработки и анализа данных. Нас, как первых выпускников магистерской программы, часто зовут сделать motivational speech (мотивационное выступление). И я чаще всего говорю, что дата-журналистика — такая же журналистика, только в ней общаются не с людьми, а с данными. Представьте, что это тот же герой, которому вы задаете вопросы, хотите узнать его историю. А для того, чтобы общаться с данными, нужно знать их язык. И обычно это язык программирования python. Других отличий нет.

— Журналистика данных — это больше о журналистике или все‑таки о программировании?

— Это связанные вещи. Как можно сказать, чего больше в интервьюировании — журналистики или задавания вопросов? Для истории вы собираете данные или анализируете уже готовую информацию. А чтобы это сделать, нужно написать код — потратить время на программирование, а потом уже с результатом работать как журналист.

— Как дата‑журналист работает с сайтами?

Источник

Дата-журналистика: как рассказать историю, используя открытые данные и графический дизайн

За последние десять лет у журналистов-расследователей появились новые инструменты и возможности. Во всех крупных мировых СМИ стали появляться визуализации, основанные на анализе открытых данных. Такие материалы вызывают общественный резонанс, а их авторы становятся лауреатами Пулитцеровской премии. Вскоре дата-журналистика стала настолько самостоятельным жанром, что для работ в ее области была создана специальная премия — Data Journalism Awards.

Журналистика данных — это новый междисциплинарный метод сторителлинга, основывающийсяанный на работе с открытыми данными, статистикой, аналитикой, информатикой и дизайном. Развитие Иинтернета и технологий позволило использовать его как дополнение или даже альтернативу традиционным журналистским расследованиям. После того как в сети появился большой массив открытых данных, непосредственная коммуникация с источниками информации стала далеко не единственным способом изучения и описания реальности. Расследования нового формата стали строиться на сборе и анализе сухих данных, которые впоследствии превращались в яркую интерактивную визуализацию, доносящую сложную информацию до читателя легко и убедительно. Постепенно отделы, специализирующиеся на дата-журналистике, появились во многих крупных мировых СМИ, например,: в The Guardian, The New York Times, BBC, Reuters, Bloomberg, The Washington Post, The Wall Street Journal и других. Американское интернет-издание FiveThirtyEight и британско-русский ресурс Bellingcat публикуют расследования, основанные исключительно на методе анализа данных из открытых источников.

Одним из главных преимуществ дата-журналистики считается достоверность полученной информации: вероятность того, что история, основанная на комментариях интервьюируемых, объективна, всегда меньше, чем у историяи, воссозданнаяой с помощью качественно проанализированных данных. Статистика помогает проверить слухи и сплетни.

В The Washington Post появилась серия историй о проблемах бездомных. Материал, опубликованный в The Guardian рассказывает о новых подробностях дела Эдварда Сноудена. Журналисты Istories узнали о реальных масштабах разлива нефтепродуктов в России. РБК сделал материал о регионах, где от ВИЧ умирают чаще, чем от убийств, суицида и ДТП вместе взятых.

Работа с big data становится единственным инструментом, позволяющим объяснить происходящее, когда ответов на вопросы не дает никто. Так, вВ начале пандемии, когда весь мир оказался в условиях карантина (и онлайна), визуализация данных, рассказывающая о распространении вируса и количестве заболевших, появилась на сайтах многих зарубежных изданий. Журналисты The Telegraph предложили своим читателям инструмент, измеряющий количество зараженных коронавирусом в ближайшей к ним локации с помощью почтового индекса. В The Washington Post выпустили материал, наглядно показывающий механику распространения инфекций в целом.

Журналисты The New York Times создали интерактивную карту, которая показывает, как коронавирус распространялся по миру. «Медиазона» подсчитала, сколько медицинских сотрудников стали жертвами вируса в России.

Для работы с big data не обязательно быть программистом или аналитиком — достаточно увидеть проблему в сухих данных и превратить ее в историю для публикации. Создание дата-материала состоит из разработки темы и гипотезы, поиска данных, их извлечения (скрейпинга), анализа и визуализации. Каждый этап предполагает владение специальными инструментами.

За последние несколько лет в России появились образовательные проекты, где можно научиться работать с данными, заниматься их парсингом, анализом и очисткой, а также собирать на их основе истории. Первая и пока единственная в России двухлетняя магистерская программа по направлению «Журналистика данных» есть в ВШЭ. Существуют и обучающие интенсивы. В 2019 году «Яндекс.Практикум» запустил шестимесячный курс «Дата-аналитика». В этом же году журнал Strelka Mag совместно с ведущими дата-журналистами России открыл ежегодную школу дата-журналистики. Третий интенсив пройдет с 8 по 25 апреля. Преподавать в школе будут Андрей Дорожный, Дада Линделл и Александр Богачев.

Источник

Дата-журналист: кто это и почему его работа так востребована

Что такое дата журналистика. Смотреть фото Что такое дата журналистика. Смотреть картинку Что такое дата журналистика. Картинка про Что такое дата журналистика. Фото Что такое дата журналистика

Кто такой дата-журналист

Дата-журналист — это специалист, который собирает и анализирует большие данные, чтобы на их основе писать новости и статьи. Дата-журналист ищет их в публичных отчетах государственных служб и некоммерческих организаций, в статистике частных сервисов и аналитических агентств, изучает базы данных и другие источники.

Задача дата-журналиста — изучить данные и наглядно их представить: в виде графиков, таблиц или отдельных веб-страниц, которые поймет его аудитория. То есть дата-журналист переводит массивные данные, в которых могут разобраться только специалисты, в понятные форматы для обычных читателей.

Например, в начале пандемии коронавируса The Washington Post выпустила статью с симулятором распространения SARS-Cov-2 и объяснением, почему важна социальная дистанция [1].

В 2019 году Strelka Mag выпустила исследование по Красной площади в Москве и добавила к нему анализ фотографий, опубликованных в открытом доступе [2]:

Что такое дата журналистика. Смотреть фото Что такое дата журналистика. Смотреть картинку Что такое дата журналистика. Картинка про Что такое дата журналистика. Фото Что такое дата журналистика

Тренды и направления профессии

Работа с Big Data и ее визуализация — тренд, который не утихает с середины 2000-х годов, и вряд ли утихнет в ближайшем будущем [3]. Этому способствует и цифровой формат СМИ, и распространение программного обеспечения с открытым исходным кодом, и сама концепция «открытых данных», когда информация от госорганов и компаний публикуется в интернете в открытом доступе.

Поэтому специалисты с навыками дата-журналистов требуются не только в медиа, но также в госструктурах, финансах, банках, аналитических агентствах — везде, где нужно работать с данными и представлять их в наглядном виде.

Меняется также и содержание работы дата-журналиста. Как пишет Ник Ньюман из Института исследования журналистики Reuters, журналистика данных ищет новые способы представления информации. К примеру, многие европейские и американские издания визуализируют данные в формате сторис для социальных сетей [4]. Например, само агентство Reuters использует инфографику в Instagram, чтобы подвести читателя к полному тексту статьи о рынке рождественских елей в США [5]:

Что такое дата журналистика. Смотреть фото Что такое дата журналистика. Смотреть картинку Что такое дата журналистика. Картинка про Что такое дата журналистика. Фото Что такое дата журналистика

Еще один тренд — персонификация материалов. Когда мы публикуем информацию о своем возрасте, поле, социальном статусе, нейросети замечают это и подстраиваются под наши интересы. Например, YouTube рекомендует видео, опираясь на то, что и как долго вы уже смотрели. С дата-материалами произойдет то же самое: детям, профессиональным юристам или родителям будут показываться свои версии статей.

Откуда придет профессия

Профессия дата-журналиста находится на стыке гуманитарного и технического знания, поэтому из существующих профессий в нее можно прийти двумя путями. Во-первых, такими специалистами могут стать профессиональные журналисты, если изучат программы для сбора и анализа данных. Во-вторых, сюда могут перейти аналитики данных, которые научатся работать с текстом, изучат приемы повествования и редактуры.

Ключевые навыки дата-журналиста

В первую очередь — это умение выстраивать логичное повествование, увлекающее читателя. Для этого понадобятся навыки писательского мастерства, сторителлинга.

«Меня в слове «дата-журналистика» смущает «журналистика». Я предпочитаю говорить о дата-сторителлинге. Чаще всего компании хотят нанять не столько дата-журналистов, сколько специалистов с навыком объяснения того, что происходит в данных. Их много, и дата-сайентистов тоже — их регулярно поставляют онлайн-школы, университеты. Зато людей, которые нормально бы написали и — главное — сделали выводы из данных, мало», — отмечает Андрей Дорожный, дата-журналист и специалист по визуализации данных, старший преподаватель факультета медиакоммуникаций НИУ ВШЭ.

Дата-журналисту необходимо освоить методы работы с информацией в интернете: речь идет о ее поиске, обработке и проверке. Полезными будут знания картографии и того, откуда и как получать данные для анализа. Не обойтись и без навыков работы с базами данных и программами вроде Excel, Tableau, а также языка Python и его библиотек: Seaborn, pandas, SkLearn.

Как стать дата-журналистом

Дата-журналистике в России можно учиться в разных форматах. Очный доступен в НИУ ВШЭ на двухгодичной магистерской программе «Журналистика данных» [6]. Или на курсе от Института медиа, архитектуры и дизайна «Стрелка» [7], который идет раз в год и длится около месяца.

В онлайне можно получить профессию дата-журналиста за десять месяцев в «Нетологии» [8] или познать азы на онлайн-курсе от Иллинойского университета в Урбане-Шампейне на Coursera [9].

Зарплата дата-журналиста зависит от места работы и навыков специалиста, однако она выше обычного за счет навыка обработки данных. В регионах дата-журналист получает в среднем ₽20–60 тыс., в Москве — до ₽130 тыс. [10].

По словам Дорожного, никто из потенциальных заказчиков не откажется от контента, основанного на данных, поэтому его заказчиками могут быть и СМИ, и бизнес, и госструктуры. «Но в последних двух больше денег, и они могут себе позволить таких специалистов чаще, чем СМИ», — отметил он.

Источник

Что такое журналистика данных

За последние годы в открытом доступе накопилось столько данных, что понадобились специалисты, которые смогли бы из этого массива извлечь полезную информацию и представить ее в удобном виде. Этих специалистов стали называть дата-журналистами, а их направление работы – журналистикой данных. Разбираемся, что это такое и зачем нужно.

Что такое журналистика данных

Любой журналистский материал должен опираться на факты и доказательства: официальную статистику, финансовые отчеты, исследования, законодательство. Иначе он превратится в личное суждение автора, которое можно оспорить. Пользы от такого материала не будет.

Тем не менее, людей больше интересует не сам факт, а объяснение его значимости – как определенное событие повлияет на их жизнь. Они не хотят читать «сухие» отчеты госорганов, сравнивать прибыль компаний и самостоятельно разбираться в строительных нормативах. Аудитории нужен материал, где информация структурирована и написана на понятном языке. Для этого и существует data-журналистика.

Неважно, работает специалист с тысячами документов или с 20-30 источниками – любая работа с информацией считается журналистикой данных. А вот под журналистикой больших данных уже понимают обработку серьезных массивов информации.

Главное отличие от классической журналистики здесь в навыках, которые нужны специалисту, чтобы работать с большим объемом данных. Для сбора информации из тысяч документов потребуется знание языка программирования. Для сбора результатов в увлекательной форме без специальных сервисов тоже не обойтись.

Провести четкую границу между дата-журналистикой и классической журналистикой довольно сложно. Это не отдельная профессия, а набор дополнительных навыков для работы с данными. С развитием технологий ее выделили как отдельное направление, хотя по факту этим занимались и раньше, просто без автоматизации.

Обычно к сбору информации журналисты приступают, когда уже известна тема материала. Есть и обратный вариант, когда интересная идея рождается при изучении данных. Например, зная статистику по ДТП, можно сделать интерактивную карту города с обозначением наиболее аварийных участков дороги.

Само понятие «data-журналистика» как отдельное направление возникло в 2010 году на международной конференции в Амстердаме.

Издания работали с массивами данных и раньше. Например, британская газета Guardian еще в 1821 году опубликовала список школ в Манчестере, собранный по количеству учеников и стоимости обучения. Журналисты хотели определить, сколько детей получают бесплатное образование. Для этого опросили более 10 тыс. человек, а полученные результаты представили в формате таблицы.

Журналистикой данных занимаются не только новостные СМИ, но и редакции отраслевых журналов, корпоративных блогов, исследовательских бюро. В крупных изданиях над проектом работает целая команда data-журналистов. В компаниях поменьше сбором, анализом и визуализацией данных часто занимается 1 специалист.

Дата-журналистика – это в первую очередь набор навыков, а не отдельная профессия. От классической журналистики она принципиально отличается тем, что работа над материалом опирается не на отдельные документы, а на большие массивы информации.

В мире каждую секунду генерируется огромное количество информации. Если раньше журналисту достаточно было изучить 2-3 источника, то теперь их могут быть тысячи. Чтобы обрабатывать эти массивы, журналист должен владеть специальными инструментами (как минимум, Microsoft Excel и Python). Также ему нужно уметь использовать различные средства визуализации – графические редакторы и программы для создания анимации. Для их освоения придется потратить десятки, если не сотни часов.

Поясню на примере. Вы готовите материал на тему «10 самых посещаемых блогов рунета». Чтобы рейтинг был объективными, нужно собрать данные о посещаемости сайтов за определенный период. Затем их нужно проанализировать: отсечь переходы по контекстной рекламе, нецелевой трафик. Вам предстоит изучить аналитику по сотням сайтов, а результат свести в единую таблицу. Это простой пример. Есть сложнее.

Например, некое издание готовит материал про бизнес на Дальнем Востоке.

Во-первых, журналисту предстоит изучить направления для инвестиций с показателями, влияющими на прибыль.

Во-вторых, привести рынки сбыта продукции.

В-третьих, представить налоги, административные барьеры и программы господдержки бизнеса.

Не лишним будет еще показать успешные и провальные проекты, поговорив с предпринимателями.

Такой материал потребует изучения огромного массива данных: законов, статистики Росстата, географии, отчетов компаний, новостных сводок и многое другое. И все это задача дата-журналиста.

Что такое дата журналистика. Смотреть фото Что такое дата журналистика. Смотреть картинку Что такое дата журналистика. Картинка про Что такое дата журналистика. Фото Что такое дата журналистика

Что такое дата журналистика. Смотреть фото Что такое дата журналистика. Смотреть картинку Что такое дата журналистика. Картинка про Что такое дата журналистика. Фото Что такое дата журналистика

Что такое дата журналистика. Смотреть фото Что такое дата журналистика. Смотреть картинку Что такое дата журналистика. Картинка про Что такое дата журналистика. Фото Что такое дата журналистика

Спецпроект агентства «РИА Новости» про создание бизнеса на Дальнем Востоке

Что такое данные в журналистике

Под данными понимается любая исходная информация для журналистского материала: статистика Росстата, отчеты государственных органов, видеофайлы, показатели сервисов онлайн-аналитики, результаты опросов, финансовые отчеты компаний. С каждым днем данных становится все больше.

Данные – такой же источник информации для журналиста, как, например, интервью. Возможно, даже более ценный, чем любой другой вид экспертного контента.

Задача дата-журналистики – преобразовать данные в доступную для широкой аудитории информацию: обработать, обобщить и проинтерпретировать.

Онлайн-лекция Pressfeed и SEMrush об использовании приемов дата-журналистики

Данные – это вообще все. В дата-журналистике мы просто анализируем одинаковые свойства объектов и делаем какие-то выводы.

Например, есть джинсы. У джинсов есть карманы. Мы можем измерить их размеры и выпустить материал о том, что в женских джинсах карманы меньше, чем в мужских. Или, допустим, есть тексты. В текстах есть слова, и можно сравнить, сколько раз эти слова употреблялись в текстах. Например, Dekoder посчитали, как часто говорили на какие-то темы наши президенты.

Или гораздо более прозаично: можно взять в Росстате табличку с количеством транспортных средств России и узнать, как изменилось количество каждого из их видов. Правда, перед тем, как данные попали в табличку на Росстате, кто-то это все считал. Например, компании, которые продают автомобили, сложили все свои продажи, отправили в Росстат, а потом местные аналитики это все суммировали.

Объектов, которые мы будем анализировать, может быть вообще немного. Крайне некорректно говорить, что дата-журналисты работают с большими данными. В редких случаях к нам в руки попадают наборы данных с миллионами объектов. Их может быть даже несколько десятков. РБК, например, анализировали жанры групп, выступающих на митингах. Там чуть больше 20 концертов.

Данные могут быть числовыми, категориальными (это текстовые значения – мужчины и женщины, названия стран), логическими (есть ли в регионе губернатор, есть ли в школе компьютерный класс) или географическими (координаты объектов), а также датой и временем.

Порядок работы дата-журналиста над материалом выглядит следующим образом:

Вот примеры того, как выглядит готовый материал data-журналистов в российских и зарубежных изданиях.

Что такое дата журналистика. Смотреть фото Что такое дата журналистика. Смотреть картинку Что такое дата журналистика. Картинка про Что такое дата журналистика. Фото Что такое дата журналистика

Газета Financial Times посчитала количество погибших от COVID-19 в Великобритании за первые месяцы пандемии. Для этого журналисты изучили десятки тысяч медицинских заключений о причине смерти больных

Что такое дата журналистика. Смотреть фото Что такое дата журналистика. Смотреть картинку Что такое дата журналистика. Картинка про Что такое дата журналистика. Фото Что такое дата журналистика

«РБК» опубликовал рейтинг городов России по комфорту и доступности жилья. Журналисты сравнили статистику Росстата по средней зарплате, стоимости квартир, цене на бензин, количеству экологических катастроф и другим показателям за 2020 год

Что такое дата журналистика. Смотреть фото Что такое дата журналистика. Смотреть картинку Что такое дата журналистика. Картинка про Что такое дата журналистика. Фото Что такое дата журналистика

Один из спецпроектов «РИА Новости» посвящен производству и потреблению лапши быстрого приготовления. Авторы получили комментарии экспертов, собрали данные «Всемирной ассоциации лапши быстрого приготовления» и отчеты исследований, опросили людей

Что такое дата журналистика. Смотреть фото Что такое дата журналистика. Смотреть картинку Что такое дата журналистика. Картинка про Что такое дата журналистика. Фото Что такое дата журналистика

«Т–Ж» выявил основные причины разводов в России на основании официальной статистики и мнений специалистов

Что такое дата журналистика. Смотреть фото Что такое дата журналистика. Смотреть картинку Что такое дата журналистика. Картинка про Что такое дата журналистика. Фото Что такое дата журналистика

Исследование «Текстерры» об отношении россиян к нетрадиционной рекламе. Мы опросили 602 человека по всей России, а результаты представили в виде наглядных графиков

Сбор и анализ данных

В России действует закон об открытости данных: все государственные службы должны размещать свои отчеты в открытом доступе. Речь идет не только о налоговых декларациях чиновников. В свободном доступе находятся все реестры, указы, распределение бюджета, результаты анализов городской воды, тарифы на услуги ЖКХ и многое другое. Любой человек может узнать, например, сколько объектов недвижимости построила та или иная организация за последний год.

Вот некоторые источники данных госорганов:

В крупных городах открытые данные загружены на специальные порталы. Такие порталы есть, например, в Москве и Екатеринбурге. Кроме этого, «Яндекс» собрал перечень полезных ресурсов для работы с данными.

Среди прочих источников данных – соцсети, поисковые запросы, сервисы интернет-аналитики, видеозаписи, опросы, анализ хештегов, комментарии. Массу интересного можно узнать, если проанализировать судебные решения.

Увы, не все данные находятся в открытом доступе или в машиночитаемом формате. Для некоторых проектов нужно знать язык программирования. Например, Python или JavaScript.

Данные можно получать по-разному. Есть открытые данные – это машиночитаемые датасеты. По сути, таблички, которые можно сразу использовать в анализе. Есть статистика, над расшифровкой которой приходится работать. Например, фотографии или сканы документов. Иногда данные можно запрашивать у компаний и государственных органов. Иногда – получать с каких-то сайтов при помощи скрейпинга или API.

Если у сайта есть API, программисты могут написать запросы определенной формы, чтобы получить с него данные. Например, API есть у социальной сети «ВКонтакте», и можно написать код, который выгрузит все сообщения, в которых содержится слово «собака», и которые были опубликованы в марте 2020 года. Далеко не все API бесплатны, а еще всегда ограничены по числу запросов. Не стоит питать иллюзий, что вы легко выгрузите всю социальную сеть, но сотни тысяч сообщений – вполне.

Если API нет, то сайты еще можно скрейпить. Для этого нужно написать скрипт, который будет заходить на каждую страницу сайта, как это делали бы вы, и забирать оттуда необходимую информацию. Слишком «подозрительные» скрипты сайты могут забанить, поэтому процесс скрейпинга обычно занимает часы и даже дни.

После сбора данных нужно провести их обработку и анализ. Например, из общей статистики налоговой службы выбрать только данные по конкретному региону или виду деятельности. Это удобно сделать с помощью обычных офисных редакторов.

В начале «нулевых» годов от журналистов ожидалось максимум умений: создание медиатекста, разработка дизайна, программирование и т.д. Сейчас, с усложнением технологий, я вижу это как тупиковый путь развития, поскольку невозможно одинаково хорошо делать всю работу. Многие СМИ постепенно переходят от штатной организации работы к проектной, когда часть задач передается фрилансерам – специалистам в определенной области. К примеру, графическим дизайнерам.

Для дата-журналистики самым передовым опытом является использование искусственного интеллекта, который может обрабатывать значительные массивы информации, находить в них закономерности, перепроверять результаты и т.д. Сегодня ряд западных СМИ, например, Associated Press, отдали на откуп ИИ создание около 20 % всех своих медиатекстов.

Однако, ИИ – это нечто большее, чем просто программирование. Здесь нужны специалисты по коммуникации между всеми участниками процесса. Именно эту роль «переводчиков» и должны взять на себя журналисты. Они должны понимать, что нужно их читателям / зрителям, и чего хочет редакция. При это, чтобы говорить на одном языке с разработчиками ИИ, без знания современных IT-технологий не обойтись.

Визуализация данных

Визуализация – наглядное представление данных в удобном для читателя виде. Она должна быть понятна любому человеку, который впервые ее увидел. С помощью визуализации читатель сможет сразу извлечь нужную информацию, не вдаваясь в расчеты, сравнение показателей, анализ данных. Другими словами, визуализация в data-журналистике – это упаковка готового материала.

Вот некоторые способы визуализации:

Что такое дата журналистика. Смотреть фото Что такое дата журналистика. Смотреть картинку Что такое дата журналистика. Картинка про Что такое дата журналистика. Фото Что такое дата журналистика

Спецпроект «РИА Новости» про источники питьевой воды в Москве. Инфографика воспринимается легче, чем лонгрид со скучными картинками

Что такое дата журналистика. Смотреть фото Что такое дата журналистика. Смотреть картинку Что такое дата журналистика. Картинка про Что такое дата журналистика. Фото Что такое дата журналистика

Публикация газеты «Аргументы и факты». Такая карта понятна любому читателю

Что такое дата журналистика. Смотреть фото Что такое дата журналистика. Смотреть картинку Что такое дата журналистика. Картинка про Что такое дата журналистика. Фото Что такое дата журналистика

Атлас газификации в России в спецпроекте «Новой Газеты»

Визуализацию можно сделать c помощью специальных программ: MS Excel, Google Data Studio, Tableau, Flourish, RawGraphs, Google Docs и другие. Некоторые дата-журналисты с нуля программируют визуализацию, используя JavaScript или Python.

Есть определенное количество наборов данных, с которыми можно работать без программирования, и выпускать на основе этой работы материалы. Но все-таки неумение программировать сильно сужает спектр возможностей: не получится работать с большими объемами данных, делать анализ текстов. Не всякий сайт можно скрейпить без программирования.

В общем, желательно, чтобы в команде был хотя бы один человек, который умеет кодить. Если такой человек есть, остальные могут обойтись без программирования.

Например, платформа Tableau позволяет работать с большим объемом данных, представляя результат в интерактивном формате. Данные собираются с облачных или файловых систем. Над одним проектом могут работать сразу несколько специалистов.

Где учиться на дата-журналиста

По мнению «РБК», профессия data-журналиста входит в топ самых востребованных в ближайшие годы. При этом в государственных вузах специальных программ по дата-журналистике нет. В НИУ «Высшая школа экономики» есть магистерская программа продолжительностью 2 года. О том, как работать с данными для материала, частично учат на журфаке.

Кроме вузов получить профессию дата-журналиста можно в онлайн-школах, хотя и здесь найти подходящий курс будет непросто. Они есть, например, в «Нетологии» и «Стрелке».

Раньше, когда информация была в дефиците, она ценилась сама по себе. Сейчас информации, наоборот, слишком много, поэтому ценится умение правильно ее анализировать, структурировать и представлять аудитории.

Потенциал для создания материалов, основанных на данных, практически неограничен. Поэтому очень нужны люди, которые умеют с этим работать: разбираются в методах обработки и анализа, программировании и графическом дизайне. Надо или журналистов учить работать с данными, или искать специалистов по данным, которые умеют рассказывать истории. И то, и другое – задачи не из легких.

Специалисты по работе с данными (они же «сенсмейкеры», «визуальные аналитики», «инфомейкеры») нужны не только в СМИ, но и в других сферах. В производстве дата-контента заинтересованы госструктуры, вузы, финансовый сектор, рекламные и маркетинговые агентства и т.д. Каждый бизнес располагает огромным объемом данных. Важно уметь эти данные извлекать. В России на профессиональном рынке таких специалистов очень мало. Зайти в эту профессию сейчас очень просто: можно «сделать имя», пока конкуренции практически нет.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *