Необычные профессии: дата-журналист
Андрей Дорожный, дата-журналист, агентство дата-журналистики Mediagun
Набор данных — он как камера Шредингера. Никогда не знаешь, есть в нем что-то или нет. И эта неопределенность движет мной каждый день.
В 2011 году я работал в небольшой провинциальной газете верстальщиком и делал инфографику — это графический метод объяснения сложной информации. Работа строилась очень просто: верстаешь полосы, ставишь фотографии, если есть время — делаешь графики по цифрам, которые принесет журналист. Мне было интересно рассказывать о сложных процессах простым языком, и в то время инфографика привлекала внимание одним своим присутствием на газетной полосе. Основная ее задача была — побудить к прочтению текста. К тому же картинкой с визуализацией легко поделиться, переслать другу, сохранить себе.
Однажды я сходил на хакатон по дата-журналистике. Там выступал Артур Хачуян — он рассказал, как можно использовать данные соцсетей для создания историй. Это позволило делать такие истории, которые обычными методами журналистики делать невозможно.
Как стать дата-журналистом
Прийти в отрасль сейчас очень просто, конкуренции пока нет. Чтобы пересчитать всех дата-журналистов России, хватит станций екатеринбургского метро. Самый главный навык — это умение рассказывать истории, быть хорошим журналистом. Все остальное — парсинг (сбор данных с сайтов), навыки работы в «Экселе» и программах для визуализации — это лишь инструменты. Не знаю, как стать хорошим журналистом. Я думаю, это надо любить, во время работы находиться в состоянии потока, быть любознательным, иметь широкий кругозор. А навыки работы с программами можно очень дешево получить на Youtube.
Есть несколько неплохих зарубежных сайтов с курсами по дата-журналистике, например, этот. В Москве у ВШЭ есть магистерская программа по журналистике данных. В России много талантливых молодых авторов, но мало кто из них понимает весь потенциал данных. Поэтому самое важное сейчас — это обучение журналистов. Курсов, где можно задавать вопросы и работать с куратором, сейчас не так много.
В российских редакциях пока почти нет вакансий дата-журналистов. Но ничто не мешает любому автору овладеть навыками работы с данными и начать делать материалы. Если читатель оценит их и редакция будет получать нужные метрики, вакансия с хорошей зарплатой образуется сама собой. Так было у меня в «Деловом Петербурге». Мне хотелось делать графику для веба, я бегал по всей редакции и просил у журналистов: «Дайте мне данные». На что один из редакторов сказал: «А ты не хочешь сам их поискать?». И я начал сам искать цифры и делать материалы. Важно не бояться делать новое, экспериментировать, даже когда в результат никто, кроме тебя, не верит.
Как строится работа и что думают друзья
Сейчас моя работа состоит в основном из трех этапов: определение тем и гипотез, поиск и анализ данных, визуализация данных. Кроме работы над отдельными медиапродуктами, я веду свой телеграм-канал, где ищу примеры работ дата-журналистов со всего мира и пишу еженедельную рассылку про данные, связанные с моей жизнью.
Друзьям и знакомым не из отрасли я обычно говорю, что «рисую графики». Потому что, как только ты говоришь слово «журналист», тебе сразу надевают шляпу, дают карандаш и отправляют в газету. Мне кажется не так важно, как называется твоя профессия. Важно, как она влияет на жизнь людей вокруг. У медиа, на мой взгляд, две задачи: развлекать и влиять на принятие решений. Например, график доли нецензурных слов в альбомах Сергея Шнурова — про развлечение, а исследование коммерческой недвижимости — про принятие решений.
Большие данные позволяют персонифицировать материал. Если раньше Росстат давал только общие агрегированные данные, то сейчас можно сделать материал, который будет учитывать пол, возраст, социальный статус читателя. И все повествование может перестраиваться. Вот, например, материал The Washington Post про поколение миллениалов: вводишь год рождения — и дальше весь текст подстраивается под эту цифру.
Когда была перепалка из-за Исаакиевского собора, мы с моим коллегой Сергеем Устиновым провели исследование и выяснили, что Исаакий — единственный прибыльный государственный музей в Санкт-Петербурге. На это пришлось потратить два полных рабочих дня. Данные были из самых разных источников — с bus.gov.ru, из СПАРКа и Минкульта. И это была полезная во всех смыслах работа.
Чего сейчас хотят от данных
Так сложилось, что я много работал в общественно-политических и деловых изданиях, поэтому экономика и политика — мои любимые темы. Из зарубежных команд мне нравится The New York Times — это лучшее в мире сочетание смысла и экспериментов в дизайне. Хорошие дата-команды — у Financial Times, The Washington Post. Отдельно выделю самобытную студию The Pudding, они делают крутые гендерные, культурные и медийные исследования.
Для меня самые сложные задачи — это технические. Часто я понимаю, что хочу получить, но не знаю, как это сделать технически. Знание кода — сложная, но полезная компетенция. А умение сделать продукт дешево, качественно и быстро в условиях небольшого бюджета редакции — самый полезный навык дата-журналиста.
В российских медиа нет традиции аутсорсинга — все привыкли делать у себя: свои журналисты, фотографы, работа на несколько изданий одобряется далеко не везде. С дата-материалами то же самое. Редакции хотят контролировать процесс и чтобы заказ исходил от них. Часто это сложно, потому что нет понимания, сколько времени и ресурсов займет тот или иной анализ. Чтобы сделать качественный продукт на основе данных, лучше, чтобы вся команда работала в ньюсруме. Важна коммуникация между программистами, журналистами и дизайнерами. На Западе успешные дата-команды работают при изданиях, у которых большой доход. Эти издания умеют зарабатывать рекламой, грантами, платной подпиской и готовы вкладывать в том числе в работу с данными.
Дата-журналистика: как рассказать историю, используя открытые данные и графический дизайн
За последние десять лет у журналистов-расследователей появились новые инструменты и возможности. Во всех крупных мировых СМИ стали появляться визуализации, основанные на анализе открытых данных. Такие материалы вызывают общественный резонанс, а их авторы становятся лауреатами Пулитцеровской премии. Вскоре дата-журналистика стала настолько самостоятельным жанром, что для работ в ее области была создана специальная премия — Data Journalism Awards.
Журналистика данных — это новый междисциплинарный метод сторителлинга, основывающийсяанный на работе с открытыми данными, статистикой, аналитикой, информатикой и дизайном. Развитие Иинтернета и технологий позволило использовать его как дополнение или даже альтернативу традиционным журналистским расследованиям. После того как в сети появился большой массив открытых данных, непосредственная коммуникация с источниками информации стала далеко не единственным способом изучения и описания реальности. Расследования нового формата стали строиться на сборе и анализе сухих данных, которые впоследствии превращались в яркую интерактивную визуализацию, доносящую сложную информацию до читателя легко и убедительно. Постепенно отделы, специализирующиеся на дата-журналистике, появились во многих крупных мировых СМИ, например,: в The Guardian, The New York Times, BBC, Reuters, Bloomberg, The Washington Post, The Wall Street Journal и других. Американское интернет-издание FiveThirtyEight и британско-русский ресурс Bellingcat публикуют расследования, основанные исключительно на методе анализа данных из открытых источников.
Одним из главных преимуществ дата-журналистики считается достоверность полученной информации: вероятность того, что история, основанная на комментариях интервьюируемых, объективна, всегда меньше, чем у историяи, воссозданнаяой с помощью качественно проанализированных данных. Статистика помогает проверить слухи и сплетни.
В The Washington Post появилась серия историй о проблемах бездомных. Материал, опубликованный в The Guardian рассказывает о новых подробностях дела Эдварда Сноудена. Журналисты Istories узнали о реальных масштабах разлива нефтепродуктов в России. РБК сделал материал о регионах, где от ВИЧ умирают чаще, чем от убийств, суицида и ДТП вместе взятых.
Работа с big data становится единственным инструментом, позволяющим объяснить происходящее, когда ответов на вопросы не дает никто. Так, вВ начале пандемии, когда весь мир оказался в условиях карантина (и онлайна), визуализация данных, рассказывающая о распространении вируса и количестве заболевших, появилась на сайтах многих зарубежных изданий. Журналисты The Telegraph предложили своим читателям инструмент, измеряющий количество зараженных коронавирусом в ближайшей к ним локации с помощью почтового индекса. В The Washington Post выпустили материал, наглядно показывающий механику распространения инфекций в целом.
Журналисты The New York Times создали интерактивную карту, которая показывает, как коронавирус распространялся по миру. «Медиазона» подсчитала, сколько медицинских сотрудников стали жертвами вируса в России.
Для работы с big data не обязательно быть программистом или аналитиком — достаточно увидеть проблему в сухих данных и превратить ее в историю для публикации. Создание дата-материала состоит из разработки темы и гипотезы, поиска данных, их извлечения (скрейпинга), анализа и визуализации. Каждый этап предполагает владение специальными инструментами.
За последние несколько лет в России появились образовательные проекты, где можно научиться работать с данными, заниматься их парсингом, анализом и очисткой, а также собирать на их основе истории. Первая и пока единственная в России двухлетняя магистерская программа по направлению «Журналистика данных» есть в ВШЭ. Существуют и обучающие интенсивы. В 2019 году «Яндекс.Практикум» запустил шестимесячный курс «Дата-аналитика». В этом же году журнал Strelka Mag совместно с ведущими дата-журналистами России открыл ежегодную школу дата-журналистики. Третий интенсив пройдет с 8 по 25 апреля. Преподавать в школе будут Андрей Дорожный, Дада Линделл и Александр Богачев.
Дата-журналист: кто это и почему его работа так востребована
Кто такой дата-журналист
Дата-журналист — это специалист, который собирает и анализирует большие данные, чтобы на их основе писать новости и статьи. Дата-журналист ищет их в публичных отчетах государственных служб и некоммерческих организаций, в статистике частных сервисов и аналитических агентств, изучает базы данных и другие источники.
Задача дата-журналиста — изучить данные и наглядно их представить: в виде графиков, таблиц или отдельных веб-страниц, которые поймет его аудитория. То есть дата-журналист переводит массивные данные, в которых могут разобраться только специалисты, в понятные форматы для обычных читателей.
Например, в начале пандемии коронавируса The Washington Post выпустила статью с симулятором распространения SARS-Cov-2 и объяснением, почему важна социальная дистанция [1].
В 2019 году Strelka Mag выпустила исследование по Красной площади в Москве и добавила к нему анализ фотографий, опубликованных в открытом доступе [2]:
Тренды и направления профессии
Работа с Big Data и ее визуализация — тренд, который не утихает с середины 2000-х годов, и вряд ли утихнет в ближайшем будущем [3]. Этому способствует и цифровой формат СМИ, и распространение программного обеспечения с открытым исходным кодом, и сама концепция «открытых данных», когда информация от госорганов и компаний публикуется в интернете в открытом доступе.
Поэтому специалисты с навыками дата-журналистов требуются не только в медиа, но также в госструктурах, финансах, банках, аналитических агентствах — везде, где нужно работать с данными и представлять их в наглядном виде.
Меняется также и содержание работы дата-журналиста. Как пишет Ник Ньюман из Института исследования журналистики Reuters, журналистика данных ищет новые способы представления информации. К примеру, многие европейские и американские издания визуализируют данные в формате сторис для социальных сетей [4]. Например, само агентство Reuters использует инфографику в Instagram, чтобы подвести читателя к полному тексту статьи о рынке рождественских елей в США [5]:
Еще один тренд — персонификация материалов. Когда мы публикуем информацию о своем возрасте, поле, социальном статусе, нейросети замечают это и подстраиваются под наши интересы. Например, YouTube рекомендует видео, опираясь на то, что и как долго вы уже смотрели. С дата-материалами произойдет то же самое: детям, профессиональным юристам или родителям будут показываться свои версии статей.
Откуда придет профессия
Профессия дата-журналиста находится на стыке гуманитарного и технического знания, поэтому из существующих профессий в нее можно прийти двумя путями. Во-первых, такими специалистами могут стать профессиональные журналисты, если изучат программы для сбора и анализа данных. Во-вторых, сюда могут перейти аналитики данных, которые научатся работать с текстом, изучат приемы повествования и редактуры.
Ключевые навыки дата-журналиста
В первую очередь — это умение выстраивать логичное повествование, увлекающее читателя. Для этого понадобятся навыки писательского мастерства, сторителлинга.
«Меня в слове «дата-журналистика» смущает «журналистика». Я предпочитаю говорить о дата-сторителлинге. Чаще всего компании хотят нанять не столько дата-журналистов, сколько специалистов с навыком объяснения того, что происходит в данных. Их много, и дата-сайентистов тоже — их регулярно поставляют онлайн-школы, университеты. Зато людей, которые нормально бы написали и — главное — сделали выводы из данных, мало», — отмечает Андрей Дорожный, дата-журналист и специалист по визуализации данных, старший преподаватель факультета медиакоммуникаций НИУ ВШЭ.
Дата-журналисту необходимо освоить методы работы с информацией в интернете: речь идет о ее поиске, обработке и проверке. Полезными будут знания картографии и того, откуда и как получать данные для анализа. Не обойтись и без навыков работы с базами данных и программами вроде Excel, Tableau, а также языка Python и его библиотек: Seaborn, pandas, SkLearn.
Как стать дата-журналистом
Дата-журналистике в России можно учиться в разных форматах. Очный доступен в НИУ ВШЭ на двухгодичной магистерской программе «Журналистика данных» [6]. Или на курсе от Института медиа, архитектуры и дизайна «Стрелка» [7], который идет раз в год и длится около месяца.
В онлайне можно получить профессию дата-журналиста за десять месяцев в «Нетологии» [8] или познать азы на онлайн-курсе от Иллинойского университета в Урбане-Шампейне на Coursera [9].
Зарплата дата-журналиста зависит от места работы и навыков специалиста, однако она выше обычного за счет навыка обработки данных. В регионах дата-журналист получает в среднем ₽20–60 тыс., в Москве — до ₽130 тыс. [10].
По словам Дорожного, никто из потенциальных заказчиков не откажется от контента, основанного на данных, поэтому его заказчиками могут быть и СМИ, и бизнес, и госструктуры. «Но в последних двух больше денег, и они могут себе позволить таких специалистов чаще, чем СМИ», — отметил он.
Что такое журналистика данных
За последние годы в открытом доступе накопилось столько данных, что понадобились специалисты, которые смогли бы из этого массива извлечь полезную информацию и представить ее в удобном виде. Этих специалистов стали называть дата-журналистами, а их направление работы – журналистикой данных. Разбираемся, что это такое и зачем нужно.
Что такое журналистика данных
Любой журналистский материал должен опираться на факты и доказательства: официальную статистику, финансовые отчеты, исследования, законодательство. Иначе он превратится в личное суждение автора, которое можно оспорить. Пользы от такого материала не будет.
Тем не менее, людей больше интересует не сам факт, а объяснение его значимости – как определенное событие повлияет на их жизнь. Они не хотят читать «сухие» отчеты госорганов, сравнивать прибыль компаний и самостоятельно разбираться в строительных нормативах. Аудитории нужен материал, где информация структурирована и написана на понятном языке. Для этого и существует data-журналистика.
Неважно, работает специалист с тысячами документов или с 20-30 источниками – любая работа с информацией считается журналистикой данных. А вот под журналистикой больших данных уже понимают обработку серьезных массивов информации.
Главное отличие от классической журналистики здесь в навыках, которые нужны специалисту, чтобы работать с большим объемом данных. Для сбора информации из тысяч документов потребуется знание языка программирования. Для сбора результатов в увлекательной форме без специальных сервисов тоже не обойтись.
Провести четкую границу между дата-журналистикой и классической журналистикой довольно сложно. Это не отдельная профессия, а набор дополнительных навыков для работы с данными. С развитием технологий ее выделили как отдельное направление, хотя по факту этим занимались и раньше, просто без автоматизации.
Обычно к сбору информации журналисты приступают, когда уже известна тема материала. Есть и обратный вариант, когда интересная идея рождается при изучении данных. Например, зная статистику по ДТП, можно сделать интерактивную карту города с обозначением наиболее аварийных участков дороги.
Само понятие «data-журналистика» как отдельное направление возникло в 2010 году на международной конференции в Амстердаме.
Издания работали с массивами данных и раньше. Например, британская газета Guardian еще в 1821 году опубликовала список школ в Манчестере, собранный по количеству учеников и стоимости обучения. Журналисты хотели определить, сколько детей получают бесплатное образование. Для этого опросили более 10 тыс. человек, а полученные результаты представили в формате таблицы.
Журналистикой данных занимаются не только новостные СМИ, но и редакции отраслевых журналов, корпоративных блогов, исследовательских бюро. В крупных изданиях над проектом работает целая команда data-журналистов. В компаниях поменьше сбором, анализом и визуализацией данных часто занимается 1 специалист.
Дата-журналистика – это в первую очередь набор навыков, а не отдельная профессия. От классической журналистики она принципиально отличается тем, что работа над материалом опирается не на отдельные документы, а на большие массивы информации.
В мире каждую секунду генерируется огромное количество информации. Если раньше журналисту достаточно было изучить 2-3 источника, то теперь их могут быть тысячи. Чтобы обрабатывать эти массивы, журналист должен владеть специальными инструментами (как минимум, Microsoft Excel и Python). Также ему нужно уметь использовать различные средства визуализации – графические редакторы и программы для создания анимации. Для их освоения придется потратить десятки, если не сотни часов.
Поясню на примере. Вы готовите материал на тему «10 самых посещаемых блогов рунета». Чтобы рейтинг был объективными, нужно собрать данные о посещаемости сайтов за определенный период. Затем их нужно проанализировать: отсечь переходы по контекстной рекламе, нецелевой трафик. Вам предстоит изучить аналитику по сотням сайтов, а результат свести в единую таблицу. Это простой пример. Есть сложнее.
Например, некое издание готовит материал про бизнес на Дальнем Востоке.
Во-первых, журналисту предстоит изучить направления для инвестиций с показателями, влияющими на прибыль.
Во-вторых, привести рынки сбыта продукции.
В-третьих, представить налоги, административные барьеры и программы господдержки бизнеса.
Не лишним будет еще показать успешные и провальные проекты, поговорив с предпринимателями.
Такой материал потребует изучения огромного массива данных: законов, статистики Росстата, географии, отчетов компаний, новостных сводок и многое другое. И все это задача дата-журналиста.
Спецпроект агентства «РИА Новости» про создание бизнеса на Дальнем Востоке
Что такое данные в журналистике
Под данными понимается любая исходная информация для журналистского материала: статистика Росстата, отчеты государственных органов, видеофайлы, показатели сервисов онлайн-аналитики, результаты опросов, финансовые отчеты компаний. С каждым днем данных становится все больше.
Данные – такой же источник информации для журналиста, как, например, интервью. Возможно, даже более ценный, чем любой другой вид экспертного контента.
Задача дата-журналистики – преобразовать данные в доступную для широкой аудитории информацию: обработать, обобщить и проинтерпретировать.
Онлайн-лекция Pressfeed и SEMrush об использовании приемов дата-журналистики
Данные – это вообще все. В дата-журналистике мы просто анализируем одинаковые свойства объектов и делаем какие-то выводы.
Например, есть джинсы. У джинсов есть карманы. Мы можем измерить их размеры и выпустить материал о том, что в женских джинсах карманы меньше, чем в мужских. Или, допустим, есть тексты. В текстах есть слова, и можно сравнить, сколько раз эти слова употреблялись в текстах. Например, Dekoder посчитали, как часто говорили на какие-то темы наши президенты.
Или гораздо более прозаично: можно взять в Росстате табличку с количеством транспортных средств России и узнать, как изменилось количество каждого из их видов. Правда, перед тем, как данные попали в табличку на Росстате, кто-то это все считал. Например, компании, которые продают автомобили, сложили все свои продажи, отправили в Росстат, а потом местные аналитики это все суммировали.
Объектов, которые мы будем анализировать, может быть вообще немного. Крайне некорректно говорить, что дата-журналисты работают с большими данными. В редких случаях к нам в руки попадают наборы данных с миллионами объектов. Их может быть даже несколько десятков. РБК, например, анализировали жанры групп, выступающих на митингах. Там чуть больше 20 концертов.
Данные могут быть числовыми, категориальными (это текстовые значения – мужчины и женщины, названия стран), логическими (есть ли в регионе губернатор, есть ли в школе компьютерный класс) или географическими (координаты объектов), а также датой и временем.
Порядок работы дата-журналиста над материалом выглядит следующим образом:
Вот примеры того, как выглядит готовый материал data-журналистов в российских и зарубежных изданиях.
Газета Financial Times посчитала количество погибших от COVID-19 в Великобритании за первые месяцы пандемии. Для этого журналисты изучили десятки тысяч медицинских заключений о причине смерти больных
«РБК» опубликовал рейтинг городов России по комфорту и доступности жилья. Журналисты сравнили статистику Росстата по средней зарплате, стоимости квартир, цене на бензин, количеству экологических катастроф и другим показателям за 2020 год
Один из спецпроектов «РИА Новости» посвящен производству и потреблению лапши быстрого приготовления. Авторы получили комментарии экспертов, собрали данные «Всемирной ассоциации лапши быстрого приготовления» и отчеты исследований, опросили людей
«Т–Ж» выявил основные причины разводов в России на основании официальной статистики и мнений специалистов
Исследование «Текстерры» об отношении россиян к нетрадиционной рекламе. Мы опросили 602 человека по всей России, а результаты представили в виде наглядных графиков
Сбор и анализ данных
В России действует закон об открытости данных: все государственные службы должны размещать свои отчеты в открытом доступе. Речь идет не только о налоговых декларациях чиновников. В свободном доступе находятся все реестры, указы, распределение бюджета, результаты анализов городской воды, тарифы на услуги ЖКХ и многое другое. Любой человек может узнать, например, сколько объектов недвижимости построила та или иная организация за последний год.
Вот некоторые источники данных госорганов:
В крупных городах открытые данные загружены на специальные порталы. Такие порталы есть, например, в Москве и Екатеринбурге. Кроме этого, «Яндекс» собрал перечень полезных ресурсов для работы с данными.
Среди прочих источников данных – соцсети, поисковые запросы, сервисы интернет-аналитики, видеозаписи, опросы, анализ хештегов, комментарии. Массу интересного можно узнать, если проанализировать судебные решения.
Увы, не все данные находятся в открытом доступе или в машиночитаемом формате. Для некоторых проектов нужно знать язык программирования. Например, Python или JavaScript.
Данные можно получать по-разному. Есть открытые данные – это машиночитаемые датасеты. По сути, таблички, которые можно сразу использовать в анализе. Есть статистика, над расшифровкой которой приходится работать. Например, фотографии или сканы документов. Иногда данные можно запрашивать у компаний и государственных органов. Иногда – получать с каких-то сайтов при помощи скрейпинга или API.
Если у сайта есть API, программисты могут написать запросы определенной формы, чтобы получить с него данные. Например, API есть у социальной сети «ВКонтакте», и можно написать код, который выгрузит все сообщения, в которых содержится слово «собака», и которые были опубликованы в марте 2020 года. Далеко не все API бесплатны, а еще всегда ограничены по числу запросов. Не стоит питать иллюзий, что вы легко выгрузите всю социальную сеть, но сотни тысяч сообщений – вполне.
Если API нет, то сайты еще можно скрейпить. Для этого нужно написать скрипт, который будет заходить на каждую страницу сайта, как это делали бы вы, и забирать оттуда необходимую информацию. Слишком «подозрительные» скрипты сайты могут забанить, поэтому процесс скрейпинга обычно занимает часы и даже дни.
После сбора данных нужно провести их обработку и анализ. Например, из общей статистики налоговой службы выбрать только данные по конкретному региону или виду деятельности. Это удобно сделать с помощью обычных офисных редакторов.
В начале «нулевых» годов от журналистов ожидалось максимум умений: создание медиатекста, разработка дизайна, программирование и т.д. Сейчас, с усложнением технологий, я вижу это как тупиковый путь развития, поскольку невозможно одинаково хорошо делать всю работу. Многие СМИ постепенно переходят от штатной организации работы к проектной, когда часть задач передается фрилансерам – специалистам в определенной области. К примеру, графическим дизайнерам.
Для дата-журналистики самым передовым опытом является использование искусственного интеллекта, который может обрабатывать значительные массивы информации, находить в них закономерности, перепроверять результаты и т.д. Сегодня ряд западных СМИ, например, Associated Press, отдали на откуп ИИ создание около 20 % всех своих медиатекстов.
Однако, ИИ – это нечто большее, чем просто программирование. Здесь нужны специалисты по коммуникации между всеми участниками процесса. Именно эту роль «переводчиков» и должны взять на себя журналисты. Они должны понимать, что нужно их читателям / зрителям, и чего хочет редакция. При это, чтобы говорить на одном языке с разработчиками ИИ, без знания современных IT-технологий не обойтись.
Визуализация данных
Визуализация – наглядное представление данных в удобном для читателя виде. Она должна быть понятна любому человеку, который впервые ее увидел. С помощью визуализации читатель сможет сразу извлечь нужную информацию, не вдаваясь в расчеты, сравнение показателей, анализ данных. Другими словами, визуализация в data-журналистике – это упаковка готового материала.
Вот некоторые способы визуализации:
Спецпроект «РИА Новости» про источники питьевой воды в Москве. Инфографика воспринимается легче, чем лонгрид со скучными картинками
Публикация газеты «Аргументы и факты». Такая карта понятна любому читателю
Атлас газификации в России в спецпроекте «Новой Газеты»
Визуализацию можно сделать c помощью специальных программ: MS Excel, Google Data Studio, Tableau, Flourish, RawGraphs, Google Docs и другие. Некоторые дата-журналисты с нуля программируют визуализацию, используя JavaScript или Python.
Есть определенное количество наборов данных, с которыми можно работать без программирования, и выпускать на основе этой работы материалы. Но все-таки неумение программировать сильно сужает спектр возможностей: не получится работать с большими объемами данных, делать анализ текстов. Не всякий сайт можно скрейпить без программирования.
В общем, желательно, чтобы в команде был хотя бы один человек, который умеет кодить. Если такой человек есть, остальные могут обойтись без программирования.
Например, платформа Tableau позволяет работать с большим объемом данных, представляя результат в интерактивном формате. Данные собираются с облачных или файловых систем. Над одним проектом могут работать сразу несколько специалистов.
Где учиться на дата-журналиста
По мнению «РБК», профессия data-журналиста входит в топ самых востребованных в ближайшие годы. При этом в государственных вузах специальных программ по дата-журналистике нет. В НИУ «Высшая школа экономики» есть магистерская программа продолжительностью 2 года. О том, как работать с данными для материала, частично учат на журфаке.
Кроме вузов получить профессию дата-журналиста можно в онлайн-школах, хотя и здесь найти подходящий курс будет непросто. Они есть, например, в «Нетологии» и «Стрелке».
Раньше, когда информация была в дефиците, она ценилась сама по себе. Сейчас информации, наоборот, слишком много, поэтому ценится умение правильно ее анализировать, структурировать и представлять аудитории.
Потенциал для создания материалов, основанных на данных, практически неограничен. Поэтому очень нужны люди, которые умеют с этим работать: разбираются в методах обработки и анализа, программировании и графическом дизайне. Надо или журналистов учить работать с данными, или искать специалистов по данным, которые умеют рассказывать истории. И то, и другое – задачи не из легких.
Специалисты по работе с данными (они же «сенсмейкеры», «визуальные аналитики», «инфомейкеры») нужны не только в СМИ, но и в других сферах. В производстве дата-контента заинтересованы госструктуры, вузы, финансовый сектор, рекламные и маркетинговые агентства и т.д. Каждый бизнес располагает огромным объемом данных. Важно уметь эти данные извлекать. В России на профессиональном рынке таких специалистов очень мало. Зайти в эту профессию сейчас очень просто: можно «сделать имя», пока конкуренции практически нет.

















