специалист по искусственному интеллекту и машинному обучению

Специалист по машинному обучению: кто такой, чем занимается и сколько получает

Разбираемся, нужно ли творцам искусственного интеллекта знать математику и Python.

специалист по искусственному интеллекту и машинному обучению. Смотреть фото специалист по искусственному интеллекту и машинному обучению. Смотреть картинку специалист по искусственному интеллекту и машинному обучению. Картинка про специалист по искусственному интеллекту и машинному обучению. Фото специалист по искусственному интеллекту и машинному обучению

специалист по искусственному интеллекту и машинному обучению. Смотреть фото специалист по искусственному интеллекту и машинному обучению. Смотреть картинку специалист по искусственному интеллекту и машинному обучению. Картинка про специалист по искусственному интеллекту и машинному обучению. Фото специалист по искусственному интеллекту и машинному обучению

Специалист по машинному обучению (ML, machine learning) — это программист, который с помощью специальных наборов данных и алгоритмов обучает искусственный интеллект.

Посмотрим, например, как приложение «Яндекс.Навигатор» выбирает маршрут до пункта назначения. У него есть ваши GPS-координаты и карта, но при этом он знает и о пробках, авариях, дорожном ремонте. Всё это благодаря графу дорог — алгоритм быстро анализирует возможные пути и находит самый быстрый. А программисты следят, чтобы машинный интеллект не ошибался.

Но ситуация на дорогах постоянно меняется: вчера здесь был поворот, а сегодня висит «кирпич» и водители вынуждены объезжать это место. Добавлять на карту все изменения вручную, особенно в реальном времени, слишком трудозатратно и дорого, требуется много людей. Но алгоритму совсем не обязательно знать про запрет — ему достаточно увидеть, что машины стали двигаться по-другому, чтобы перенаправить всех водителей на другие маршруты.

Научить компьютер принимать такие решения — задача специалистов по ML. Без этого мы не смогли бы обработать море информации, которую люди генерируют каждый день, и сделать нашу жизнь комфортнее.

специалист по искусственному интеллекту и машинному обучению. Смотреть фото специалист по искусственному интеллекту и машинному обучению. Смотреть картинку специалист по искусственному интеллекту и машинному обучению. Картинка про специалист по искусственному интеллекту и машинному обучению. Фото специалист по искусственному интеллекту и машинному обучению

Пишет про digital и машинное обучение для корпоративных блогов. Топ-автор в категории «Искусственный интеллект» на Medium. Kaggle-эксперт.

Чем занимается специалист по машинному обучению

Задачи специалиста по МL отличаются в разных компаниях и проектах, но чаще всего он делает вот что:

Собирать данные вручную сложно: если это, например. изображения, требуются сотни тысяч фото с разных ракурсов и разными условиями освещённости. «ВКонтакте» недавно запустил новую функцию — сеть показывает фото пользователей их друзьям и спрашивает: «Это Вася Иванов?» Чтобы отметить друга на фото, требуется меньше секунды. Не поленитесь и сделайте это. Так вы поможете нейросети научиться распознавать лица, а заодно почувствуете себя специалистом по ML — хоть немножко 🙂

Алгоритмы для построения модели программируют под конкретные задачи. Иногда они довольно простые — например, алгоритм для предсказания предпочтений туристов из разных городов занимает всего 20 строчек кода.

Но бывают и очень сложные — такие как гигантская нейросеть DeepCoder. Она копирует и миксует готовые фрагменты кода, создавая на выходе новые программы. Эта технология называется программным синтезом.

Получается, что сама нейросеть, состоящая из миллионов строк кода, может заимствовать его из множества других программ. Алгоритм порождает другие алгоритмы — чем не цифровая жизнь?

Кому подойдёт профессия специалиста по ML

Стать специалистом по машинному обучению за три дня не получится. Но вы можете попробовать профессию и попытаться предсказать курс доллара с помощью машинного обучения на бесплатном марафоне «Напишите первую модель машинного обучения за 3 дня».

Какие навыки нужны специалистам по МL

Предположим, нам нужно построить автоматическую систему рекомендаций для соцсети. Что должно лежать в основе рекомендаций? Хороший вариант — посмотреть, что лайкают друзья: людей часто объединяют интересы. Но чтобы система работала ещё лучше, придётся учитывать время года или суток, события в стране и в мире. Например, «ВКонтакте» утром чаще рекомендует новости, а вечером — мемасики про котиков и другой развлекательный контент. Чтобы всё это продумать и учесть сотни различных факторов, нужно быть готовым к кропотливой и даже монотонной работе.

Как определить, хороший контент в соцсети или плохой? Можно посадить сотни модераторов и разработать сложную систему правил, а можно просто добавить кнопку эмоциональной реакции — например, лайк. Если у поста много лайков, значит, людям он нравится, следовательно, материал хороший и нейросеть будет показывать его как можно большему количеству людей. Возможно, эта система не идеальна, но она позволяет решить проблему относительно эффективно и с минимальной затратой ресурсов.

Перспективы развития профессии

Сегодня МL помогает людям практически в любой области — от выбора сериалов на Netflix до заботы о здоровье. Востребованность специалистов по ML с каждым годом растёт. Например, hh.ru отмечает, что с 2015 по 2019 год количество вакансий в сфере машинного обучения выросло в семь раз.

Больше всего таких специалистов требуется в сфере информационных технологий, разработке программного обеспечения, финансовом секторе, бизнес-среде, маркетинге и розничной торговле.

На какую зарплату могут рассчитывать Junior, Middle и Senior

Яндекс, «Тинькофф» и другие компании нуждаются в крутых профессионалах в области ML. По наличию опыта такие специалисты делятся на три группы: Junior, Middle и Senior.

Junior (младший)

Нужно уметь работать с библиотеками для обработки данных — Pandas, NumPy, Matplotlib, и понимать системы управления базами данных — MySQL/PostgreSQL.

В регионах такой специалист может рассчитывать на зарплату от 40 тысяч рублей. В Москве джуны получают значительно больше — от 80 тысяч.

Middle (средний)

Уверенный специалист с опытом от 2 до 5 лет. Он способен перевести задачи бизнеса на язык математики, реализовать с нуля и оценить производительность модели машинного обучения, проанализировать и проверить данные — соответствуют ли они заданным критериям.

Среди требований к мидлу — навыки работы с современными аналитическими пакетами на R/Python и промышленными хранилищами данных (Teradata, DB2), а также понимание BigData. Приветствуется владение статистическими инструментами — SPSS, MATLAB, SAS Data Miner.

В регионах средняя зарплата — 60–80 тысяч, в Москве — не меньше 100 тысяч рублей.

Senior (старший)

Опытный специалист. Работодатели ожидают, что у сеньора за плечами 5–7 лет работы над проектами в сфере data mining, data analysis, машинного обучения или математического моделирования. В списке компетенций: уверенный Python, SQL/CQL, глубокое понимание архитектуры нейросетей, знание Spark Streaming (используется с Apache Spark), Cassandra (система управления базами данных), фреймворков TensorFlow, CV, PyTorch или других — в зависимости от стека компании.

Иногда выделяют ML Team Lead (тимлид, лидер команды). Тимлидами становятся сеньоры, возглавляющие подразделения Machine Learning. Здесь важны лидерские качества, тайм-менеджмент и умение работать в команде.

Сеньоры и тимлиды в регионах зарабатывают 100–120 тысяч, в Москве — от 200 и до 400–500 тысяч. Это хороший стимул освоить профессию. А учитывая, что потребность в машинном обучении с годами будет только расти, зарплаты опытных специалистов по ML точно не станут ниже.

Где учиться

Изучать машинное обучение можно в университете, на курсах или самостоятельно.

Университет даёт студентам хорошую базу, особенно в математике и статистике. Вы получите диплом государственного образца — это может быть плюсом при трудоустройстве. Но поступить на специальность Data Science обычно непросто и дорого. Например, двухлетняя магистратура по наукам о данных в «Высшей школе экономики» обойдётся в 1 155 000 рублей.

Курсы позволяют получить структурированную информацию в сжатые сроки. Такой вариант образования гораздо дешевле университетской программы. Кроме того, на курсах готовят выпускников к практической деятельности, дают поработать над реальными проектами. Стоимость стартует от 50 тысяч рублей и доходит до 150 тысяч.

Самостоятельное обучение подходит тем, у кого уже есть технический бэкграунд. В интернете много бесплатных книг и курсов, и некоторые из них весьма хороши. Но есть сложность: придётся самостоятельно планировать обучение и развитие, получать знания и навыки, которые понадобятся на работе. Без старшего товарища ориентироваться в океане информации и проверять рецепты из интернета непросто.

Вывод

Специалисты по машинному обучению работают над сложными, увлекательными проектами, которые хорошо оплачиваются. Созданные ими решения делают нашу жизнь проще, интереснее и безопаснее. Так что если вам хочется быть на переднем крае технологий и заниматься самыми современными проектами, без которых немыслимо не только будущее, а уже и настоящее, — возможно, это идеальная карьера для вас.

Самому освоить профессию специалиста по машинному обучению трудно. Но можно записаться на курс «Профессия Data Scientist: машинное обучение», где опытные специалисты по ML собрали сбалансированную программу, учли типичные ошибки новичков и делятся лучшими практиками. За год с небольшим вы научитесь разбираться в программировании и моделях МL и поработаете с реальными проектами в машинном обучении.

Источник

Зарплаты в ИИ: где больше денег и кого ищут в России

Специалистам по искусственному интеллекту платят почти в два раза больше, чем другим профессионалам в сфере IT. Мы разобрались, на какую зарплату можно рассчитывать в разных областях ИИ в России, кого ищут «Яндекс», ABBYY и «Сбербанк», и какие курсы можно использовать для обучения в этой сфере.

специалист по искусственному интеллекту и машинному обучению. Смотреть фото специалист по искусственному интеллекту и машинному обучению. Смотреть картинку специалист по искусственному интеллекту и машинному обучению. Картинка про специалист по искусственному интеллекту и машинному обучению. Фото специалист по искусственному интеллекту и машинному обучению

Сколько зарабатывает специалист по ИИ в России

Зарплата специалиста по искусственному интеллекту в России, по данным HeadHunter на начало 2018 года, составила около 190 тысяч рублей. Это вдвое больше, чем средняя зарплата в IT, которая на тот момент равнялась примерно 90 тысячам рублей. К концу третьего квартала она почти не изменилась.

Самой перспективной сферой в 2018 году остается Big Data: экспертам в этой области предлагают зарплату в районе 200 тысяч рублей. Специалистам по машинному обучению — около 180 тысяч, в области нейронных сетей — больше чем 140 тысяч.

Число вакансий в каждой из этих областей растет быстрее количества резюме — это характерно для ситуации с кадрами в IT в целом. По данным исследования ФРИИ, к 2027 году в России будет не хватать порядка 2 миллионов IT-специалистов.

В числе самых востребованных направлений, по прогнозу ФРИИ, к этому времени окажутся искусственный интеллект, машинное обучение, аналитика больших данных, компьютерное зрение и дополненная реальность.

Кого ищут в крупных компаниях

Искусственный интеллект используют в первую очередь крупные компании, такие как «Яндекс», Mail.Ru Group, «МегаФон», МТС, «Билайн», Теле2, ABBYY и «Сбербанк». Для чего это нужно некоторым из них и кого они ищут:

1. ABBYY

ABBYY — один из мировых лидеров в области интеллектуальной обработки данных и лингвистики. Ее решения на базе ИИ позволяют распознавать текстовые данные, работать с печатными документами и файлами в формате PDF, проводить семантический поиск, а также находить переводы незнакомых слов и фраз.

Одно из главных достижений компании — система Compreno, которая позволяет анализировать и понимать текст на естественном языке. Над созданием этой системы специалисты ABBYY работали около десяти лет, стоимость проекта превысила 80 млн долларов.

Compreno может использоваться например, для систематизации архивных документов: с ее помощью можно будет находить информацию по полям или реквизитам, а также по тексту.

специалист по искусственному интеллекту и машинному обучению. Смотреть фото специалист по искусственному интеллекту и машинному обучению. Смотреть картинку специалист по искусственному интеллекту и машинному обучению. Картинка про специалист по искусственному интеллекту и машинному обучению. Фото специалист по искусственному интеллекту и машинному обучению

Кого ищет ABBYY: сейчас компании нужен Data Scientist — для экспериментов и создания прототипов в области обработки текстов (NLP) в отдел перспективных разработок. От кандидата требуется знание методов машинного обучения и нейронных сетей, алгоритмов и структур данных, опыт программирования на Python и соответствие некоторым другим параметрам.

2. «Яндекс»

Крупнейший российский поисковик уже несколько лет применяет технологии ИИ в своих поисковых механизмах. Так, в «Яндекс.Дзене» это позволяет выдавать персонализированные рекомендации контента в соответствии с интересами пользователя.

«Во многом он похож на поисковую систему. Только если поиск ищет что-то определенное, то Дзен отвечает на более широкий запрос: что интересно конкретному человеку», — говорил руководитель Яндекс.Дзена Виктор Ламбурт на этапе запуска сервиса.

Кого ищет «Яндекс»: прямо сейчас компании требуется разработчик машинного обучения для Дзена, который будет собирать данные, обучать модели, оценивать их в экспериментах и писать продакшн-код. «В первую очередь мы ждем от кандидатов хорошего знания машинного обучения и статистики, но опыт промышленной разработки также будет большим плюсом», — говорится в вакансии.

3. «Сбербанк»

Направление машинного обучения и искусственного интеллекта развивается в «Сбербанке» с 2013 года. Главная цель — создание новых интеллектуальных продуктов и сервисов как для внутреннего, так и для внешнего клиента, а также оптимизация банковских процессов с помощью технологий машинного обучения.

Так, в начале 2018 года банк запустил первую в России нейронную сеть для оценки коммерческой недвижимости. ИИ позволяет банку почти мгновенно проводить оценку залогов. Такой ИИ работает с регулярно актуализируемой базой данных по стрит-ритейлу. Эта база пополняется из нескольких типов источников и содержит основные характеристики объектов-аналогов, их фото и цены.

Нейросеть получает характеристики объекта, который надо сравнить с другими, и на основе собранных данных подбирает наиболее близкие аналоги, которые используются для расчета стоимости. Если экспертам для этого нужны часы и даже дни, то нейросети для анализа требуется несколько секунд.

Кого ищет «Сбербанк»: сейчас банку нужны сразу несколько дата-сайентистов для разных проектов. Так, в одной из вакансий в Москве от специалиста требуется опыт в решении задач
data science для бизнеса, опыт работы с большими данными, хорошие навыки программирования (Python, Spark, SQL) и знание библиотек машинного обучения.

Кроме «Сбербанка», дата-сайентисты и специалисты по машинному обучению требуются многим другим банкам, в том числе ВТБ, «УралСибу» и БинБанку.

С чего начинать

Только 30% специалистов, работающих в сфере ИИ, изучали машинное обучение или большие данные в университете. Об этом свидетельствуют итоги опроса 16 тысяч пользователей Kaggle, проведенного в конце прошлого года. Более половины (66%) всех респондентов считают себя самоучками: для изучения новых дисциплин они использовали различные курсы.

Евангелист Microsoft и руководитель AI School в Binary District Дмитрий Сошников выделяет четыре основных типа курсов на российском образовательном рынке:

Та же проблема с узкоспециализированными курсами: они не позволяют сформировать у слушателя понимание фундаментальных принципов работы ИИ. Слушатель может освоить отдельные практические навыки, но технологии устаревают раз в полгода, и навыки — вместе с ними.

Классические университетские курсы для новичков могут быть слишком сложными: здесь придется вспомнить забытые разделы математики. Будущим дата-сайентистам, кроме этого, обычно надо иметь хорошие навыки программирования.

Для разработчиков, которые хотят разобраться, как и для чего можно использовать ИИ в их компании, лучше всего подойдет не слишком долгий, но интенсивный курс, который позволит научиться решать типовые задачи. В AI School, например, слушатели за месяц изучают пять блоков задач:

По словам Сошникова, прохождение курса не приведет к моментальному повышению зарплаты, но это сделает специалиста более привлекательным для рынка труда. А это уже позволит как требовать повышения от текущего работодателя, так и искать другие возможности. Тут уже все зависит от самого человека.

Источник

Специализации по анализу данных и искусственному интеллекту

Изучите один из самых популярных и удобных языков программирования — Python и освойте современные методы машинного и глубинного обучения для прикладных задач и исследований

Факультет компьютерных наук НИУ ВШЭ представляет три больших специализации по современному анализу данных и искусственному интеллекту. Специализации откроются осенью 2020, подключиться к двум курсам можно уже сейчас.

Курсы специализаций подготовлены при экспертной поддержке и при участии компании Яндекс.

Специализация «Основы машинного обучения»

Студенты узнают, что понимается под методами машинного обучения и искусственного интеллекта. Сначала студенты изучат необходимые понятия и теоремы из математики, а также полноценно освоят Python — мощный и популярный язык программирования. Затем разберутся со всеми основными моделями машинного обучения, научатся правильно ставить задачи, измерять качество решения, готовить и анализировать данные, проводить эксперименты.

Включает в себя 4 базовых курса.

Примеры задач, которые студенты смогут решать:

Для кого: для студентов программ бакалавриата инженерного, экономического, социального и естественно-научного профилей.

От студентов ожидается математическая подготовка на уровне курса высшей математики, покрывающего основы математического анализа, линейной алгебры и теории вероятностей.

Специализация «Data Science»

Студенты изучат всё необходимое, чтобы пройти собеседование на junior позицию data scientist’а: специализация даст полноценные знания в области машинного обучения и нейросетей, а также навыки для работы с большими массивами данных.

Включает в себя 6 курсов: 4 базовых и 2 продвинутых.

Примеры задач, которые студенты смогут решать:

Для кого: для студентов программ бакалавриата и магистратуры, готовящие специалистов на стыке двух областей: предметной и IT.

От студентов ожидается математическая подготовка на уровне курса высшей математики, покрывающего основы математического анализа, линейной алгебры и теории вероятностей.

Специализация «Искусственный интеллект»

Студенты получат полноценные знания по современному машинному и глубинному обучению и будут готовы решать исследовательские задачи. Также освоят основные методы обучения с подкреплением, которое всё чаще используется при решении задач, связанных с искусственным интеллектом.

Состоит из 8 курсов: 4 базовых и 4 продвинутых.

Примеры задач, которые студенты смогут решать:

Для кого: для студентов программ бакалавриата и магистратуры по направлениям «прикладная математика», «прикладная математика и информатика».

Преимущества:

По результатам изучения: Microdegree от НИУ ВШЭ и Яндекса в резюме и портфолио.

Что доступно уже сейчас?

Для студентов открыты бесплатно два курса:

Студенты смогут с помощью языка Python автоматизировать рутинные операции на компьютере, собирать и обрабатывать большие объемы данных, а также погрузятся в область машинного обучения, получат первые практические навыки и смогут применять их для решения собственных задач по извлечению знаний из данных.

Подробнее о курсах

Python для извлечения и обработки данных

Курс знакомит с языком программирования Python — де-факто стандартным инструментом для анализа данных. На курсе студенты научатся программировать с нуля, познакомятся с базовыми возможностями языка и смогут использовать его в повседневной работе. Также студенты погрузятся в сбор данных на Python и научатся работать с большими массивами данных.

Примеры задач, которые студенты смогут решать:

Основы машинного обучения

Курс посвящён основам анализа данных и машинного обучения. Студенты научатся предобрабатывать данные и искать в них проблемы, изучат основные методы машинного обучения и способы оценки качества моделей и начнут применять их в реальных задачах.

Примеры задач, которые студенты смогут решать:

Для кого эти курсы

Для студентов программ инженерного, экономического, социального и естественно-научного профилей, которые не изучали анализ данных, но хотят уметь решать задачи анализа и обработки данных в своей профессии.

Особенности курсов

Освоить курс по Python можно без предварительных знаний. Для изучения курса «Основы машинного обучения» нужно уметь программировать на языке Python, помнить школьный курс математики, знать основы высшей математики или в процессе освоить её в минимальном объёме: производные, градиенты, векторы, матрицы и системы линейных уравнений.

Для оценки требований к математической подготовке скоро опубликуем здесь тест с автоматической проверкой.

Источник

Эти люди создают искусственный интеллект — 4 истории специалистов по ИИ и ML

Четыре опытных специалиста о том, как занялись искусственным интеллектом, с какими сложностями столкнулись и какие задачи решают.

«Поначалу всегда было страшно, но я ни разу не пожалел»

Григорий Сапунов, CTO, Intento

Сооснователь и технический директор в стартапе, отвечает за технологическое развитие, архитектуру решений и оценку их качества, применение AI и другие технические вопросы, занимается управлением, разработкой и наймом сотрудников.

Начало пути. Сложно сказать, что именно привело меня в профессию: ещё с детства мне было интересно программирование. Параллельно я интересовался психологией, биологией, математикой, радиоэлектроникой, читал журналы «Юный техник» и «Юный натуралист».

Долгое время всё, что связано с искусственным интеллектом, было для меня скорее хобби, чем профессией. В какой-то момент я понял, что эти темы составляют и заметную часть моих рабочих задач. Можно сопоставить это с моим приходом в Яндекс в 2007 году.

Первые трудности. В моём случае переход был постепенным: моя профессиональная деятельность началась с разного рода ИТ-проектов, а первым «коммерческим» проектом стала поисковая система для «Московской коллекции рефератов», написанная на Perl. Не всегда удавалось разобраться в новых темах с первого раза, приходилось перечитывать по несколько разных книг, чтобы что-то понять, а также много экспериментировать.

Я неоднократно ввязывался в совершенно новые проекты, где на старте у меня полностью отсутствовали нужные знания — приходилось осваивать по ходу дела. Поначалу всегда было страшно, но я ни разу не пожалел.

Чтобы разобраться, как всё работает, практически всегда я начинал программировать с самого низкого уровня. Так было и с алгоритмом рисования линии Брезенхема, затенением по Фонгу или Гуро — когда изучал компьютерную графику, и с созданием простой нейросети, реализацией метода опорных векторов или генетического алгоритма— когда глубже погружался в ИИ. Потом я долго перебарывал себя: не хотел пользоваться готовыми библиотеками и старался написать всё своё с нуля.

Профессиональные задачи. Искусственный интеллект стал довольно универсальной технологией. За последние несколько лет с помощью ML или Software Engineering я вместе с коллегами делал очень разные задачи:

Сейчас я определяю слабые и сильные стороны моделей и сервисов на базе искусственного интеллекта. Это помогает выбрать, какие из них подходят под конкретную бизнес-задачу.

Планы на будущее. Что планирую делать дальше? Буду применять свои наработанные навыки в сферах медицины и биологии, изучать «психологию» естественных и искусственных сложных систем, пытаться создать ИИ-ученого или, как минимум, ассистента, чтобы повысить свою эффективность. Планирую также освоить несколько новых для себя языков программирования: Rust, Swift, Kotlin, Julia или Elixir. А также попробую сделать больше «железных» проектов с искусственным интеллектом на базе Jetson Nano, Google Edge TPU или с FPGA.

специалист по искусственному интеллекту и машинному обучению. Смотреть фото специалист по искусственному интеллекту и машинному обучению. Смотреть картинку специалист по искусственному интеллекту и машинному обучению. Картинка про специалист по искусственному интеллекту и машинному обучению. Фото специалист по искусственному интеллекту и машинному обучению

Дмитрий Коробченко, Deep Learning R&D Engineer and Manager, NVIDIA

Руководитель R&D группы, занимается обработкой изображений: применением нейросетей для обработки изображений, компьютерной графики, анимации и физической симуляции.

Начало пути. Во время учёбы в университете я увлекался компьютерным зрением и поэтому решил вступить в Лабораторию компьютерной графики и мультимедиа на факультете вычислительной математики и кибернетики МГУ.

Работая в Samsung после университета, я вернулся к компьютерному зрению: одним из первых моих проектов стал анализ медицинских изображений с применением свёрточных нейронных сетей. А когда в 2012 году нейронные сети активно распространились и на другие области, спектр моих проектов значительно расширился.

Профессиональные задачи. Будучи Deep Learning R&D Engineer, я занимаюсь как исследованиями, так и разработкой: от создания новых алгоритмов и проведения различных экспериментов до реализации конечных продуктов с последующей оптимизацией. Кроме того, последние несколько лет я выступаю с мастер-классами и являюсь преподавателем на курсах по машинному обучению и нейронным сетям в различных школах дополнительного образования.

Сейчас большинство моих задач связаны со сложными типами данных — изображениями, звуками, полигональными моделями, тензорные данными и так далее. В том числе я продолжаю заниматься компьютерным зрением: классификацией изображений, детектированием объектов, семантической сегментацией; создаю нейросетевые фреймворки.

Планы на будущее. В моих ближайших планах усилить R&D группу, специализирующуюся на нейронных сетях в московском офисе NVIDIA, а также продолжить развиваться в образовательной сфере в области искусственного интеллекта: делать контент для лекций, курсов и личного YouTube-канала.

специалист по искусственному интеллекту и машинному обучению. Смотреть фото специалист по искусственному интеллекту и машинному обучению. Смотреть картинку специалист по искусственному интеллекту и машинному обучению. Картинка про специалист по искусственному интеллекту и машинному обучению. Фото специалист по искусственному интеллекту и машинному обучению

Машинное обучение

«На заре 2000-х термина Data Scientist не существовало, но по сути я занималась именно этим»

Анна Костикова, Director Data Science and Bioinformatics в Novartis

Руководит командой, в задачи которой входит создание персонализированной медицины при разработке новых лекарств. Суть работы группы заключается в том, что лекарства разрабатываются и подбираются на основе анализа цифровой информации о ДНК, белках и клинических данных пациентов. Для этого Анна и её команда используют машинное обучение, биоинформатику и статистику.

специалист по искусственному интеллекту и машинному обучению. Смотреть фото специалист по искусственному интеллекту и машинному обучению. Смотреть картинку специалист по искусственному интеллекту и машинному обучению. Картинка про специалист по искусственному интеллекту и машинному обучению. Фото специалист по искусственному интеллекту и машинному обучению

Начало пути. На заре 2000-х термина Data Scientist не существовало, но по сути я занималась именно этим. Например, в университете я нашла подработку, где должна была собрать данные для базы данных, придумать структуру и сделать так, чтобы с базой можно было работать. Всё это я делала в MS Access на компьютере с 512 Мб оперативный памяти и 1 Гб места на жестком диске 🙂

На третьем курсе я устроилась на стажировку в некоммерческую компанию, где занимались анализом космических снимков. Именно тогда я впервые попробовала применить нейронные сети, классификацию без обучения и с ним, fuzzy logic и так далее. Тогда компьютеры с 4 гигабайтами оперативной памяти были сравнимы чуду, и мы не выключали их на выходные — чтобы они «досчитывали», пока мы отдыхали.

Первые трудности. Впервые работа с официальным «титулом» Data Scientist появилась у меня в 2014 году. Тогда я устроилась в Booking.com и узнала, каково работать в этой сфере в промышленных масштабах: с выборками данных в миллиарды строк.

В любой области первые два года самые сложные: вся терминология для тебя новая, непонятно, что важно, а что нет.

Обучение новому — это всегда сигмоидная функция: надо преодолеть первое плато, когда кажется, что ты никогда не разберешься. Например, в аспирантуре в Швейцарии мне нужно было научиться анализировать геномные данные и написать скрипт на Perl для масштабного анализа. На тот момент я ничего из этого не знала, но как-то выкрутилась. Главное — не бояться и пробовать.

Профессиональные задачи. В моей практике было очень много разных задач: от анализа космических снимков для WWF до оптимизации процесса пивоварения в Heineken, от предсказания поведения пользователей в интернете для Booking.com до предсказания работы лекарств в Novartis.

Сейчас я работаю директором по анализу данных и биоинформатики в Novartis. Еще у меня своя компания в области диагностики рака. Я бы очень хотела максимально использовать Data Science и машинное обучение для здравоохранения и медицины — от разработки лекарств до диагностики. Я верю, что следующие 20 – 50 лет львиная доля усилий аналитиков во всем мире будет направлена на решение именно биомедицинских задач, изменение качества жизни человечества, а не только на оптимизацию в интернете и на производстве.

специалист по искусственному интеллекту и машинному обучению. Смотреть фото специалист по искусственному интеллекту и машинному обучению. Смотреть картинку специалист по искусственному интеллекту и машинному обучению. Картинка про специалист по искусственному интеллекту и машинному обучению. Фото специалист по искусственному интеллекту и машинному обучению

«Тогда я был уверен, что уже знаю всё, хотя ещё вообще ничего не знал»

Никита Семенов, NLP team lead, центр искусственного интеллекта МТС

Руководит командами NLP и занимается всем, что связано с обработкой и пониманием естественного языка.

специалист по искусственному интеллекту и машинному обучению. Смотреть фото специалист по искусственному интеллекту и машинному обучению. Смотреть картинку специалист по искусственному интеллекту и машинному обучению. Картинка про специалист по искусственному интеллекту и машинному обучению. Фото специалист по искусственному интеллекту и машинному обучению

Начало пути. Ещё на первых курсах института я начал факультативно изучать машинное обучение: учился по специальности «Компьютерная безопасность», но постепенно понял, что не хотел бы связать с ней свою жизнь. Мой научный руководитель закончил Миланский политех по программе Computer Science, и с ним мы начали развивать факультативный курс по машинному обучению. Подобного термина тогда не существовало, и во всём мире говорили только об элементах статического обучения, которые мы и изучали. К сожалению, в России до сих пор нет подобных программ по Computer Science.

Найти работу после вуза именно по профилю машинного обучения было крайне сложно — сфера только зарождалась. Поэтому я вышел в небольшой стартап, который занимался автоматизацией ставок на сайтах контекстной рекламы по типу Google AdWords. Моей первой задачей было разработать механизм исходя из статистики и предиктивной способности цели таким образом, чтобы мы всегда занимали не первую ставку, а вторую или третью — эти строки тоже показывают в топе выдачи, но они значительно дешевле. Тогда я был уверен, что уже знаю всё, хотя ещё вообще ничего не знал.

Первые трудности. Для меня большую трудность составляли софт-скиллы: нужно было объяснить, чем я занимаюсь, что это всё значит, как и что интерпретировать, и какой будет эффект, людям, которые вообще ничего не понимали в моей сфере. Тогда процессы взаимного обучения ещё не были мейнстримом, поэтому взаимодействовать с командой было очень сложно. Я постоянно практиковался: пробовал доносить свои мысли и объяснять команде даже самые простые метрики. Думаю, если бы сейчас я только начинал свою карьеру, то не смог бы так сильно прокачаться в общении — подобные вопросы уже практически никто не задает.

С хард-скиллами проблем не было: тогда мои задачи опирались на статистическое обучение и математику, в которых я хорошо разбирался. Несмотря на это, я всё равно читал книги: в Data Sience нужно постоянно развиваться, чтобы разбираться в инструментах и трендах. Вообще, весь мой опыт работы — это один большой челлендж. Каждое место требовало новых инструментов и знаний, поэтому развиваться самостоятельно приходилось всегда.

После работы в стартапе была компания, где я стал первым Data Scientist и R&D: помогал настраивать первые инструменты аналитики, занимался компьютерным зрением и построением предиктивных моделей на основе данных с космических спутников.

Профессиональные задачи. В МТС я пришел на позицию Senior computer vision engineer, а потом дорос до тимлида двух команд. Мне особенно важно прокачивать soft-скиллы, ведь тимлид — это играющий тренер. Если говорить о задачах, то здесь я занимаюсь всем, что связано с обработкой и пониманием естественного языка. Сейчас это уже своеобразный тренд, который задаёт новые тренды, направленные на упрощение жизни человека в будущем.

Со временем я понял, что предметная область не так сильно влияет на область твоих знаний. В моем случае предметная область всегда затрагивает то, как обработать и применить данные к какому-либо решению. А подходы всегда остаются одинаковыми. И когда в предметной области специалисты придумывают инновационное решение, например, в компьютерном знании, со временем оно перетекает в другие области. В связи с этим грань между областями постепенно стирается, а подходы и базы становятся похожи.

Главная проблема нашей сферы заключается в том, что она развивается очень неравномерно. Приведу пример: в Data Science долгое время всё может быть спокойно, а потом кто-то резко придумывает решение, и через короткое время эти прорывные вещи становятся стандартом для всех. В плане работы это и хорошо, и плохо одновременно: с одной стороны, ты постоянно прокачиваешь скиллы и «бежишь» в 10 раз быстрее, чем остальные, с другой стороны, твой профиль работы постоянно меняется.

Планы на будущее. Пока у меня нет понимания, в каких сферах я хочу развиваться дальше. Мне хочется ещё больше погрузиться в то, чем я занимаюсь сейчас.

На YouTube-канале Нетологии рассказали об ошибках искусственного интеллекта и главных проблемах, связанных с его применением.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *