На фестивале науки EUREKA!FEST в начале октября выступил аналитик Яндекса Иван Ямщиков, отвечающий за исследование новых продуктов. Иван поделился с аудиторией собственными размышлениями относительно технологий, рассказав, насколько иногда просто из двух разработок придумать третью. Корреспондент Сиб.фм поговорил с Иваном Ямщиковым о сравнении двух систем образования — российской и европейской, о машинном обучении, расцвете нейронных сетей и пользе конкуренции в технологиях.
Справка
Родился в 1987 году в Ленинграде. Магистр математической физики (физический факультет Санкт-Петербургского государственного университета) и финансовой математики (университет Хальмстад, Швеция). Защитил кандидатскую диссертацию в техническом университете Котбуса, ФРГ. Работает в «Яндексе» с 2011 года.
Участвовал в запуске проекта «Яндекс.Старт» и сервиса «Яндекс.Радио», соавтор проекта «Нейронная оборона». Хорошо разбирается в математическом моделировании, построении прогнозов, сегментации, менеджменте исследовательских команд.
«Когда выступаешь в таком академическом центре, как НГУ, хочется, чтобы ребята, занимающиеся обучением и наукой, чувствовали себя увереннее и воспринимали технологии не как святой Грааль, а как инструмент для целей, и в идеале строили новые бизнесы и продукты и относились к ним без лишнего пиетета», — так объяснил Иван суть своего выступления на наукофесте. Сам он, во многом благодаря обучению в высших школах трёх стран — России, Швеции и ФРГ — получил необходимую базу для дальнейшего совершенствования личных навыков и умений в профессии. Иван подчёркивает, что хороший специалист не может сказать, что чему-то научился — он учится всё время, теряя бесполезные навыки и приобретая новые, что понадобятся завтра.
«В отрасли не хватает умных ребят»
Иван, существует мнение, что советская высшая школа была превосходной. Но почему наши сегодняшние выпускники, много чего хорошего взявшей от советской системы образования, не в состоянии выдать продукт, не имеющий аналогов? Имею в виду рынок гаджетов и электронных девайсов.
Следует понимать, что рынок железа сильно завязан на Китае — если посмотреть, в мире не так много производителей смартфонов, которые были бы не китайскими. Есть, например американский Apple, который разрабатывает идеи в США и производит продукт в Китае. Есть корейский Samsung, чьи разработчики сидят в Китае и Корее, а производство — только в Китае. Далее, все крупные игроки целиком китайские. Этот рынок вообще специфический, и я бы по нему не судил об инновационности экономики. На мой взгляд, в российской системе образования есть один изъян: нас учат много чему, но не учат делать конкретный продукт.
В чём причина?
Да как раз в том, о чём был предыдущий вопрос. Да, во многом это образование — наследник советского, которое не ставило перед собой целью эффективность бизнеса. Советскому учёному не требовалось думать об окупаемости, тогда акцент ставился на чистую науку. У инженера акцент на бизнес-применение был ещё меньше.
Наверное, тогда даже слово «бизнес» мало кто знал.
Так вот, процесс перестройки образования на более практичные рельсы идёт медленно, поэтому от IT-компаний требуется помощь. Например, Яндекс реализует несколько образовательных проектов совместно с вузами, где акцент делается на сферу технологий, управление проектами, создание собственных стартапов.
Чувствуешь ли ты отдачу от таких проектов как аналитик?
Отдача ощутима, потому что на технологическом рынке в России — высокая конкуренция.
Ведь у нас в стране — своя почта, свой поиск, своя социальная сеть. И мы конкурируем по этим направлениям с международными игроками.
Потому имеется постоянный дефицит умных людей, и технологические компании пытаются восполнить этот дефицит за счёт образовательных программ. Чтобы было больше умных, квалифицированных ребят, которые помогали бы делать новые продукты и усовершенствовать старые.
Возвращаясь к предыдущему вопросу. Россия уже 25 лет живёт в рыночной экономике, так почему наше образование не может толком перестроиться для выпуска специалистов под имеющиеся нужды?
Повторюсь, это очень медленный процесс. Образование — это бюрократическая система, связанная с большим количеством регуляций. И это очень инертная и медленная область, где некоторые факультеты и университеты бегут быстрее и становятся современными, а другие не готовы меняться по целому ряду причин. В первую очередь, это отсутствие конкуренции. Вторая проблема — это квалификация кадров: чтобы проводить изменения, нужны толковые администраторы, а у не всех вузов есть средства для найма таких специалистов. Это понятные ограничители, и нужно время, чтобы дела начали обстоять лучше.
«Машина не запоминает опыт, это делают люди»
Из чего сегодня состоит твоя работа в «Яндексе»?
Занимаюсь поиском новых проектов, связанных с машинным обучением, и последующим созданием продуктов, которые делают жизнь интереснее и удобнее. В самом широком смысле: есть набор данных, и есть алгоритм, который улучшает метрику. Вы пытаетесь научить машину отличать, к примеру, красные ягоды от зелёных на фотографиях. И у вас есть некий алгоритм. И вы говорите компьютеру, что «верно» или «неверно», когда идёт сравнение, и он постепенно учится и делает процесс всё лучше и лучше. Но это слишком упрощённый пример.
С точки зрения машинного обучения, есть ли некая цель, к которой ты стремишься?
Это очень абстрактный вопрос.
Машинное обучение — это инструмент, как молоток или гвоздь. С точки зрения гвоздя, есть ли некая цель у плотника?
Она, конечно, есть, но в каждый момент своя. В какой-то это крыша, потом табурет, потом шкаф. Если бы я занимался научной частью, то тогда вопрос был бы оправдан, потому что учёные пытаются усовершенствовать инструмент, создают улучшенный алгоритм для быстрого решения тех или иных задач. Фактически они создают более острые гвозди и молотки, потяжелее. Но я не занимаюсь разработкой непосредственно инструментов — я применяю эти инструменты к разным задачам.
Машина запоминает наработанный опыт изготовления табуретки и использует, когда на повестке стоит крыша?
9 387 тысяч тонн стали произведено Магнитогорским металлургическим комбинатом за 9 месяцев 2016 года. В 2015 году группой ММК произведено 12,2 млн тонн стали и 11,2 млн тонн товарной металлопродукции
Мы продолжаем уходить в высокий уровень абстракции. Но я отвечу на вопрос. Есть пример сотрудничества «Яндекса», конкретно компании Yandex Data Factory и Магнитогорского металлургического комбината (ММК). Предприятие анализирует состав стали в печах, и наш алгоритм быстро даёт рекомендации об использовании тех или иных сплавов, чтобы получилась сталь разной прочности — таким образом, происходит экономия средств около 250 млн рублей в год. Этот алгоритм взят из интернета, он был разработан для получения рекомендаций, исходя из анализа поведения пользователя. Потом оказалось, что алгоритм можно применять и для решения других задач. Я не могу сказать, что именно машина запомнила какой-то свой опыт в интернете и перенесла его в сталеплавильный цех, но можно сказать, что если есть алгоритм для решения задачи А, то можно придумать задачу Б, которая с виду к задаче А отношения не имеет, однако с алгоритмической точки зрения решается так же — и алгоритм будет использован.
«Нейросети перевернут мир»
Продолжая разговор про машинное обучение и искусственный интеллект. Тот факт, что нейросети стали определённым трендом в СМИ — это сделано искусственно или прогресс, в самом деле, дошёл до такой точки, что об этом все разом заговорили?
Нейросети были придуманы достаточно давно, но только сейчас появилось достаточное количество мощностей, чтобы за небольшие вложения получать интересные результаты. И вот эти интересные результаты привлекают внимание СМИ, и поэтому мы каждый месяц слышим о той или иной любопытной разработке. В этом есть и элемент моды, и объективный фактор крутой технологии, которая позволяет создавать интересные приложения. Будь то решение с переносом визуального стиля любого художника на фотографию или с переносом стиля написания поэзии на новые виды текста, стихотворного произведения.
Но саму технологию придумали не вчера, а 15-20 лет назад. Почему только недавно стали появляться продукты?
Это связано с развитием графических карт, которые первоначально позволяли быстрее обсчитывать графику в компьютерных «стрелялках». Специфика графической карты — в том, что она может выполнять несколько сложных действий и процессов параллельно. И это приводит к тому, что для ряда вычислительных задач графическая карта может быть эффективнее, чем центральный процессор. И по мере того как графические карты развивались, в чью-то голову пришла светлая мысль, что графические карты могут не только рисовать картинки, но и заниматься вычислениями. И с тех пор стал активно развиваться рынок графических карт. Дальше оказалось, что и нейронную сеть можно формировать на графической карте, потому что мощности графической карты позволяют это делать быстрее, эффективнее и дешевле, чем процессор. По мере того как эти кусочки паззла сложились в общую картину, люди стали использовать графические карты, чтобы на них тренировать нейросети. То есть сначала появляется технология для решения одной задачи, потом кто-то догадывается, что эту технологию можно использовать в новом контексте — в итоге пошёл бум нейросетей, потому что вычислительные мощности стали на порядок доступнее и энтузиасты со всего мира нет-нет, но посчитают что-то интересное.
Можно сказать, что технологический прогресс дошёл до некой точки кипения и стал появляться конкретный пар.
Я бы не сказал, что это кипение. Это скорее соль в воде при температуре, близкой к ста градусам: она вроде и не кипит, но если добавить соль, то закипит мгновенно. Мы взяли графические карты, довели до ста градусов, насыпали туда нейросети и получили пар в виде продуктов.
Тебе как специалисту, который придумывает новые проекты в Яндексе, какую идею хотелось бы воплотить?
Если бы я знал, чего хочу, то непременно сделал бы такой продукт. Когда сделаю — расскажу. И ты им воспользуешься. Поэтому мне трудно что-то ответить. Нейросети решают много задач по анализу данных, фото и видео. Они делают интересные вещи, когда нужно сымитировать деятельность человека в разных областях — например, написание текстов.
Не вижу смысла говорить о том, что хочу сделать. Надо делать, а не говорить.
«Когда польза очевидна, то бизнес ценный»
Хорошо, задам вопрос в другом ключе: из чего исходит Яндекс, когда начинает разработку своих продуктов?
Из того, насколько это может быть полезно людям. Любая компания, если она разумная, адекватная и ответственная, смотрит на окружающий мир и думает, чего бы интересного и полезного можно сделать. Чтобы людям жилось комфортнее, веселее, приятнее и удобнее. Если находится место, где можно сделать изменения, то компания начинает делать их. Яндекс — не исключение. Есть Яндекс.Маркет, где можно сравнить товары меж собой, выбрать тот, который подходит под тысячу параметров и заказать его домой. Есть Яндекс.Такси, где можно быть уверенным, что вам за известное время подадут автомобиль, он будет известной марки и понятного качества, и вы будете знать, сколько заплатите, причём вам необязательно иметь с собой наличность, потому что оплата по безналу. Есть Яндекс.Карты, которые решают вопрос навигации в крупных городах, есть Яндекс.Пробки, которые позволяют спланировать передвижение и успеть в театр на спектакль к нужному времени. Это всё — очень понятная и реальная польза для людей.
Но всё же изначально был некий субъективной фактор полезности, когда разработчики сели в кружок — и в результате мозгового штурма решили, что эта идея будет полезной?
А ты сам можешь придумать объективное определение пользы?
Только если оно имеет под собой социологическое исследование с большой долей репрезентативности.
Во-первых, это дорого, и, во-вторых, мы это тоже проводим, но в некоторых случаях всё и так очевидно. Например, оплата безналом — это польза, потому что это очень удобно — оплатить способом, который подходит конкретному клиенту из широкого набора возможных. Также совершенно очевидно, что заказать такси, если оно прибудет через пять минут, удобнее, чем со временем подачи в полчаса. Когда польза очевидна — в этом и есть ценность конкретного бизнеса или дела.
«Нашему пользователю реально повезло»
Если посмотреть на рынок IT-компаний, то у Яндекса конкуренция во всех отраслях.
— Это дисциплинирует, заставляет расставлять приоритеты и не расслабляться.
Есть такая старая русская поговорка про треск чубов у холопов в случае барской драки. Только в случае технологической конкуренции пользователю гораздо лучше, когда конкуренты за него дерутся. Как пример, заход Яндекса в Стамбул, где прежде Google не фиксировал пробки, словно их и не было, в результате на мостах в этом «миллионнике» были регулярные заторы. Получается, что российский пользователь, в хорошем смысле слова, избалован продуктами, а в подавляющем большинстве стран отсутствуют собственные социальные сети, системы поиска, почта, картографические сервисы, базы организаций в разных городах.
Тебя послушать, так создастся впечатление, что российскому пользователю просто-таки сказочно повезло, что он живёт в условиях конкурентоспособного рынка.
Трамвайная система Лейпцига является второй по величине в Германии после столичного берлинского трамвая
Самые простые примеры. Я жил в Германии, и там требовалось четыре недели, чтобы подключиться к интернету — от момента подачи заявки до прихода мастера. В России это можно сделать за один день. Потому что у нас конкуренция между провайдерами, а в Германии — монополия со стороны Kabel Deutschland. Другой пример — картография. В Лейпциге, который входит в топ-10 городов Германии, на Google Maps отсутствует схема движения городского транспорта. Там нельзя построить маршрут от дома до работы, потому что не индексируются трамваи. Нужно скачивать отдельное — замечу, не самое удобное — местное приложение.
Удивительные примеры — казалось бы, рыночная экономика на Западе значительно старше российской.
2,772 метра, согласно Ветхому Завету, составлял рост Голиафа — огромного филистимлянского воина, побеждённого молодым Давидом в поединке при помощи пращи
Дело не в рыночной экономике, а в обладании рядом ключевых технологий и компетенций. Дело и в старте в нужное время, и в последующем развитии. Сейчас выйти на рынок приложений очень сложно, потому что везде есть свой сильный и крупный игрок, и стартап столкнётся с ситуацией Давида и Голиафа, когда лидер отрасли приложит все усилия, чтобы новичок не смог развиться. Российский рынок был всегда большим, чтобы появились игроки для конкуренции с глобальными сервисами — самое интересное, что они смогли сформироваться в то же самое время, когда аналогичные сервисы формировались в мире, потому и получили большую аудиторию и большую долю рынка.
А какую роль ты отводишь себе, если принимать во внимание твою работу и твои выступления? Своеобразного Прометея, доводящего до людей те знания, которые вроде и известны, но не используются?
Не вижу никакой героической составляющей в своей деятельности. Я как физик по образованию знаю, что понимание принципов работы системы позволяет не заучивать наизусть множество разрозненных фактов. Вот и я пытаюсь понятным и простым языком рассказывать, как работают технологии, по каким принципам развивается технологическая экономика, чтобы люди чувствовали себя комфортно внутри нашего нового дивного мира. Мне кажется, это важная задача, потому что она полезна, как на неё ни посмотри.
Когда человек адекватно воспринимает технологии, он может принести больше пользы и себе, и окружающим.
Потому что технологии в основной массе направлены на упрощение и повышение эффективности жизни. Если победим технофобию у определённого процента населения, то сможем говорить, что этот процент будет эффективнее работать, лучше отдыхать и у него будет больше свободного времени.