Два месяца пользователи активно обсуждают голосового помощника Алису, которую запустил Яндекс. Корреспондент Сиб.фм поговорил с руководителем офиса разработки Яндекса в Новосибирске Сергеем Бражником о её особенностях, эффективных трендах в разработке, а также о будущем, в котором вся рутина достанется машинам, а люди будут заниматься созидательной деятельностью.
Последние два месяца по всей стране многие люди активно осваивают нового помощника, которого запустил Яндекс. Что тебе нравится в Алисе?
В Алисе мне нравится то, что с ней можно разговаривать и что у неё есть характер. На это мы сделали ставку. Хочется, чтобы в дальнейшем это был устоявшийся человек. Пока же Алиса может сбиваться и иногда переходить в мужской или даже средний род, например. Это о том, что нужно доделывать. Но в целом у неё всё очень хорошо получается.
Это не обидчивая Сири, Алиса умеет и постоять за себя. В моём представлении. Но у каждого своё.
Алиса — первый в мире виртуальный ассистент, который не ограничивается набором заранее заданных ответных реплик
Важно, чтобы с Алисой разговаривали, причём в двух направлениях. Первое — это непосредственно функции голосового помощника, когда люди спрашивают какие-то факты, просят что-то сделать, например, подсказать интересное место поблизости. Второе — это способ проводить время, когда людям нравится общаться с Алисой. Часто людям хочется чего-то жареного, поэтому Алису постоянно провоцируют на довольно колкие и острые моменты. Это история вполне нормальная, только нужен некоторый баланс, чтобы была возможность, с одной стороны, поддержать беседу и эту колкость оставить, а с другой — чтобы эти ответы никого не затрагивали, не были обидными и не приводили ни к чему плохому.
Идёт очень большой поток информации от пользователей, потому что у нас есть возможность пометить каждый ответ Алисы — понравилось или не понравилось. Эти данные используются для анализа того, как она себя ведёт, и для улучшения. Я думаю, что Алиса — это серьёзный шаг в будущее, в котором мы всё меньше будем касаться телефона и всё больше использовать свой голос. Общаться с сервисами и в конечном итоге с роботами.
14 офисов Яндекса работают по всему миру
Команда, работающая над Алисой, большая?
Алиса — это продукт межсервисного взаимодействия: и Поиск, и Браузер, и диалоговая система, и большая команда голосовой технологии SpeechKit. Это ребята, которые умеют, с одной стороны, распознавать голосовые команды от пользователя, например: «Слушай, Алиса!» С другой — синтезировать голос. В основе лежит голос актёра — в данном случае актрисы Татьяны Шитовой, которая в русскоязычном прокате озвучивает Скарлетт Йоханссон. Есть большой корпус слов, который актёр наговорил, но потом их нужно правильно сочетать, склонять и синтезировать из них другие слова. В этом проекте много интеграций уже сейчас: можно, например, запустить музыку — «Алиса, поставь мне «We Will Rock You» Queen». Она найдёт и запустит Яндекс.Музыку. Только для этого приложение должно быть установлено. В будущем, будем надеяться, появится интеграция всех наших сервисов с инфраструктурой телефона.
А не по работе в каких случаях ты пользуешься помощью Алисы?
Я использую её для того, чтобы спрашивать разные факты. Последнее, например, про разные болезни. У меня устали глаза, поэтому я интересовался болезнями глаз. А вообще мы с дочками балуемся — спрашиваем Алису про всякие штуки. Так как девчонки у меня небольшие — шесть и десять лет, — они воспринимают её как человека, особенно младшая хочет с ней болтать. Алиса понимает, конечно же, только половину из того, о чём с ней болтают, и иногда получается довольно весело.
Вообще наши семейные кейсы чаще всего связаны со сказками, песнями и шутками, которые хочется послушать. Алисе здесь есть куда расти.
В частности, у неё сказки довольно-таки взрослые. Я думаю, над этим мы тоже поработаем:
они станут более мягкими, шелковистыми —
специально для детей.
В процессе беседы двух Алис друг с другом одна посоветовала другой выброситься в окно
В Новосибирске пока никто из разработчиков не занимается Алисой?
Да, Алисой полностью занимается команда в Москве и немного в Минске. В Новосибирске ребята занимаются инструментами машинного обучения. И Алиса, и наш Поиск, и рекомендации в Музыке, да и другие наши сервисы — всё это построено на каких-то инструментах машинного обучения. Поэтому у нас есть группа, которая занимается разработкой и сопровождением этих инструментов. Публично известным инструментом является MatrixNet, на основе которого работает, в частности, Поиск. И пришедший ему на замену CatBoost, который мы выложили в открытый доступ в июле 2017 года. Поэтому в Новосибирске ребята вместе с командой из Москвы разрабатывают дальше CatBoost, поддерживают MatrixNet и постепенно внутри делают переход с одного на другой.
Но вообще в Яндексе в плане карьеры нет границ в деятельности: можно периодически переходить от департамента к департаменту, менять проекты. Чтобы ты влился в команду, принёс пользу и потом, возможно, сказал: «Ну всё, ребята, я хочу чего-то нового». Поэтому любой человек, который знает, как помочь, может, например, прийти в команду Алисы. Рук всегда не хватает. Команды постоянно расширяются, и все наши вакансии есть в открытом доступе. В принципе в сфере IT всегда есть множество проектов, которые, можно сказать, лежат на полу.
Нужно просто взять и запустить, получить профит.
Либо это просто опыт, либо деньги.
Так что у нас есть понятие внутреннего найма и ротации. Я тоже сам себя ротировал. Получается, первый год я занимался развитием новосибирского офиса, а потом — развитием всех региональных офисов разработки. Екатеринбург, Нижний Новгород, Симферополь, частично Санкт-Петербург, Иннополис, Минск. Моей задачей был рост офисов и увеличение количества разработчиков в регионах. Вскоре понял, что организовывать и растить умею, но мне хочется заниматься ещё и программированием, из которого я изначально и пришёл. Захотел вернуться к корням, к истокам. И у меня получилось.
В 1950 году Алан Тьюринг разработал тест с целью определить, может ли машина мыслить
Сейчас я всё региональное управление отдал коллегам, эйчарам, а сам руковожу новосибирским офисом и с августа являюсь менеджером команды, работающей над инструментами машинного обучения. Пишу код, как и хотел. У меня есть возможность подумать, а не проводить время в постоянном планировании, синхронизации — стратегических вещах. Это круто, я к этому вернусь. А пока хочу принести другую пользу.
Расскажи, пожалуйста, подробнее, чем отличаются друг от друга инструменты машинного обучения — MatrixNet и пришедший ему на замену CatBoost?
MatrixNet — наша рабочая лошадка, которая выручала в течение десяти лет. Это проверенный алгоритм, который работает очень хорошо. Но не надо стоять на месте, всё-таки программирование всегда находится рядом с наукой, с академическими работами, которые улучшают качество и алгоритмов, и прогнозов, и машинного обучения.
Все базовые алгоритмы на самом деле придуманы в 60-х—70-х годах. Их не старались совершенствовать в теории, потому что на практике было сложно исполнить из-за недостаточной мощности компьютеров. Например, новая версия алгоритма даст плюс пять процентов к точности предсказания. Но для того чтобы этот алгоритм запустить, нам потребуется, допустим, ещё сто серверов. А это очень большие затраты!
Был такой подход: «Ой, как много, мы пока этим не будем заниматься, потому что сервера дорогие».
А сейчас сто серверов для средних и больших компаний — не такая большая проблема, зато пять процентов качества — отличный показатель и конкурентное преимущество.
CatBoost — это новый виток MatrixNet: у него выше качество, точность и более широкий инструментарий. В какой-то момент мы решили поделиться нашей разработкой с миром — программистами и исследователями в области машинного обучения. Мы используем CatBoost для себя, внутри, поэтому понимаем, в чём его неудобство и стараемся сделать его лучше. Кстати, беда многих стартапов, которые погорели, как раз в том, что они сами не пользуются своими разработками, думают, что знают поведение аудитории, а на самом деле всё иначе, не так, как представляли.
Нужно всё посмотреть на практике?
Безусловно. Например, у нас в Яндекс.Картах есть разговорчики — возможность написать какой-то комментарий, который будет сопровождать геометку. Казалось бы, простая история, а по большому счёту это дорожная социальная сеть. В Москве это прям способ общения людей, которые постоянно стоят в пробках.
Даже разработчики Навигатора и Карт, непосредственные пользователи своих продуктов, не предполагали, что такая небольшая фича может использоваться как настоящая соцсеть.
Это положительный пример.
Подобные сервисы вы запускаете не только в России, но и за рубежом?
Мы экспериментируем в разных странах с небольшими сервисами, уже не поисковыми. Например, в Финляндии запустили Яндекс.Транспорт. Интернациональный продукт — персональная лента рекомендаций Яндекс.Дзен. Её можно назвать «Фейсбуком» наоборот.
Если в «Фейсбуке» ты видишь то, что публикуют твои друзья, и то, что интересно им, то Дзен — то, что интересно тебе.
В Яндексе есть фича: если набрать любой запрос и нажать Enter, а потом удалить запрос, то появятся близкие к нему запросы
Он собирается с истории твоих просмотров других сайтов, но каждый раз тебе подмешивается что-то новое, чтобы интерес не пропадал.
Ещё у нас есть интересная история, связанная с Турцией. В какой-то момент мы решили, что нужно попробовать сделать поиск для людей с неславянским языком, потому что турецкий совсем другой. Он не похож ни на английский, ни на русский. Этот эксперимент длился довольно долго: мы запустили Турцию уже больше шести лет назад, потратили довольно много денег, но получили интересный опыт с точки зрения качества продукта. Хороший результат выдачи — лучше, чем у Google, который является там основным конкурентом.
Но мы столкнулись с тем, что люди привыкают к чему-то. Если у тебя продукт чуть-чуть лучше, на 5-10 %, то это не сильно значимый плюс для того, чтобы с уже давно используемого конкурента перешли на тебя. Зато в Турции мы считаемся геосервисной компанией: зашли на рынок и принесли свои геосервисы.
Поэтому любой турок знает, что такое Яндекс.Навигатор и Яндекс.Карты.
И Google с этим уже ничего не может поделать.
Даже сейчас, когда они значительно подтянули качество своего продукта.
Яндекс и Google — лидирующие в рунете по популярности поисковики
Вообще мировых поисковых компаний не так много (Google, Miсrosoft Bing, Yahoo), а дальше остаются локальные, которые хорошо локализованы и понимают свой рынок, например Baidu в Китае, Naver в Южной Корее и Яндекс в России. И, собственно говоря, где ничего своего нет — есть Google.
Основной поисковый рынок Яндекса — это, конечно, Россия. И ближайшее русскоговорящее зарубежье: нам интересны рынки Белоруссии, Казахстана, других постсоветских республик.
Яндекс, в частности, в Академгородке интересует зарубежные медиа, например, недавно у вас брали интервью немцы. Они хотели сделать сюжет об Академгородке как о сибирской Кремниевой долине. Чем, на твой взгляд, Академгородок притягивает иностранцев?
— Академгородок — это научный кампус,
аналогов которому в России не так уж много.
Зеленоград и какие-то ещё закрытые города, как правило, имели образовательную базу (в нашем случае это университет) и научные институты, которые являлись заказчиками. Раньше каждая лаборатория института имела свою кафедру в университете. Этот подход с наступлением 90-х годов, конечно, поменялся.
В Академгородке сильная научная и инженерная база. Сейчас, кроме институтов, есть ещё IT-компании и бизнес в целом. Надо заметить, что в какой-то момент произошёл некоторый дисбаланс, потому что бизнес чаще всего преподавать не желает, а нанимать хочет. Яндекс, в частности, выделяется тем, что мы любим как раз и преподавать тоже. У нас есть глобальная программа — Школа анализа данных. Рассказываем и учим важным вещам о машинном обучении и анализе данных — эти темы сейчас «на волне» общего интереса. В Новосибирске Школа анализа данных существует, как направление в Computer Science Center, который мы развиваем совместно с компанией JetBrains на базе НГУ.
Хорошо, что есть технопарк. Всем хочется здесь открыть свой офис, от этого бизнес становится всё конкурентнее. Тем не менее всё новые и новые игроки приходят. Зарплата у айтишников от этого понемногу растёт, быть программистом всё ещё модно. Лет десять назад мода началась и, думаю, ещё продлится десяток-другой лет.
Если школьникам сейчас нравится математика, информатика, то многие выбирают программирование в качестве будущей профессии. Это правильно.
Ты следишь за сферой IT много лет: есть примеры чего-то, что тебе когда-то казалось далёким будущим, но уже воплотилось?
Когда я учился в Высшем колледже информатики, у меня появился персональный компьютер. Конечно же, родители на нём работали, но я тоже мог что-то делать. Тренировался — ставил программы, которые распознавали голос. У меня была идея фикс — управлять компьютером с помощью голоса: включись, выключись, запусти Office или Turbo Pascal, на котором программировал. И чтобы он меня понимал и соответственно работал. Но в то время, к сожалению, мощности компьютеров не хватало на то, чтобы понимать голос, кроме нескольких фраз. Он мог обычно уловить простые слова, причём на английском: yes, no, open, поэтому Open Office понимал. А всё остальное, например «Скажи, сколько сейчас времени?», было из разряда фантастики.
Это было больше двадцати лет назад. За это время очень сильно развились технологии: сейчас алгоритмы легко могут распознать, что говорит человек, проанализировать, как-то отреагировать. Кроме того, мне всегда было интересно, как сделать так, чтобы машина поехала сама. Я, начиная со школьной скамьи, когда учился ездить за рулём, интересовался, почему у нас роботы ещё не ездят, не управляют машинами? А сейчас, опять же, и мощности, и технологии подошли к тому, что мы экспериментируем с этим.
В подразделении Яндекс.Такси есть ребята, которые занимаются такими «самоездящими машинками» — беспилотниками. На 20-летие Яндекса приезжал президент Владимир Путин: мы ему показывали, как машина сама поехала. Перед застеклённым подъездом она вовремя остановилась, сама развернулась и приехала обратно.
В общем, действительно, машины сейчас умные, сами ездят, а водители нужны скорее из соображений страховки — мало ли что.
Toyota Prius+ стала основой для беспилотного автомобиля Яндекса
Я думаю, на нашем веку они поедут полностью самостоятельно. Будем садиться уже в такое такси. Может быть, это и останется «седан баклажан», но уже без весёлого таксиста внутри, ну или он станет виртуальным.
Сейчас много говорится вообще о машинном интеллекте. Что больше относится к области настоящего, а что к области будущего, которое вы считаете наиболее реальным?
Сейчас машины отлично умеют решать узкие задачи, которые требуют специализации. Вождение, распознавание речи — всё это можно сделать с помощью искусственного интеллекта. Ещё, например, возможно распознавание рака по клеткам крови. В медицине существуют специалисты в лабораториях, которые всматриваются в мазок крови и ищут что-то несвойственное. Алгоритмы могут решать такие задачи лучше, чем человек, потому что алгоритм может «увидеть» миллионы мазков и потом принимать решение, а человек за всю свою жизнь столько не увидит.
Таких сфер, где эффективнее использовать не человеческие ресурсы, а машинный интеллект, будет становиться всё больше, но это не значит, что скоро программы заменят человека.
Их применение очень точечное, так что
восстание машин пока только в фильмах.
Другое дело, что многие машинные алгоритмы нужно использовать с оглядкой на то, что они практически все работают с обобщениями. Например, скоринговая система в банках принимает решение выдать кредит на основе информации о клиенте. Учитываются такие данные, как официальный доход, что есть в собственности, семейное положение, работает ли супруг или супруга, сколько детей и так далее. Это алгоритм принятия решения.
Конечно, чем человек состоятельнее, тем с большей долей вероятности он получит кредит. Но всегда бывают какие-то крайние случаи, когда человек легко вернёт деньги, ему они нужны ненадолго, например, перекредитоваться. А алгоритм будет считать, что он несостоятельный. Такое тоже бывает. И про это стоит помнить.
Если людей начинают по их анкетным данным — пол, возраст, место рождения, национальность — классифицировать, то, с одной стороны, это хорошо. Делается для полезных целей, допустим, для выявления потенциальных нарушителей правопорядка. Но с другой стороны, все такие данные — это обобщение большого объёма информации, а конкретный случай конкретного человека может туда не попадать. Тогда его могут обвинить в чём-то, хотя это не так. Поэтому такие морально-этические моменты в машинном обучении уже являются реалиями нашей жизни: нужно аккуратнее обращаться с информацией.
Какие сейчас самые распространённые тренды в сфере разработки?
Если говорить прям о хайпе, то это блокчейн. Но в Яндексе мы им не занимаемся. Это не технология, а скорее инструмент. В тренде сейчас, конечно, машинное обучение и всё, что с ним связано.
Какая функция кажется тебе настоящей магией?
У приложения Яндекса есть замечательная функция — поиск похожих картинок. Приложение фотографирует, например, твой диктофон. И тут же Яндекс ищет и предлагает картинки всего, что похоже на этот диктофон, причём картинки могут быть даже не подписаны, то есть наш искусственный интеллект понимает, что на них изображено.
Это магия — сфотографировал и узнал,
что это такое.
Компания Apple выпустила iPhone X c технологией FaceID, когда у тебя телефон разблокируется по взгляду, по форме лица. Тоже очень круто!
Мы поговорили о том, что казалось тебе далёким будущим двадцать лет назад и осуществилось сейчас. А чего пока у нас нет, но тебе бы хотелось, чтобы это появилось?
Я не верю, что в ближайшей перспективе — десяток лет — машинное обучение создаст полноценный искусственный разум. Что машина себя осознает: сначала появится Скайнет, потом будет у нас матрица. Всё не понимаю, почему не сошьют два этих фильма. Одно в другое логично перетекает. Для того чтобы машина получила сознание, ещё очень много нужно сделать. И это на самом деле не требуется. Машина должна хорошо решать какие-то определённые задачи, думать глобально ей не надо.
Есть человек, который должен думать.
Машина — лишь помощник.
Неважно, определяем ли мы наличие рака в крови или сортируем почту. Именно поэтому я надеюсь, что в нашей жизни будет всё больше и больше применения машинного обучения.
Пусть уже машины сами поедут — и с экономической точки зрения, и экологической. Чтобы по всему городу была хорошая логистика и мы не гоняли по одной машинке на одного человека.
Чтобы можно было в будущем вообще не иметь машины: всегда — вышел, сел в такси и поехал. Конечно, пока телепорт не изобрели.
Бывший инженер Uber Энтони Левандовски в 2017 году основал церковь искусственного интеллекта «Путь будущего»
Чтобы не париться с тем, что нужно помыть или переобуть машину. При этом параллельно в пути поговорил со своим голосовым другом, попросил настроить свой умный дом, чтобы, когда ты приехал, были подогреты тосты, куплена колбаса, например, и чайник вскипел.
Хочется, чтобы мы пришли к чему-то такому: человек занимался бы какой-то созидательной деятельностью, а машины ему в этом помогали. То есть такие неинтересные вещи, как покупка продуктов питания, можно было бы автоматизировать. Всю рутину — машинам. К этому нужно стремиться. В Яндексе мы для этого довольно много прилагаем усилий. Всё, что я рассказал, надеюсь, произойдёт постепенно, не будет взрывом. Система «умный дом» начинает распространяться. Всё будет появляться понемногу и накручиваться, как снежный ком.
Конечно, сейчас я понимаю, что мои попытки общаться с компьютером двадцать лет назад были смешными. Но за эти годы произошёл громадный скачок. Я верю, что в ближайшие 10-20 лет будет множество улучшений и изменений в нашей жизни. Мы будем всем этим пользоваться. В некотором смысле у нас будут расти аппетиты в этой сфере. Будем все нововведения воспринимать органично. Мало кто будет рефлексировать, что 30 лет назад про это вообще думать нельзя было.
В общем, я футурист, который исключительно прагматичен: роботы должны помогать людям. А мы должны созидательно обобщать всё, что происходит вокруг, делать мир лучше. В конце концов, мы же, наверное, здесь за этим.