«Вig data уже изменила мир». Как белгородский математик стал сотрудником лаборатории больших данных и искусственного интеллекта

Георгий Поляков работает заместителем руководителя лаборатории больших данных и искусственного интеллекта научно-производственной компании «Криптонит». Эта российская технологическая и научно-исследовательская группа компаний разрабатывает программное обеспечение и программно-аппаратные комплексы для хранения, обработки и анализа больших данных с помощью моделей машинного обучения.

Люди в городе. Люди в Белгороде» — авторский проект Ксении Ивановой, она разговаривает с интересными жителями Белгорода и Белгородской области, которые занимаются любимым делом, растут и развиваются, проявляя себя в искусстве, науке, образовании, бизнесе и других сферах. Цель — показать чем живут герои публикаций, как находят свои маленькие и большие цели, достигают их и вдохновляются своим делом. Собеседниками Ксении были врач -флеболог Сергей Луговской , мастер ораторского искусства Пётр Безруков, автор виртуального ассистента рентгенолога Георгиий Набока и другие интересные люди. Сегодня в рубрике интервью с программистом из компании «Криптонит» Георгием Поляковым.

Фото из личного архива Георгия Полякова

— Георгий, big data или, проще говоря, «большие данные» интересует мир уже лет 15. Расскажите, как понимать этот термин?

— В XXI веке появились и распространились в силу приемлемой стоимости новые способы хранить и обрабатывать данные. Если не хватает ресурсов обработать какие-то данные на одном, даже очень мощном компьютере или сервере, наступает момент, когда требуется так называемое «горизонтальное масштабирование». Появляется необходимость использовать второй компьютер для создания более сложной вычислительной системы.

Большие данные начинаются там, где появляется необходимость использовать вычислительную систему (кластер) из нескольких компьютеров (узлов). Обычно, когда говорят о «больших данных», говорят о большом объёме, высокой скорости поступления данных и о разнообразии самих данных.

— Как вы начали заниматься большими данными и искусственным интеллектом?

— Это результат прошлых моих усилий и решений. Я учился в лицее №38 Белгорода, сейчас это Шуховский лицей, и математика с физикой мне были очень близки. Мне повезло учиться у очень хороших преподавателей: по физике — у Корнеевой Галины Дмитриевны, по математике — у Лычевой Валентины Арсентьевны, она же была моим классным руководителем.

Я участвовал и побеждал в олимпиадах различного уровня, получил диплом призёра всероссийской олимпиады школьников по физике и диплом второй степени на международной естественно-научной олимпиаде.

Выбирал высшее учебное заведение и специальность исходя из потребности в прикладной науке и пошёл на факультет прикладной математики Института Криптографии, Связи и Информатики (здесь готовят специалистов в области передачи, защиты и обработки информации — прим. Ф.). Тема моей выпускной квалификационной работы была связана с одной актуальной задачей, я не был ограничен в методах её решения, но так уж получилось, что у меня было много данных и мою задачу хорошо решали методы машинного обучения. Так я познакомился с этой областью и решил, что хочу и дальше ею заниматься.

— Как связаны большие данные с искусственным интеллектом и нейросетями в частности?

— Добавим ещё в список определений анализ данных с машинным обучением и попробуем понять отличия. Анализ данных — процесс извлечения полезной информации из данных. В него входит и фильтрация, и поиск статистических закономерностей, и визуализация данных, и ещё много различных алгоритмов и методов.

Искусственный интеллект — более обширная сущность, позволяющая вычислительной системе действовать подобно человеку в тех или иных ситуациях.

Машинное обучение — это один из методов анализа данных. Его суть легко объяснить на простом примере. Допустим мы хотим создать некий алгоритм, который сможет сказать, что изображено на картинке: кошечка или собачка. Мы показываем алгоритму только фотографии с этими животными. Если мы будем самостоятельно стараться создать такой алгоритм, то столкнёмся с проблемой разнообразия различных видов и ракурсов, и, скорее всего, построить решающее правило будет очень сложно. Давайте же просто найдём тысяч 50 фотографий котов и собак, разделим на 45 тысяч обучающих и 5 тысяч тестовых, покажем все 45 тысяч фотографий алгоритму машинного обучения, а он будет учиться узнавать на этих фотографиях животное и не ошибаться. В конце покажем 5 тысяч тестовых фотографий, которые алгоритм машинного обучения не видел, чтобы оценить, как он работает на новых данных.

Нейронные сети — это один из классов алгоритмов машинного обучения. Бывают и другие. Стоит сказать, что машинное обучение невозможно без данных и для сложных задач требуется реально много данных. Специалисты же машинное обучение и анализ данных часто воспринимают как синонимы, хотя и понимают разницу, а нейронные сети — это всегда класс алгоритмов машинного обучения.

Когда речь заходит о больших данных, обычно говорят про инженерную часть, а именно, как их успеть загрузить и не потерять данные, если надо сохранить и обработать. Про искусственный интеллект обычно не говорят без улыбки.

— Вы работаете в компании «Криптонит», в лаборатории больших данных и искусственного интеллекта. Как вы попали в эту компанию? В чём состоит ваша работа? Чем занимается компания в целом?

— «Криптонит» — моё второе место работы. Первое — не обеспечивало меня достаточной возможностью развития в направлении анализа данных. В момент смены, когда я ходил на собеседования в Сбер, Яндекс, Mail, мой преподаватель узнал, что я ищу новую работу и предложил пройти собеседование в «Криптонит», в котором как раз открылось соответствующее направление, было много задач, мало рук и заинтересованный руководитель направления, — то, что нужно для молодого специалиста. Отдельно отмечу, что я не сразу понял, как мне повезло.

Когда я пришёл в «Криптоните» было около 80 человек, сейчас работает больше 400.

Открываются всё новые и новые направления, появляются новые возможности развития и всегда много интересных задач. Я рос вместе с «Криптонитом» и очень этому рад. Расскажу про своё направление. Моя команда делает решения по анализу речи, звука, изображений и видеопотоков.

— Есть технологии, которые могут изменить мир аналогично большим данным и искусственному интеллекту?

— Примерно десять лет назад Яндекс создал отдельную компанию Yandex data factory, которая задумывалась как центр компетенций по анализу данных, который сможет перенести свои решения на другие области. Такая идея возникла, насколько я помню, после коллаборации с ЦЕРНом (Европейская организация по ядерным исследованиям — прим. Ф.). Как оказалось, в тот момент экономика ещё не была готова принять решения в сфере анализа данных, да и сейчас есть много областей, где машинное обучение ещё не произошло. Например, производство новых лекарств или поиск новых материалов ещё не использует нейронные сети, хотя есть научные статьи, которые говорят, что это возможно, и здесь тоже можно добиться интересных результатов. Думаю, подобное массовое внедрение реально изменит мир.

Вообще рост нейронных сетей возможен благодаря возросшим вычислительным ресурсам, которые появились с развитием графических процессоров. Мир ждёт чего-то подобного после появления достаточно больших квантовых вычислителей.

— Как большие данные и искусственный интеллект изменят мир вокруг в будущем?

— Думаю, что они уже изменили мир вокруг. Я не думаю, что в какой-то момент будет некий «вжух» и всё сразу станет иначе. Одни профессии постепенно станут менее востребованными, другие — сильно изменятся, возникнут новые области народного хозяйства.

— Георгий, а что такое доверенный искусственный интеллект?

— Хороший вопрос. Доверенный искусственный интеллект — это концепция, согласно которой решения в сфере искусственного интеллекта должны быть разработаны таким образом, чтобы обеспечивать надёжность, безопасность, эффективность и продуктивность. Например, нельзя использовать интеллектуальные системы в медицине, если мы не можем гарантировать, что эти решения не нанесут людям вреда. Это же касается и применения интеллектуальных систем в военных целях. В связи с этим возникают сложные с научной точки зрения вопросы, как сделать ml-решения комплексно безопасными. Это достаточно новая, реально важная и интересная область.

Георгий Поляков (в центре) после победы на олимпиаде, фото из личного архива Георгия Полякова

— Как используется искусственный интеллект в искусстве?

— Вопрос не совсем по адресу, но интересно, что искусство — это область, которую уже изменил искусственный интеллект. С помощью нейронных сетей сегодня можно создавать изображения и видеоряды по текстовому описанию, добавлять в изображения что-то новое или изменять существующие. Можно создавать новую музыку или адаптировать старую к новым идеям. Думаю, сильно изменится порог входа в профессиональное искусство. Уже стало проще воплощать идеи в жизнь, и станет ещё проще.

— Георгий вы уехали из Белгорода, но, возможно, есть мысли вернуться обратно и что-то создать на уровне нашего города, учитывая ваш нынешний опыт?

— Думаю, что всё, что связано с возвращением в Белгород слишком сложно сегодня. Извините.

— Хорошо, но если бы вас попросили рассказать о Белгороде и о том, что здесь достойно посещения для людей, которые ни разу не были в нашем городе, какие три места вы бы выделили?

— Белгород — славный город со сложной судьбой. Я бы порекомендовал посетить его в тёплое время года и, наверное, через несколько лет. Город, реально выделяющийся хорошими общественными пространствами, милыми и удачными акцентами.

Думаю, если человек решит посетить Белгород, он всë равно прочитает обо всём, куда можно сходить в центре города. Я сделаю рекомендации о том, чего в центре нет. Это динопарк — лучший динопарк, в котором я был. «Пикник-парк» в Соломино — на первый взгляд, там ничего примечательного, обычная прогулочная зона в лесу, но это заметная точка притяжения людей. И, поскольку я вырос в Дубовом, то мне всегда нравилась прогулочная аллея за церковью, где дуб. Когда я был маленьким, говорили, что ему 300 лет и он был высажен в честь воссоединения России и Украины, позже, правда, выяснилось, что это была неправда.

Ксения Иванова
15:19, 18 сентября 2024

«Вig data уже изменила мир». Как белгородский математик стал сотрудником лаборатории больших данных и искусственного интеллекта

Читайте также

Похожие новости