В одном из эпизодов моего подкаста я поговорил с
Марцином Можейко о мире академических наук. Этот мир очень неоднороден. Есть один, который больше связан с исследованиями, которые люди заканчивают, получают степень магистра, возможно, доктора философии. Другой - тот, который просто остается там, и это тот классический мир, с которым мы обычно ассоциируем, например, Польшу и многие другие страны.
И третье - это в целом тот мир, который движет ML сейчас, который не совсем в каком-то смысле признает авторитет или определяет авторитет по-другому. Я хочу сказать, что обычный академический мир устроен так, что для того, чтобы публикация появилась в журнале, нужно очень постараться, немного поклониться в разных местах и подождать, наверное, 2-5 лет, и только тогда она появится.
В отличие от них, этот третий мир академической науки, этот вид бунтарства, что они делают, так это публикуют ссылку в Twitter, и на этом все заканчивается. Потом ее цитируют другие люди, и оказывается, что она так быстро распространяется. На мой взгляд, это нормально с точки зрения развития.
Сам ML в некотором смысле тоже бунтарь. Дисциплина, которая заключается в попытке использовать различные области - немного математики, физики, статистики, программирования - это вид ребенка многих родителей, который приобрел множество различных компонентов.
ML объединил то, что работает, а то, что не работает, выбросил. Там довольно часто нет даже научной основы, а значит, научный мир вообще отстает. В этом и заключается парадокс. Например, глубокое обучение. Сейчас оно делает потрясающие вещи, начиная с deepfakes или тех голосов, которые генерируются там, что ты упомянул в voicebot - это глубокое обучение.
Глубокое обучение разрабатывалось в основном учеными, инженерами, даже скорее инженерами, чем учеными, то есть людьми, которые больше экспериментируют, чем людьми, которые выводят различные формулы на листе бумаги и на основании этого знают, что это будет работать.
Возможно, здесь нам нужно сделать шаг назад, потому что искусственный интеллект, сам по себе являющийся концепцией, был задуман очень давно. По крайней мере, в 1950-х годах прошлого века он уже была формализован, но еще раньше, в 1940-х годах, кое-что уже начало зарождаться. Еще в 1840 году Ада Лавлейс была первой женщиной, которая стала концептуальным программистом, ведь тогда еще не было компьютеров.
Там она уже размышляла о том, могут ли компьютеры обладать интеллектом. Де-факто это началось очень давно, но долгое время (особенно в прошлом веке) это была скорее научно-теоретическая борьба, и она не работала. Позже он немного изменился в другую сторону, в том числе и потому, что появились вычислительные мощности, и здесь началось больше революций, которые работают как дети: давайте попробуем это, давайте скомбинируем это так или так. Можно привести такой наглядный пример: в глубоком обучении есть функция активации.
Что бы это ни значило, сейчас это звучит банально, но это функция, которая необходима, внутри мы активируем ее много раз. Классическая функция активации выглядит довольно сложной, есть некая гиперболическая TANH. Оказалось достаточно взять очень простое правило, которое работает так (как обычно думает инженер, потому что гиперболическая TANH тоже очень тяжела в расчетах), что если значение больше нуля, то мы возвращаем это значение, если меньше, то возвращаем нули и все.
Такая функция обычно представляет собой максимум нулей и значение, и я обнаружил, что она работает. Де-факто она вообще не дифференцируема, в ней нет ни одной, ни другой производной. Там много математических проблем, но это работает. Это вызывает те революции, которые мы наблюдаем сейчас. Это потрясающе. Это такая смесь того, что здесь происходит. Не то чтобы классический ученый все это придумал и привел в движение.
Другое дело, что классические ученые пытаются догнать это и сделать больше публикаций о том, почему это сработало. Но довольно часто они все еще сильно отстают, как минимум на несколько лет, а несколько лет в ML, глубоком обучении - это целая вечность.
Суть в том, что академики, которые работают только в академических кругах, довольно часто сами не в теме, даже если кажется, что они лучше разбираются в этих вопросах. Довольно часто ученые знают теорию, они могут довольно хорошо теоретизировать, но если вы скажете им: сделайте голосового робота, но на таком уровне, чтобы реализовать его на уровне кода, они, как правило, не станут этого делать.