Ашманов про наглых "импортозаместителей" в области ИИ.
Важнейшие вопросы, связанные с распространением искусственного интеллекта, оказывается, почти не ставятся и совсем не решаются. По крайней мере, так было до этого интервью
// monocle.ru
...
Наши «отечественные» большие лингвистические модели, которые у нас преподносятся как сделанные с нуля, на самом деле таковыми не являются. В первое время, когда на нашем горизонте появился ChatGPT 3.5, это произошло в январе два года назад, у нас в IT-отрасли и в медиа возникла истерика.
Люди в больших компаниях, которые до этого рапортовали наверх всем, включая самого большого начальника, о том, что у них тоже есть искусственный интеллект, что они в этом очень хорошо понимают и впереди планеты всей, пришли в ужас, потому что ничего подобного сделано не было, а начальник мог бы спросить, почему.
И дальше у них была прямо гонка, как быстро-быстро показать, что у них тоже это есть. Естественно, все было взято заподлицо, с цельнотянутыми движками, с цельнотянутыми данными и так далее, а затем переупаковано, чтобы предъявить и сказать, что у нас есть то же самое.
Поэтому эти большие модели в течение года-полутора как минимум на вопрос, кто тебя сделал, отвечали, что их сделала американская корпорация OpenAI.
Там, в этих наших цифровых гигантах, настолько люди наглые и беспардонные, что они поленились такое правило руками написать: когда спрашивают «кто тебя сделал?», надо сказать, что сделала их компания.
Они настолько были уверены, что всем заморочат голову, что поленились сделать это руками. А это, в общем-то, совершенно нетрудно.
— Как можно понять, что полноценной «переупаковки» так и не произошло? Существуют ли интерактивные системы, которые обучались преимущественно на российском контенте? Ведь их широко используют, в том числе учащиеся при подготовке ответов на учебные задания.
— Вы, наверное, слышали истории, когда генеративному ИИ-сервису говорят нарисовать гайку, а он рисует орех. Почему? Потому что в английском языке есть два омонима. Nut — это и гайка, и орех. Сразу видно, что внутри «отечественного» движка запрос сначала переводится на английский, а уж дальше происходит ошибка с выбором не того омонима.
Скриншот, на котором видно, что Алиса от «Яндекса» на просьбу нарисовать гайку рисует орех (и то и другое — nut)
Это прямое доказательство, что это цельнотянутая вещь. Потом, конечно, эта переупаковка стала проникать глубже, но, в общем, наш искусственный интеллект очень вторичен. Нет у нас своих нейронных фреймворков. Нейронный фреймворк — это что-то вроде нейронной операционной системы, которая исполняет поверх себя всякие нейронные ИИ-приложения, в том числе большие лингвистические модели.
Вот этой нейронной операционной системы у нас нет. У нас есть западные нейронки, которые мы скачиваем в исходных текстах (как Linux), здесь компилируем и потом поверх них строим эти большие лингвистические модели, очень часто тоже либо по статьям американцев, либо просто есть готовый код и данные.
А потом берем и запускаем приложения на этих нейронных фреймворках — там разные приложения есть: распознавание лиц, генерация текста, генерация голоса и так далее.
...