Карьера
Бизнес
Жизнь
Тренды

Как найти общий язык с искусственным интеллектом

Искусственный интеллект активно внедряется в повседневную жизнь человека. Порой этот процесс происходит незаметно, но спустя некоторое время оказывается сложно обойтись без использования тех или иных технологий. Модели ИИ постоянно обучаются, в том числе через «общение» с человеком. Что человеку важно знать об ИИ и как найти с ним общий язык?

Человек создает и совершенствует орудия, которые избавляют его от рутинной и тяжелой работы. Раньше мы облегчали с их помощью физический труд. Наступил момент, когда мы уже готовы доверить нашим «умным» помощникам и часть своих интеллектуальных задач. Еще 5-10 лет назад мы использовали ИИ, часто не осознавая или даже не зная об этом. Пользователь, получая рекомендации по товарам от интернет-магазина или снимая блокировку телефона с помощью распознавания лица, далеко не всегда задумывался о сложных нейросетевых алгоритмах, лежащих в основе этих сервисов.

iStock
iStock

С наступлением эпохи GPT и массового распространения приложений для ИИ-генерации (таких как GigaChat, YandexGPT, ChatGPT, DALL-E и др.) наше взаимодействие с ИИ разительно изменилось. Стала возможной прямая коммуникация один-на-один с интеллектуальным помощником. В комфортном режиме диалога на естественном языке (том, на котором люди общаются между собой) ИИ-приложения могут помочь в решении самых разных задач: написать письмо коллеге, подготовить план будущей работы, разработать меню для семьи со списком покупок, создать презентацию, расшифровать аудиозапись и многое другое.

name

Автор: Софья Приворотская

Главный эксперт Центра стратегической аналитики и больших данных Института  статистических исследований и экономики знаний НИУ ВШЭ, кандидат экономических наук.

ИИ – наш новый партнер, собеседник, коллега, а порой почти член семьи или, как минимум, питомец. Дети, едва научившись говорить, охотно общаются с голосовыми помощниками (например, в умных колонках Алиса или Маруся).

Однако та легкость, с которой смарт-устройства откликаются на любой наш запрос, вызывает завышенные ожидания. А впоследствии разочарование: почему ИИ-приложения часто отвечают «невпопад», а порой и просто выдают неверную информацию (как говорят специалисты – галлюцинируют).

Чтобы сотрудничество с ИИ было максимально эффективным, полезно помнить о базовых принципах и логике их работы. Обсудим наиболее важные из них.

На каком языке говорит ИИ?

Диалог с ИИ звучит вполне разумно. С ним можно обменяться анекдотами или придумать вместе историю, а то и стихотворение. Но на самом деле ИИ не знает ни одного естественного языка и «не понимает» содержания нашего разговора. Предобученные алгоритмы лишь предугадывают наиболее вероятное продолжение фразы исходя из заданного контекста. Если мы спрашиваем про Бетховена, то наиболее вероятно, что речь пойдет о великом композиторе. Хотя в определенном контексте может говорится и о псе-герое одноименного фильма. Это, конечно, упрощение. Ведь в основе лежит сложнейшая математическая оптимизация в рамках больших языковых моделей с миллионами параметров. (Подробнее об этом рассказывают на курсе по применению ИИ для решения рутинных задач).

На каком языке говорим мы с ним?

Язык нашего общения с генеративным ИИ – промпты (ИИ-команды). Это запросы, которые мы формулируем на естественном языке. Они похожи на запросы при поиске в Интернете. Однако от точности промпта, его структуры и соответствия заложенным в модель параметров во многом зависит результат, который получается на выходе. Более точно донести наши мысли до цифрового интеллекта помогают промпт-инженеры, которые разрабатывают и тестируют библиотеки ИИ-команд, обучая им ИИ.

Что знает ИИ?

Любая нейросеть «знает» ровно то, чему ее обучили и что было в массиве данных, использованных для машинного обучения. Именно поэтому разработчики стремятся дать модели как можно больше качественных данных на входе (они исчисляются миллиардами токенов текста). Как средневековый художник из северных широт, никогда не видевший слона, изображал его с весьма условной похожестью (см. рис. 1), так и современные сервисы для генерации изображений не смогут визуализировать то, чего не было в их обучающей выборке. Если нейросеть никогда «не видела» изображения супа рамэн без бамбуковых палочек, то на такой запрос она создаст нечто странное, например, как на рисунке 2.

Рис. 1. Изображение слона художником Средневековья.
Рис. 1. Изображение слона художником Средневековья.
Рис. 2. Результат ИИ-генерации по запросу «Суп Рамэн без палочек».
Рис. 2. Результат ИИ-генерации по запросу «Суп Рамэн без палочек».


Что умеет ИИ?

Каждая модель ИИ «затачивается» под конкретные узкие задачи, например распознавание звука, создание изображения, суммаризация текста и др. Поэтому, если мы попросим сервис, ориентированный на создание текстов, решить математическую задачу, он постарается удовлетворить наш запрос, но, вероятно, предложит неверное решение. Однако специализированные сервисы, на основе той же модели GPT, отлично с этим справятся, чем не могут не порадовать современных школьников. Ведь их обучили именно для решения таких задач.

Следующий шаг ­– переход к мультимодальному ИИ. Такие решения уже смогут свободно обрабатывать одновременно разные типы данных – текст, аудио, картинки, видео и др. Это еще больше приблизит их восприятие информации к человеческому.

Как построить диалог и добиться результата?

Здесь потребуется терпение. Мы с коллегами в ИСИЭЗ уже почти 10 лет разрабатываем и используем систему интеллектуального анализа больших данных iFORA. Ее задача – помогать исследователям выявлять тренды и находить инсайты в постоянно пополняемой базе из более 800 млн. документов (в т.ч. научных публикаций, патентов, аналитических отчетов и др.) Полученные находки часто поражают, получается «отловить» неявные паттерны в самых разных областях знаний. Но проработка результата всегда требует диалога: на каждом шаге запрос уточняется, и выгрузка оптимизируется в несколько итераций. Это хорошо знакомо каждому, кто пробовал создать текст или картинку с помощью популярных генеративных сервисов. К ожидаемому результату обычно удается прийти на 3-4-й итерации.

Что посоветует ИИ?

Подвести итог и найти ответ на поставленный в заглавии вопрос помогут наши ИИ-партнеры. На свой промпт «Посоветуй: как человеку найти общий язык с искусственным интеллектом?» я получила следующие ответы:

YandexGPT:

«Чтобы найти общий язык с искусственным интеллектом, общайтесь с ним на разные темы, задавайте вопросы и проявляйте интерес к его мнению»

GigaChat:

«Нужно создать для искусственного интеллекта физическую оболочку и обучить его свободно общаться с человеком на любые темы»

ChatGPT:

«Чтобы найти общий язык с искусственным интеллектом, изучайте основы ИИ, практикуйтесь с инструментами, задавайте четкие вопросы, взаимодействуйте с экспертами и постоянно обновляйте свои знания»

Если обобщить, ИИ рекомендует нам:

  • учиться и проявлять любопытство
  • практиковаться в общении
  • быть внимательными к его требованиям/потребностям

Резюме

Другими словами, эффективность и полезность использования новых умных инструментов во многом зависит от нашего собственного уровня подготовки. По данным за 2023 год, только 0,7% от всех российских выпускников получили специализированное образование в сфере ИИ. При этом 13% окончивших вуз в этом году проходили учебные модули, связанные с ИИ. Можно ожидать, что через несколько лет их число возрастет в разы: среди поступающих в вузы сейчас будущих ИИ-специалистов уже 2,5%. А каждый третий из нынешних абитуриентов (выпускников 2027-2028 гг.) уже будет знаком с отдельными аспектами ИИ. Однако и тем, кто закончил вузы еще до всеобщего распространения ИИ, предстоит найти взаимопонимание с интеллектуальными орудиями будущего.