Первые виртуальные голосовые помощники появились на рынке более десяти лет назад. С тех пор они нашли широкое применение в банковском секторе, среди телекоммуникационных компаний, а также в сфере государственных услуг. При этом в настоящее время их область применения значительно расширяется за счет туриндустрии и рынка недвижимости, поэтому порог входа в этот сегмент IT-рынка для стартапов довольно низкий и прозрачный.
До последнего времени виртуальные помощники умели лишь предоставлять информацию по запросу или отвечать заранее записанными репликами, произнося их неестественным голосом по строго определенным шаблонам. Это обстоятельство в большинстве случаев раздражало пользователей, которые прекращали общение с ботом, если его ответы не отвечали их персональным потребностям.
Однако с появлением искусственного интеллекта ситуация в корне изменилась. GPT-помощники на основе больших языковых моделей LLM дали мощный толчок развитию этого сектора информационных технологий, обеспечивая более разумное взаимодействие между участниками диалога. Принципиально, что благодаря внедрению генеративных диалоговых нейросетей с миллиардами параметров они стали более гибкими и персонально ориентированными. В настоящий момент некоторые голосовые ассистенты научились запоминать контекст разговора и моментально подстраиваться под характер собеседника.
Немаловажно и то, что современные виртуальные голосовые помощники строятся на основе алгоритмов, обучаемых на базе колоссальных массивов данных, для того чтобы лучше понимать запросы и выдавать на них наиболее релевантные по смыслу и разнообразные по эмоциям ответы. При этом зачастую компании берут уже готовые модели на доработку, чтобы затем использовать их в собственных разработках. В частности, по такому пути развивалась всем известная Алиса от Яндекс.
В конце прошлого года с выходом ChatGPT 3.5–4 в этой области IT-индустрии произошел настоящий прорыв. Новая версия ИИ позволила выстраивать продолжительные диалоги между человеком и машиной. Она довольно хорошо поддерживает разговор, умеет сочинять стихи, писать компьютерный код и многое другое. Как отмечают специалисты, еще пять лет назад представить такое было довольно сложно, потому что аналогичные задачи решались на уровне сентиментного анализа, который позволял понять только то, какой отзыв - позитивный или негативный - оставил покупатель, например, на маркетплейсе. В настоящее время такие задачи решаются без какого-либо обучения алгоритмов. С ними успешно справляются генеративно-состязательные сети и, как мы уже упоминали, большие языковые модели.
По оценкам iKS-Consulting, объем российского рынка голосовых помощников в настоящее время составляет порядка 3,9 млрд рублей с приростом 30–35% в год, что вполне соответствует состоянию зрелости и предсказуемости. Самые известные из них - Алиса, Маруся, Siri, Салют, Афина и Джой. Эксперты отмечают, что использование виртуальных ассистентов позволяет компаниям крупным и средним компаниям снизить количество персонала, а также уменьшить число точек обслуживания клиентов. По некоторым данным, в 2022 году более 50 крупных российских представителей IT в той или иной степени занимались разработкой виртуальных голосовых помощников.
Когда то мои заказчики решили улучшить качество обслуживания клиентов через голосовые каналы связи, а я на тот момент не обладала соответствующими компетенциями, так родилась идея создания компании АНО "Цифротех". Спустя годы компания выросла, на пути к росту мы набили несколько шишек, что помогло нам увидеть слабые места и продолжить рост, и теперь мы ведем обучающую программу по написанию компьютерного кода виртуальных помощников. По итогам специализированного курса наши выпускники самостоятельно создают систему, способную распознавать человеческие эмоции по голосу практически с нуля. И это лишь малая часть всех знаний выпускников АНО Цифротех, которых мы потом успешно трудоустраиваем