Има много факти, които показват, че изкуственият интелект опростява много неща, променяйки живота ни към по-добро. Все по-голям брой предприятия проявяват интерес към тази технология. А тези, които преди са разчитали на широк набор от възможности на AI, сега могат да се възползват от по-висока производителност и конкурентоспособност, особено когато работят с чатботове. В тази статия ще обясним защо тези технологии са много търсени и как изглежда една добре направена платформа за разговори.

Историческа справка

Както знаете, изкуственият интелект е термин с много тълкувания. Той включва предсказуем анализ, машинен превод и много други области. Сред тях технологиите за разбиране на естествен език (NLU) и генериране на естествен език (NLG) са обещаващи, тези области имат най-високи темпове на растеж. Според прогнозата на ResearchAndMarkets , глобалният AI пазар ще достигне пазарна стойност от $28,6 милиарда до 2026 г.

Обработката на естествен език (NLP) е научна област, която описва взаимодействието между компютри и човешки езици. Основната му задача е да програмира компютрите да обработват и анализират големи количества данни на естествен език.

Разбиране на естествен език (NLU) – занимава се с трансформирането на необработени данни в разбираем за машини език. Тоест NLU е способността на машината да разбира какво й казва потребителят.

Първите чатботове се появиха доста отдавна. Всичко започна с Алън Тюринг през 50-те години, изследванията в областта на лингвистиката и машинното обучение през 90-те години (учените започнаха да създават програми за компютри, за да анализират големи количества данни и да правят изводи).

През 2001 г. Ричард Уолъс разработи AIML (Artificial Intelligence Markup Language) и създаде базирания на него чатбот ALICE (Internet Artificial Linguistic Computer Object).

Тази методология беше наречена „подход , базиран на правила“ и през следващите десет години всички усилия за създаване на чатбот бяха сведени до реорганизиране и подобряване на тази методология. По същество условно значимите части от фразите се откриват, кодират и се създава скриптов език, който ви позволява да създавате скриптове за разговор. Днес повечето интелигентни асистенти използват този подход. Най-новите среди за разработка са сложни системи, които включват:

  • Част от NLU, която съдържа разпознаване на намерения.
  • Езикови модули (напр. морфологичен анализ, проверка на правописа и др.)
  • Модули за управление на диалог с локално и глобално запазване на контекста.
  • Интеграции и външни API.

Вярно е, че много решения, базирани на тази система, изискват значителни усилия. Отнема много време, за да накарате чатбот да може да комуникира по широк кръг от теми или конкретна дисциплина. Но сега всичко се промени, благодарение на разработването на алгоритми, които определят семантичното сходство и решенията за машинно обучение.

Това от своя страна направи подходите за текстова класификация и обучение на NLU модели бързи и удобни. Процесът на разработване на сложен чатбот стана много по-лесен. Разширяването на месинджърите и уеб чатовете, заедно със забележителния напредък в технологиите за моделиране и разпознаване на глас, доведе до бързото навлизане на NLU технологиите през 2015-2019 г.

Защо тези технологии са толкова популярни сега?

Има няколко фактора, които допринасят за растежа им на пазара:

  1. Кол центрове

Това е най-добрият пазар за внедряване на NLU алгоритми. Хиляди компании, вариращи от банки, големи корпорации за търговия на дребно, малки и средни предприятия, използват услугите на кол центровете – те могат да обслужват своите клиенти само с двама или трима мениджъри на бюрото за помощ. Огромен брой рутинни операции са делегирани на изкуствения интелект:

  • Чатботовете отговарят на стандартни въпроси (важи принципът на ЧЗВ)
  • В режим „контрол на разговорите“ те пренасочват потребителя към желания отдел чрез интелигентен IVR
  • Работи като консултант – помага на операторите в кол-центъра със съвети

Всички тези действия намаляват разходите за персонал и увеличават пропускателната способност на кол центъра, без да увеличават персонала. Алиансът бот + оператор е най-ефективният начин – агентът вдига телефона само когато клиентът има сложни аналитични въпроси, за да може да им отдели толкова време, колкото е необходимо, за да реши проблема си.

  1. Гласови джаджи

Преди 3 години Amazon Echo се появи и направи всичко малко по-удобно: сега Alexa може леко да ви събуди сутрин, да включи музика, да намери интересни факти и новини, да управлява интелигентни домашни устройства, да извика такси и да поръча пица. Това е първото масово устройство с добра система за гласово разпознаване и възможност действително да чуете заявката дори при силен външен шум. Тогава Google обяви своя Google Home.

Лидерите на китайския пазар, гигантски интернет компании, пускат свои собствени умни джаджи – Baidu, Xiaomi, Alibaba, Tencent и JD.com. Този пазар не се ограничава само до роботи, играчки, смарт часовници и интелигентни домакински уреди – със сигурност ще видим много нови и страхотни технологични приложения.

  1. Интелигентни виртуални асистенти

Amazon Alexa, Google Assistant, Apple Siri, Microsoft Cortana и няколко други използват виртуални асистенти. Виртуалните асистенти са вградени в много различни смарт устройства, но смартфоните са най-често срещаните сред тях. Гласовите асистенти са най-обещаващата категория продукти. Общите продажби се оценяват на 120 милиона устройства през миналата година. Ето защо базираният на изкуствен интелект пазар на чатбот има огромна бизнес възможност – виртуалните асистенти могат да поемат автоматизацията на поддръжката и да се превърнат във важна точка за контакт за бизнеса и клиентите.

Как работи AI chatbot?

Схемата за взаимодействие на потребителя с чатбота може да бъде представена по следния начин:

Първо, потребителят изпраща своята заявка към един от наличните канали – смарт часовници, телефони и др. Зад всяка заявка стои намерение – желанието на потребителя да получи правилния отговор или да получи услуга, продукт или някакъв вид съдържание, като музика или видео.

Това може да бъде последвано от обработка и конвертиране на формат на съобщението. Разговорните платформи използват техники за разпознаване на текст, докато някои канали може да вземат предвид само глас. Системата за говорен диалог се състои от автоматичен разпознавател на говор (ASR), синтезатор на текст към говор (TTS) и интеграционни системи. В някои случаи може да се наложи разпознаване на гласа на човек – в този случай се използват биометрични платформи.

Заявката се преобразува в текст и след това се предава на диалоговата платформа. Целта на платформата е да улови основната семантика на дадена последователност от думи, да я обработи правилно и да даде правилния отговор или действие. За целта платформите за диалог използват редица технологични процеси, като нормализиране на текст, морфологичен и синтактичен анализ, семантичен анализ, класиране на хипотези, генериране на заявки чрез API към външна база данни и информационни системи.

Пример за тези системи е всяка CRM система, бази данни за контакти или услуги като Deezer или Google Play Music. След получаване на данните диалоговата платформа генерира отговор – текстово, гласово съобщение (чрез TTS). След това започва да предава съдържание или ви уведомява за извършено действие (като например пускане на поръчка в онлайн магазин).

Как се обработват заявките в платформата за диалог?

Обичайният модел на стандартната платформа може да бъде представен по следния начин: Основният цикъл на обработка на клиентска заявка се състои от следните действия:

  1. Системата получава заявката на клиента към модула за управление на диалога – DialogManager.
  2. DialogManager взема диалоговия контекст от базата данни.
  3. Клиентската заявка (заедно с контекста) се изпраща до NLU модула за обработка, където се определя намерението на потребителя.
  4. Въз основа на диалоговия скрипт и извлечените данни, DialogManager определя най-подходящия режим (прозорец, екран, диалогова страница), който най-добре съответства на изявленията на клиента.
  5. Изпълнение на бизнес логика според сценария на чатбот.
  6. Активиране на външни информационни системи (ако са програмирани в бизнес логиката).
  7. Генериране на текстов отговор с помощта на функции за съвпадение на думи.
  8. Запазване на контекста и настройките на диалоговия прозорец за обработка на следващи заявки.
  9. Изпращане на отговор до клиента.

Управлението на диалога, в който се дефинира цялостният контекст, е важна част от процеса на функциониране на системата. По време на този процес дадена фраза ще бъде разбрана по различен начин в зависимост от това кой я е казал и какви допълнителни данни са предоставени (например местоположението на потребителя). В някои системи DialogManager управлява попълването на слотовете (запълване на контекста с необходимите данни, които могат да бъдат извлечени от фразите на клиента или предишен контекст или могат да бъдат поискани от клиента).

Най-трудният етап от работата е анализът на изявлението. Този процес се нарича разбиране на естествен език (NLU), което всъщност означава разбиране на значението на дадена фраза. В опростена форма процесът на разбиране на език се състои от следните стъпки:

  • Предварителна обработка на текст
  • Разбиране на намеренията на клиента
  • Разбиране на значението на фрази и изречения.

От какво трябва да се състои платформата за диалог?

Модерната платформа за диалог трябва да включва много функции и модули за процеси. Колкото повече интеграции има една платформа, толкова по-малко време и усилия ще са необходими за разработването на нова функционалност върху нея. Схемите за класификация и машинното обучение ускоряват процеса, тъй като анализират голям брой файлове за сравнително кратко време. Когато са интегрирани в една система, различни методи за разработка могат да се комбинират в рамките на един проект.

Инструментите за визуално проектиране на умения помагат за ускоряване на развитието на умения, опростяват процеса на отстраняване на грешки и визуализират по-нататъшния поток от диалог между потребителя и системата. Разговорните платформи имат няколко много важни характеристики. Това са дълбоки анализи, специални филтри, многоезична поддръжка, запазване на контекста, точност на алгоритъма, производителност, мащабируемост и стабилност. И тези характеристики трябва да се вземат предвид при създаването на интелигентен чатбот.

Ерата на гласовите чатботове: какво следва

Според проучване на Capgemini 40% от потребителите скоро ще използват гласови чатботове чрез мобилно приложение или уебсайт, големи компании и МСП, които искат да привлекат нови клиенти, дават голям принос за базираните на AI гласови чатботове. Те се превръщат в нова технология за повишаване на ефективността, продуктивността и потребителското изживяване.

Разработчиците използват нови услуги за създаване, обучение и хостване на базирани на AI чатботове. Благодарение на обмислените инструменти, процесът на разработване на гласов чатбот е доста прост; редица платформи дори не изискват умения за програмиране. По-вълнуващи платформи, задвижвани от изкуствен интелект, идват съвсем скоро, превръщайки 2021 г. в година на възможности, предизвикателства и промяна.