Возможно, Alexa и Google Assistant не должны лучше понимать вас
Голосовые помощники, такие как Google Assistant и Alexa, стали частью повседневной жизни. Они на телефонах, ноутбуках, стенах и управляют умными домами. Но их может быть сложно использовать, особенно для тех, кто говорит на «нестандартном» английском языке. Компиляторы пытаются решить эту проблему, но что, если это плохо?
Упрощая использование голосовых помощников в «умных домах» и на смартфонах, компании могут на самом деле сокращать возможности своих пользователей функционировать в более широком мире. В мире насчитывается около 1,35 миллиарда человек, говорящих по-английски, из которых 400 миллионов являются «носителями языка ».
Таким образом, можно с уверенностью предположить, что примерно 2/3 носителей английского языка имеют некоторую степень акцента только потому, что это не их родной язык. Кроме того, для 400 миллионов человек, для которых английский является родным языком, у вас есть несколько национальных акцентов (британский, канадский, американский, австралийский и др.). В каждой стране есть региональные диалекты и так далее.
Если бы компаниям пришлось выбирать и совершенствовать один диалект, скажем, американский стандартный английский, их продуктом могла бы пользоваться лишь небольшая часть носителей английского языка. И наоборот, если они зайдут слишком далеко, они могут лишить людей того, что могло бы стать очень полезным инструментом для развития их коммуникативных навыков.
Как технологические компании пытаются улучшить ситуацию?
Тайлер Ноттли / Shutterstock.com
Голосовые помощники работали над тем, чтобы лучше понимать команды своих пользователей с тех пор, как они существуют. Microsoft, Apple, Google и Amazon входят в число громких имен, которые вложили массу ресурсов в своих соответствующих голосовых помощников и хотят сделать их максимально доступными и удобными для как можно большего числа людей.
Для этого нанимали людей с особым акцентом для записи сотен голосовых команд и разговоров, которые затем можно было использовать для обучения диалектам ИИ. В один из моих неурожайных месяцев я решил заработать на своем сексуальном северном акценте и провел часы, записывая сотни, казалось бы, случайных слов и фраз для компании под названием Appen.
Затем эта компания взяла мои записи и отправила их в Amazon, Google, Microsoft или кому-то еще, кто им платил. Затем голосовые фрагменты теоретически используются для улучшения того ИИ, который разрабатывает компания, купившая их.
Некоторые голосовые помощники даже могут быть обучены лучше понимать голос человека, который их использует. В отличие от ожидания, пока крупные технологии улучшат свою игру, это дает немедленные результаты и может значительно повысить точность вашего голосового помощника. Это также позволяет нескольким пользователям получать доступ к своим профилям умного дома без необходимости переключаться вручную.
Итак, почему это может быть плохо?
Я мог бы сойти с рук, сказав: «Алексер, сэрруз, будильник на восемь часов завтра будет тебе», но когда я пытаюсь запросить песни, начинается настоящая борьба. Потребовалось около трех месяцев общения с Amazon Music и несколько тысяч разочарованных ругательств, но теперь я могу сказать «включи Happy Hour от The Housemartins» так же четко, как читатель новостей BBC 1980-х годов. До сих пор бывают случаи, когда я прошу Пола Веллера и каким-то образом получаю Эллу Фитцджеральд, но всегда есть место для совершенствования.
Положительным моментом в борьбе с акцентом стало то, что мой английский улучшился. Теперь я могу общаться более четко, чем когда-либо прежде. Это полезно, потому что технология может улучшиться до такой степени, что ИИ на моем смартфоне сможет меня понять, но это не принесет мне много пользы, когда я использую этот телефон для разговора с другим человеком.
Еще одним преимуществом является то, что я не полностью избавился от своего акцента в процессе. Если бы вместо этого я решил раскошелиться на уроки ораторского мастерства, я мог бы отбарабанивать предложения с полученным произношением. Идентичность важна; акценты являются важной частью чьей-то культуры и происхождения.
Например, в Соединенном Королевстве через каждые несколько миль раздается отчетливый акцент. Есть карта, которая летает по интернету уже несколько лет и выглядит обширной, но все еще едва затрагивает поверхность. Крошечная часть Северо-Востока помечена как имеющая акцент «Тиссайд», но уроженцы каждого города в этом районе (Миддлсбро, Хартлпул, Стоктон и Биллингем) говорят по-разному.
А теперь представьте различия в графстве размером с Йоркшир. Люди также склонны отождествлять себя с тем, откуда они родом, и сохранять большую часть своей культуры. Акценты – большая часть этого; не все хотят звучать как Хью Грант. Возможно, в последние годы мы были избалованы, так как многие люди теперь счастливы сидеть сложа руки и ждать, пока технологии исправят их недостатки — и во многих случаях они именно это и сделают. Но иногда встреча с технологиями посередине в долгосрочной перспективе и быстрее, и лучше.
Голосовые помощники должны быть доступны как можно большему количеству людей. Если бы вам пришлось говорить в идеальном произношении, прежде чем Siri сообщит вам время суток, один из самых значительных успехов Apple был бы бесполезен для более чем 99,9% англоговорящих людей.
Даже что-то вроде стандартного американского акцента исключило бы большинство пользователей в Соединенных Штатах, не говоря уже о мире. Следовательно, очевидно, почему компании прилагают много усилий, чтобы научить свое программное обеспечение понимать как можно больше диалектов. Так и должно быть. Но они должны идти только так далеко.
Было бы лучше, если бы Apple, Google и др. избегайте принятия перфекционистского менталитета и вместо этого просто стремитесь к стандарту, который обеспечивает доступность, но все же требует некоторой осторожности со стороны пользователей. От себя лично нежелание Алексы слушать что-либо, кроме четкой речи, заставило меня задуматься о том, как я произношу вещи.
Моя речь, несомненно, стала чище, чем раньше, когда мне приходилось иметь дело с голосовым помощником несколько раз в день. Я не собирался этого делать; это был непреднамеренный и очень полезный побочный эффект — и если он сработал у меня, то может сработать и у других людей.