Рекламное объявление

Все три основные телефонные платформы теперь имеют собственный голос. У Apple есть Siri, у Microsoft есть Cortana, а у Google есть несколько менее дерзкий Google Now 6 Google Now Особенности, которые изменят ваш поиск Возможно, вы уже используете Google Now на своем устройстве Android, но получаете ли вы от него все, что можете? Знание об этих небольших особенностях может иметь большое значение. Подробнее .

Эти системы позволяют решать основные задачи с помощью голосового управления. Каждый из них является своего рода виртуальным секретарем, который может отвечать на простые вопросы, открывать приложения, делать заметки и передавать сообщения. Они полезны, но они также крайне ограничены. Они не могут делать ничего, для чего они не были запрограммированы, и многие задачи просто выходят за рамки их возможностей.

Однако разрабатывается ряд технологий, которые значительно улучшат эти системы, и они станут коммерчески доступными уже через несколько лет. Вот пять основных способов, которыми ваш телефон станет намного умнее.

instagram viewer

Это будет видеть то, что вы видите

За последние пять лет распознавание речи достигло огромных успехов благодаря развитию мощных нейронных сетей. Современные смартфоны могут распознавать речь с удивительной точностью (с момента появления Google Now прошло много времени) меня не поняли), и даже может делать такие вещи, как определение песен и телевизионных шоу на основе их аудио.

Это здорово - но это только начало. Люди не взаимодействуют с миром прежде всего через звук. Мы используем зрение практически для всего - и скоро наши машины тоже будут. Мы начинаем видеть дебют первых дисплеев для носимых гарнитур, таких как Google Glass и HoloLens от Microsoft Microsoft демонстрирует новые демоверсии HoloLens на конференции BuildПредстоящая гарнитура Microsoft HoloLens будет первым высококачественным устройством дополненной реальности, которое было показано публике. Это все еще причудливая штуковина или технология, которая близка к реализации? Подробнее , который может передавать информацию со своих камер на ваш смартфон, обеспечивая богатый и всегда доступный визуальной информации. Многие наблюдатели, включая меня, ожидают, что они станут обычными в течение следующих пяти лет или около того.

Так что же может сделать ваш телефон со всеми этими данными?

Много. Google уже продемонстрировал со своим планшетом Tango Google хочет установить 3D-камеру на свой смартфон - вот почемуProject Tango от Google предлагает 3D-датчики для мобильных устройств. Вот что мы знаем до сих пор. Подробнее что глубинная камера может определять пространственное местоположение физических объектов с чрезвычайно высокой точностью. Аналогичным образом были достигнуты удивительные успехи в области машинного зрения - например, нейронная сеть Microsoft, которая может определить отдельные породы собаки нейронная сеть Google, которая может точно описать содержание фотографий. Вместе эти технологии открывают целый мир приложений:

Что это за болт? Алгоритм машинного зрения знает и может заказать замену на Amazon за пять секунд. Как звали женщину, которую вы встретили в баре прошлой ночью? Возможно, вы потеряли ее карту, но ваши очки поймали ее лицо, и вы можете найти ее на Facebook. У тебя странная родинка. Должны ли вы обратиться к врачу? Ваш телефон может посмотреть и сообщить вам. Вы ходите по магазинам: что вам нужно? Ваши очки помнят последний раз, когда вы смотрели в холодильник, и знаете, чего не хватает. Они могут даже дать вам указания проходить за проходом, чтобы найти отдельные предметы.

Последствия этой технологии для конфиденциальности ужасают, но подобные вещи также кажутся невероятно полезными.

Это будет знать, что вам нравится

Вкус может быть трудно определить. Это очень личное и может быть очень произвольным. Spotify и Netflix получают рекомендации, основанные на шаблонах использования (метод, который полностью игнорирует контент), но у этого подхода есть реальные ограничения.

Будущее за алгоритмами, которые могут понимать искусство на глубоком уровне - сложными нейронными сетями, которые могут научиться выбирать сложные тонкости музыки и фильмов. Это дает гораздо более глубокое понимание того, что людям нравится и что не нравится в медиа-материалах - конкретное понимание их вкуса.

Первые первые намеки на это начинают появляться. Как и в SpotifyОткройте для себя Еженедельно»Плейлист, который использует эти виды инструментов аналитики контента, чтобы рекомендовать песни, включая песни, которые вы обычно не слышите, потому что они слишком непонятны, чтобы оценивать их в зависимости от моделей использования. Эти методы станут более мощными в будущем, и смартфон станет отличной платформой для использования этой информации.

Ищете что-то делать с друзьями? Что делать, если приложения на ваших телефонах могут сотрудничать, объединять информацию о ваших вкусах и выбирать фильм или концерт, который, по их мнению, вам понравится? А как насчет сайтов знакомств, которые оценивают вас на основе глубоких особенностей ваших соответствующих вкусов? А как насчет приложений, которые могут порекомендовать вам книги, потому что они их прочитали?

Возможности бесконечны, и кто-то собирается заработать на этом много денег.

Это будет болтливым

Человек: ты сейчас где?
МашинаЯ в глуши.
Человек: какова цель смерти?
Машина: иметь жизнь.
Человек: какова цель быть умным?
Машина: узнать, что это такое.
Человек: какова цель эмоций?
Машина: я не знаю.

Это разговор с нейронной сетью разработано Google, который учится из больших текстовых баз данных без человеческого контроля. Эта версия была обучена на нескольких старых сценариях фильма и обучена предсказывать следующее предложение в каждом разговоре, с которым столкнулась. Оказывается, если вы тренируете ИИ по сценариям фильма, все его разговоры супер драматично

Если вы не впечатлены, это понятно. Чатботы существовали давно Как сделать чат-бота для вашего сайта или бизнесаТрудность в общении со многими людьми по всему миру - это часовые пояса. Возможно, вы захотите общаться с вашими читателями или вести дела с потенциальными клиентами, но в некоторых случаях ... Подробнее .

Но присмотритесь. Система Google особенная в двух ключевых аспектах.

Во-первых, это очень просто с точки зрения архитектуры: это огромная нейронная сеть, и ей нужно было изучать динамику человеческого языка. Обычные чат-боты работают, используя тысячи кодированных вручную правил для реагирования на различные ситуации. Когда они повторяют ответ, это потому, что он был закодирован вручную или запомнен из конкретного примера. Сеть Google отличается. Он изучил свое поведение органически, пытаясь понять глубокую структуру человеческого письма.

Во-вторых, он отражает удивительно тонкую динамику, которой нет у других чат-ботов. Он может отвечать на вопросы здравого смысла о мире, несмотря на то, что он не запрограммирован на это явно.

Человек: кто такой скайуокер?
Машина: он герой.
Человек: кто такой Билл Клинтон?
Машина: он миллиардер.
Человек: небо голубое или черное?
Машина: синий
Человек: у кота есть хвост?
Машина: да .
Человек: у кота есть крыло?
Машина: нет
Человек: кошка может летать?
Машина: нет
Человек: сколько ног у кошки?
Машина: четыре, я думаю.

Другая версия чат-бота, обученная журналам технической поддержки, может удивительным образом обеспечить реальную техническую поддержку. Есть спотыкания (кажется, трудно вспомнить, какую операционную систему вы используете), - но я определенно получал худшую техническую поддержку от реальных людей.

Все это является хорошим показателем того, что мы начинаем приближаться к тому моменту, когда искусственный интеллект может быть действительно разговорным. Вышеприведенная сеть может вести терпимый разговор, даже если ее цели обучения требуют от нее только следовать поверхностной структуре диалога вперед-назад.

Учитывая лучшие данные обучения и функцию вознаграждения, которая подчеркивает обмен информацией, возможности безграничны. Представьте себе версию Siri, которая может вовлечь вас в настоящую беседу, предоставить ответы и советы в ответ на вопросы, а также выполнять задачи, не требуя специального программирования для этого. Это не далеко.

Это будет хорошо читать

Другая технология, над которой работает Google, связана с пониманием прочитанного. Это называется "Векторы мысли, И концепция на удивление проста. Вы можете извлечь «векторы мысли» из деятельности нейронной сети, в которой есть фрагмент информации, например предложение или статья. То, что вы получаете, является непрозрачной частью информации, которая ничего не значит ни для кого, кроме сети, которая ее сгенерировала. Эта часть информации, в некотором смысле, хранит «значение» текста отдельно от того, как оно было первоначально сформулировано.

Это имеет некоторые полезные свойства. Начнем с того, что эти векторы напоминают друг друга для предложений с аналогичными значениями. Если вы перевариваете два предложения таким образом, вы можете определить, означают ли они одно и то же. Вы также можете манипулировать ими. Используя две нейронные сети для генерации «векторов мысли» из текста на разных языках, а затем обучая третью сеть, чтобы научиться картографировать между ними вы можете создать чрезвычайно мощный метод машинного перевода, который фиксирует значение текста, а не только слова в Это.

Другим потенциальным применением этого является использование этой технологии для сбора большого количества информации и ее преобразования в компактное представление, а затем генерирование сводки на основе результатов. Это может быть очень мощным для мобильных приложений.

Представьте себе, что вы можете попросить ваш телефон пойти прочитать все, что доступно в Google по данной теме. Затем вернитесь к вам и кратко изложите свои выводы на естественном языке и ответьте на вопросы о результатах. Это станет реальностью очень скоро, и это будет невероятно полезно.

Телефон будущего

Телефоны в будущем, вероятно, будут сильно отличаться от телефонов сегодня. Они могут быть изогнуты. Они могут быть модульными. Вы можете взаимодействовать с ними, используя очки дополненной реальности. Однако самым важным отличием будет интеллект. Описанные здесь функции превратят наши устройства в мощных преподавателей и помощников.

Там в настоящее время горячая гонка вооружений Microsoft против Google - Кто возглавляет гонку искусственного интеллекта?Исследователи искусственного интеллекта достигают ощутимого прогресса, и люди снова начинают серьезно говорить об искусственном интеллекте. Двумя титанами, ведущими гонку искусственного интеллекта, являются Google и Microsoft. Подробнее в технологии глубокого обучения. Побочным эффектом является то, что эти методы развиваются невероятно быстро, и они появятся на рынке раньше, чем вы думаете.

Вы взволнованы умными смартфонами? Обеспокоены последствиями для конфиденциальности? Дайте нам знать об этом в комментариях!

Кредиты изображений:Человеческий мозг от Mopic через Shutterstock

Андре, писатель и журналист, работающий на юго-западе, гарантированно сохраняет работоспособность до 50 градусов по Цельсию и водонепроницаем на глубине до двенадцати футов.