Искусственный интеллект Google научился читать по губам лучше людей
Рубрика: Новые технологии
Система искусственного интеллекта, созданная командой Google DeepMind, научилась понимать речь, следя за артикуляцией говорящего. Программа, читающая по губам, продемонстрировала в этой технике на 35% лучшие результаты, нежели профессиональный «считыватель» по губам.

Систему искусственного интеллекта обучили на шести телешоу, выходивших за период с 2010 по 2015 гг. Так, программа проанализировала видео продолжительностью 5 тысяч часов. Проверка эффективности алгоритмов осуществлялась на новых выпусках телепрограмм, которые показывались с марта по сентябрь текущего года. Из 200 видеофрагментов человек смог безошибочно распознать лишь 12,4% произнесенных слов, а компьютерные алгоритмы – 46,8%. Полученные результаты могли быть гораздо лучше, если бы аудио и видео в некоторых видео не отставали друг от друга.
Ранее система ИИ превзошла человека на тесте GRID, словарный запас которого состоял из 51 уникального слова. Если сравнивать с ТВ-шоу BBC, таковых слов было произнесено 17 500. Программа вряд ли будет использована для прослушки, поскольку микрофоны направленного действия выполняют эту задачу намного лучше. Скорее всего, технологию будут использовать в потребительских устройствах.
Новости по теме:
Ученые научились делать любую поверхность сенсорной
Группа ученых американского Университета Карнеги-Меллон отыскала применение для токопроводящей краски. Это вещество способно сделать любую поверхность сенсорной – вернее, наделить ее свойствами сенсорной панели. Сфера применения Electrick достаточно обширна: от создания крышек смартфонов до усовершенствования системы «Умный дом».

3D-принтеры обзавелись новой функцией быстрой «жидкой» печати
Производитель мебели Steelcase совместно со специалистами Массачусетского технологического института создал новое направление в 3D-печати под названием Rapid Liquid Printing. Оно позволяет за короткое время создавать объемные объекты. Разработка пока находится на стадии экспериментов и о коммерческом ее использовании ничего не сообщается.

Представлена технология синтеза речи нового поколения Lyrebird
Ученые Монреальского института изучения алгоритмов разработали технологию синтеза речи нового поколения, способную полностью скопировать голос человека. Ей достаточно прослушав речь в течение минуты для того, чтобы затем воспроизвести целые слова и фразы, неотличимые от оригинала.

В Японии создали безвоздушные шины для велосипедов
Ранее японские специалисты создали шины, которым не нужна надкачка. Правда, использовать их можно было лишь на автомобилях. Теперь же очередь дошла и до велосипедов. Производством столь необычных шин занимается японский производитель Bridgestone. В планах компании – выход на рынок с новой продукцией уже через год. Таким образом разработчики собираются успеть к Олимпийским играм 2020 года.

РЖД планирует заказать автопилот для поездов стоимостью в 318 млн рублей
ОАО «Российские железные дороги» начало поиск разработчиков технологий беспилотного вождения поездов. Предполагается, что последняя будет внедряться в перспективе на Московской и Октябрьской железных дорогах. Работать придется быстро, поскольку среди условий РЖД – завершение работа до конца 2019 года.





