Roborock: Как устроено компьютерное зрение?

Сегодня мы раскажем вам про искусственный интеллект и компьютерное зрение. Да, роботы всё уже видят и наблюдают за нами пока выполняют наши поручения.
vedensky 13 декабря 2020 в 06:06

Мы запускаем камеру на смартфоне, наводим на объект и видим маленькую иконку внизу. Смартфон понимает — что именно мы снимаем. Вы когда-нибудь задумывались, как это работает?

Беспилотные автомобили спокойно объезжают машины и тормозят перед пешеходами, камеры видеонаблюдения на улицах распознают наши лица, а пылесосы отмечают на карте, где лежат тапочки — всё это не чудеса. Это происходит прямо сейчас. И всё благодаря компьютерному зрению.

Поэтому сегодня разберем, как работает компьютерное зрение, чем оно отличается от человеческого и чем может быть полезно нам, людям?

Для того чтобы хорошо ориентироваться в пространстве человеку нужны глаза, чтобы видеть, мозг, чтобы эту информацию обрабатывать, и интеллект, чтобы понимать, что ты видишь. С компьютерным или, даже вернее сказать, машинным зрением, такая же история. Для того, чтобы компьютер понял, что он видит, нужно пройти 3 этапа:

  1. Нам нужно как-то получить изображение
  2. Нам нужно его обработать
  3. И уже только потом проанализировать

Пройдёмся по всем этапам и проверим, как они реализованы. Сегодня мы будем разбираться, как роботы видят этот мир, и поможет нам в этом робот-пылесос Roborock S6 MaxV, который напичкан современными технологиями компьютерного зрения.

Этап 1. Получение изображения

В начале компьютеру надо что-то увидеть. Для этого нужны разного рода датчики. Насколько много датчиков и насколько они должны быть сложные зависит от задачи. Для простых задач типа детектора движения или распознавания объектов в кадре достаточно простой камеры или даже инфракрасного сенсора.

В нашем пылесосе есть целых две камеры, они находятся спереди. А вот, например, для ориентации в трехмерном пространстве понадобятся дополнительные сенсоры. В частности 3D-сенсор. Тут он тоже есть и расположен сверху. Но что это за сенсор?

LiDAR

Вообще с названиями 3D-сенсоров есть небольшая путаница, одно и тоже часто называют разными словами.

Эта штука сверху — называется LDS или лазерный датчик расстояния, по-английски — Laser Distance Sensor. Подобные датчики вы наверняка могли заметить на крышах беспилотных беспилотных автомобилей. Это не мигалка, это лазерный датчик расстояния, такой же как на роботе пылесосе.

Вот только в мире беспилотников такой сенсор принято называть лидаром — LIDAR — Light Detection and Ranging. Да-да, как в новых iPhone и iPad Pro.

А вот в Android-смартфонах вместо лидаров используется термин ToF-камера: ToF — Time-of-flight.

Но, как ни называй, все эти сенсоры работают по одному принципу. Они испускают свет и замеряет сколько ему понадобится времени, чтобы вернуться обратно. То есть прямо как радар, только вместо радиоволн используется свет.

Есть небольшие нюансы в типах таких сенсоров, но смысл технологии от этого не меняется. Поэтому мне, чисто из-за созвучия с радаром, больше всего нравится название LiDAR, так и будем называть этот сенсор.

Кстати, лидары использует не только в задачах навигации. Благодаря лидарам сейчас происходит настоящая революция в археологии. Археологи сканируют территорию с самолета при помощи лидара, после чего очищают данные ландшафта от деревьев. И это позволяет находить древние города, скрытые от глаз человека!

Также помимо статических лидаров, направленных в одну сторону, бывают вращающиеся лидары, которые позволяют сканировать пространство вокруг себя на 360 градусов. Такие лидары используется в беспилотных автомобилях, ну и в этом роботе-пылесосе.

Еще 8 лет назад такие сенсоры стоили каких-то невероятных денег, под 100 тысяч долларов. А теперь у вас по дому может спокойно ездить маленький беспилотник.

Лидар в пылесосе

Окей, тут лидар используется для построения карты помещения и это не новая история. Такую технологию мы видели еще года 3-4 назад.

Благодаря лидару и построенной карте, пылесос ездит не рандомно как скринсейвер в Windows, стукаясь об углы, а аккуратно проезжая всю площадь (модели без лидаров обычно катаются странно).

Но внутри пылесоса стоит, на секундочку, восьмиядерный Qualcomm Snapdragon 625 (Qualcomm APQ8053), поэтому у него хватает мозгов не только построить карту, но и ориентироваться по ней.

Более того пылесос может хранить в памяти до четырёх карт и распознаёт этажи. Это существенно ускоряет уборку. Потому при переносе с этажа на этаж пылесос это может поять и не тратит время, чтобы построить карту заново.

Также каждую из 4 карт можно поделить на 10 специальных зон. Для которых можно настроить свои параметры уборки: мощность всасывания (до 2500 Па), количество проходов и прочее. А куда-то можно вообще запретить ездить. Можно даже выбирать сухую и влажную уборку для разных зон. Правда для этого не нужно подключать/отключать отдельный резервуар с водой. И всё это стало возможно благодаря лидару.

Тем не менее у технологии есть некоторые недостатки — очень разреженные данные. Пространство сканируется линиями. В больших автомобильных радарах разрешение — от 64 до 128 линий. Плюс ко всему у лидар есть мертвая зона. Если лидар стоит на крыше — то он не видит, что творится в достаточно большом радиусе вокруг него.

Также в роботе-пылесосе лидар тут сканирует пространство всего одним лучом. Поэтому, всё что он видит — это тонкая линия на высоте где-то 9-10 сантиметров от пола. Это позволяет определять где стены и мебель, но он не видит того, что валяется на полу.

Две камеры

Поэтому, чтобы исправить этот недочет лидаров. как в автомобили, так и в пылесосы ставят дополнительные камеры. Тут камеры сразу две, и они обеспечивают стереоскопическое зрение. Да-да, у пылесоса всё как у людей — два глаза.

Две камеры, во-первых, позволяют убрать мертвую зону впереди пылесоса. А во вторых позволяют достаточно точно определять расстояние до валяющихся на полу предметов.

Это позволяет пылесосу обнаруживать предметы размером не менее 5 см в ширину и 3 см в высоту и объезжать их.

Этап 2. Обработка

Итак, мы получили достаточно данных с различных сенсоров. Поэтому переходим ко второму этапу компьютерного зрения — обработке.

Данные с лидара мы получаем в виде трехмерного облака точек, которые фактически не нуждаются в дополнительной обработке.

Как получить стерео с двух камер тоже понятно — высчитывается разница между изображениями снятыми чуть под разным углом и так строится карта глубины. Это несложно.

Но вот совместить данные с разных сенсоров — это нетривиальная задача.

Например, пылесос на полу обнаружил какой-то предмет. Дальше ему нужно понять где именно он находится на карте построенной при помощи лидара. А также нужно предположить какие у него габариты по проекции с одной стороны. То есть нам нужно поместить предмет в некий объёмный куб правильного размера.

Эту задачу можно решить разными способами. Один из способов называется “усеченная пирамида”. Сначала на камере обнаруживаются предметы. Потом эти предметы помещаются в конус, а объем этого конуса вычисляется нейросетью.

Поэтому даже, казалось бы, такая тривиальная задача требует серьёзных вычислений и решается при помощи нейросетей.

А раз мы заговорили про нейросети, значит мы уже немного зашли на 3-й этап компьютерного зрения — анализ.

Этап 3. Анализ

За распознавание, сегментацию и классификацию объектов на изображении в современном мире в основном отвечают нейросети. Мы даже делали подробный ролик о том как это работает, посмотрите.

Если кратко, нейросеть — это такое большое количество уравнений, связанных между собой. Загружая в нейросеть любые данные — ты обязательно получишь какий-то ответ.
Но, например, если постоянно загружать в нейросеть фотографии кошечек, и указать ей, что ответ должен быть — кошка. В какой-то момент, нейросеть перестает ошибаться на обучающей выборке. И тогда ей начинают показывать новые незнакомые изоражения и если на них она тоже безошибочно определяет кошек — нейросеть обучена.

Дальше нейросеть оптимизируется для того, чтобы она стала меньше, быстро работала и не жрала много ресурсов. После этого она готова к использованию.

Что-то похожее происходит с нейронными связями в человеческом мозге. Когда мы чему-то учимся или запоминаем, мы повторяем одно и то же действие несколько раз. Нейронные связи в мозге постепенно укрепляются и потом нам это легко даётся!

Например, в данном пылесосе за работу нейросети отвечает встроенный NPU-модуль. Всё-таки внутри Snapdragon, пылесос может себе такое позволить.

Нейронка предобучена определять различные предметы домашнего обихода: игрушки, тапочки, носки, всякие удлинители, зарядки и даже неожиданности от домашних животных.

Распознавание предметов происходит при помощи гугловской библиотеке Tensorflow. Алгоритм самообучается и умнеет от уборки к уборке.

Практика

В Roborock технология распознавания называется Reactive AI. Мы протестировали насколько она хорошо работает на практике.

Кайфовая штука, что все найденные предметы пылесос отмечает не карте. Поэтому теперь, я не обещаю, но такое возможно, вы всё-таки обнаружите логово пропавших носков.

Проследить за тем, что видит пылесос всегда можно через фирменное приложение или Mi Home от Xiaomi. Можно даже просто кататься по дому управляя пылесосом слать на него голосовые сообщения. Управлять пылесосом можно также через Google Ассистента или Алису. Всё на русском языке.

С недавних пор бренд начал официально продаётся в России, поэтому устройства полностью локализованные.

Внутри кстати стоит батарейка на 5200 мАч, которая способна выдержать до 3 часов уборки.

Итоги

Ребят, ну вы сами всё видели. Правда, стоит обратить внимание, что пока корректное распознавание предметов работает только если запускать пылесос через приложение Roborock. И это нюанс, поскольку оно пока недоступно в Play Market Россия. Но в течение нескольких месяцев оно появится, а пока его можно скачать и установить в виде apk-файла.

iPad Pro 2020: За и против!

Конструктивный спор о нужности iPad Pro. Что это проходное устройство или лучшее устройство на планете Земля?
aka_opex 20 марта 2020 в 03:34

Мы очень любим поспорить между собой, но стараемся не доказывать что-то повышая голос и кидая друг в друга гаджета, а конструктивно и по делу. На этот раз Валерий Истишев и Борис Веденский затёрли за и против новенького iPad Pro. Что это — лучший компьютер на Земле или просто крутой планшет? Сильны ли изменения в сравнении с прошлой версией? И главное — нужен ли он вообще?

Первая и главная мысль: iPad Pro в версии 2020 модельного года — проходное устройство и это обновление абсолютно не обязательное!

Клавиатура и Дизайн

Валера: Вместо «папки» мы получили полноценную клавиатуру с технологией «ножницы». На ней удобно набирать текст. Здесь есть подсветка и шарнир — то есть планшет можно повернуть под любым углом и быстро схватить его.

В конечном счёте мы получаем аналог MacBook Air, да еще и с двумя USB Type-C, а также трекпадом со всеми жестами.

Боря: Интересно, что мы вроде как обсуждаем iPad, но в реальности говорим об аксессуаре к нему.

Понятно, что новые фишки — это замечательно. Но есть два вопроса: надёжность конструкции и масса.

Новая клавиатура получила подсветку. А значит в ней есть аккумулятор. А это значит, что она весит больше обычной. Ну и главная претензия к клавиатуре в том, что она выйдет только в мае. А ведь это главная «инновация» нового iPad Pro.

Конструкция не выглядит надёжной. Для меня это устройство, которое можно достать где угодно: хоть в такси, хоть на встрече — и будет удобно набирать текст. Главная фишка iPad это компактность и мобильность. Сейчас ощущения, что это удобно — нет, но это надо проверять.

А ещё на клавиатуре нет кнопки ESC. Ну и главное — цены в 300 долларов, то есть в районе 30 тысяч рублей на локальном рынке.

iPad OS

Валера: iPad OS внесла уже много. Например, файловый менеджер сделал так, что планшет практически превратился в ноутбук. Здесь же привнесли поддержку мышки и трекпада. Я скептически к этому отнёсся, ведь есть тач-интерфейс, но если копнуть глубже, мы получаем полноценную замену ноутбуку. Можно брать профессиональный софт и портировать на iPad, кроме того работа с таблицами Excel, работа в графических редакторах, да и работа с обычными сайтами, которые адаптированы на обычный указатель мышки. Курсор тоже здесь эволюционировал, Apple его переосмыслил: наводите на кнопку, он становится кнопкой, наводите в поле, он его покрывает. Ну а когда он не нужен, он просто исчезает.

Боря: Пожалуй, единственная вещь, которую хочется попробовать в новом iPad Pro — операционка и как она взаимодествует с трекпадом, мышью и так далее. Но как ни парадоксально, именно это и подтверждает, что устройство новое не нужно — все новое появится в прошивке. И уже на следующей неделе выйдет iPad OS 13.4, где и будут все фишки.

Превращение iPad в ноутбук — это сложная задача и этому мешает то, что под планшет до сих пор не хватает полноценных десктопных приложений. Например, Adobe Premier так и не собирается туда переезжать. Появился Photoshop, но он глючный и лагучий, судя по отзывам.

Камера

Боря: И тут вы должны возмутиться: «Что же вы всё про софт, да аксессуары? Что с самой железкой?» Проблема в том, что в ней практически ничего не изменилось. Единственное заметное новшество — обновлённая камера. Здесь появилась сверхширокоугольная камера. Есть проблемы:

  • В iPhone эта камера не то чтобы огненная.
  • Её разрешение — 10 Мп, то есть она хуже по чем iPhone.
  • Зачем она нужна? Когда вы последний раз снимали фото или видео на планшет? Я так не делаю, хотя постоянно пользуюсь iPad.

Валера: В чём-то я даже с тобой согласен, я сам очень редко фотографирую на iPad. Разве что когда iPhone садится, а мне срочно нужно что-то сфотографировать. Но вторая камера здесь появилась по другой причине. Это сверхширокий угол — по сути, то что мы видим из глаз. Она скорее всего будет применяться для AR — дополненной реальности. Кроме того можно придумать некоторые другие применения для двух камер. Насколько я знаю, iPad часто используется для онлайн-трансляций, это удобный и мощный инструмент. Можно транслировать онлайн событие, монтировать прямо на экране и добавлять спецэффекты и титры. Это удобнее делать с двумя камерами — есть возможность переключаться, чтобы разнообразить картинку. А в дополнении с LiDAR, когда подключатся разработчики, iPad раскроется с другой стороны и какие-то новые фишки будут приходить.

Боря: Где эти люди? Я не вижу вокруг себя операторов, фотографов и художников, которые бы носились с iPad, что-то снимали и монтировали. Но я подсадил несклоько людей на iPad. У меня жена теперь пользуется им, несколько коллег начали пользоваться как основными устройствами. Для текста, почты и офисных штук — устройство отлично подходит!

Спецификации

Боря: Я продолжу набрасывать на характеристики, потому что практически ничего не изменилось. Да, здесь прекрасный дисплей, но почти такой же как в прошлом поколении. Важная вещь — процессор A12Z Bionic — какой-то чуть улучшенный процессор, но не A13 Bionic из iPhone 11 Pro. Почему не заслужил — непонятно.

Нет 5G! Хотя в этом году все устройства будут выпускаться с 5G и есть рынки, для которых это важно.

Есть и странные вещи: Apple говорит, что в новом iPad сразу пять микрофонов и они студийного качества. Любой человек, который хоть немного разбирается в звуке знает, что нужна мембрана большого диаметра, чтобы ловить низкие частоты. Такой микрофон в iPad вставить невозможно. Почему нам до сих пор вешают лапшу на уши про это?

Текущий iPad Pro работает прекрасно и быстро! Непонятно, что нового вообще можно вставить в планшет, чтобы это имело смысл.

Валера: В чём-то я с тобой соглашусь. Перед нами эволюционное развитие iPad: поставили новый процессор, в нём теперь восьмиядерный GPU. В iPad всегда делается упор именно на графический ускоритель. Кроме того мы получили Wi-Fi 6, обновлённый и ускоренный LTE. До 5G нам как до небес пока что…

Что касается накидывания про микрофоны. Apple всегда славился качеством компонентов. И если они говорят про качественные микрофоны, значит их качество близко к этому. Я понимаю, что невозможно, что засунуть какой-нибудь студийный микрофон, как например BOYA PM700 в маленький планшет, это просто физически невозможно. Но я думаю, что они что-то придумали как минимум с обработкой звука.

Боря: Кино снимем!

Валера: Две камеры у нас есть, пять микрофонов. Что ещё тебе надо?

LiDAR

Валера: В простонародии это ToF-сенсор или что-то в этом роде. Для чего он нужен? Мне кажется, это действительно большое изменение в устройствах Apple. Ранее мы видели подобные сенсоры в Android-устройствах и они как будто что-то делали, чуть улучшали портреты например. Разницы, если сравнивать смартфон с ToF и без ToF — мы не видим.

Apple подходит к таким вещам более фундаментально. Если они засунули её в планшет, значит будут использовать на всех уровнях.

В фотографии, в портретах можно будет менять точку фокуса. Но по сути, главное применение этой технологии в AR. Ваш iPad получает глаза, точные и быстрые. Устройство будет опознавать пространство вовкруг и его глубину на расстоянии пяти метров. Можно будет расставлять виртальную мебель по комнате: все это будет работать быстрее и точнее, чем раньше.

Моя основная мысль — Apple проводит большой тест на своих устройствах, отрабатывая механизм машинного зрения и AR-возможностей. Скорее всего мы скоро увидим революционный продукт — очки от Apple, которые мы все ждём.

Боря: А также Apple Car и Apple Телевизор, которые мы ждём с 2009 года.

Это замечательно, что мне предлагают быть подопытным пользователем техники и технологий. Apple — молодцы, что придумали исопльзовать это слово в своих маркетинговых текстах. Слово и правда крутое, многие о LiDAR слышали, ведь они используются в машинах с автопилотами, но по сути это радар, который работает на спектре света или лазера. Замечательно, что эту технологию встроили. Буду честен, я отношусь к тем людям, которые не верят в дополненную реальность. Я не помню, также как и с камерой, когда запускал AR, кроме тех случаев, когда я хотел что-то протестировать или посмотреть весёлую демку.

В тот момент, когда все фанаты Apple смеялись над радарами в Pixel, эти штуки хотя бы делали понятную функцию. Может быть она не всегда работает, но понятно — зачем она нужна. Что LiDAR нужен, чтобы мебель из IKEA расставлять? Серьёзно?

Валера: Прекрати, просто сканер в Pixel у тебя просто не работает в России. Ты не пробовал им пользоваться. Они сделали технологию ради технологии. Да можно водить рукой и переключать треки, но единственное, что он делает в Pixel — ускоряет разблокировку лица.

Боря: Он делает хоть что-то полезное… Берешь планшет и сканируешь полку, стул…

Валера: LiDAR в iPad Pro будет использоваться в различных аспектах. Я уверен, что и в фотографии, и в видео. Появятся какие-то новые фишки, о которых нам не объявляли. Презентации же не было, я уверен, что фишки будут приходить.

Боря: Вот столько фишек!!!

Валера: Вспомни потом моё слово…

Боря: Слышишь этот звук, Валера? Это едет вагон фишек…

В видеоролике, кстати есть голосование: на чьей стороне вы.

Младшая версия с 11-дюймовым дисплеем будет начинаться от 69 990 рублей, а старшая от 86 990 рублей. Если же говорить о том, стоит ли заменять свой iPad Pro, если у вас есть предыдущая версия — мы бы не советовали прямо сейчас бежать и покупать новый планшет. Изменений не так много и текущий iPad — это отличная железка. Единственное, что можно посоветовать — дождаться новую клавиатуру, ведь она совместима с прошлым поколением. Но она обойдётся в 26 990 или 30 990 рублей в зависимости от диагонали планшета. И это больно. И вообще, будем честны, непонятно, как новые устройства вообще будут доезжать до России и это большой вопрос. Народ челноками в самолётах точно не полетит, да и откуда — ведь магазины Apple в Европе и США — закрыты.

Машина времени: 7 вау-технологий в автомобилях будущего

Егор Беляков 26 октября 2014 в 04:03

Как бы ни радовало обладание собственным транспортным средством, это не всегда приятно. Бесплодные поиски парковочного места, лихачи в спальных районах и внезапные тупики на шоссе могут взбесить даже потомственных дзен-водителей. Однако Droider знает, что новая волна инноваций уже начала делать автомобили смышлёние, проворнее и безопаснее.

Ретро-автомобиль

Специально к Дню автомобилиста мы провели ревизию последних достижений и выбрали 7 технологий, после знакомства с которыми вам непременно захочется, чтобы будущее наступило побыстрее.
(далее…)