
Глава отдела искусственного интеллекта Tesla признал, что подход автопроизводителя к автопилоту сложнее, чем то, что делают большинство компаний в отрасли, но он считает, что это единственный способ масштабирования.
Существуют десятки известных компаний, работающих над решением проблемы автопилота, и практически столько же различных подходов, но есть два основных отличия: те, кто полагается в основном, если не полностью, на компьютерное зрение, и те, кто полагается на HD-карты.
Tesla относится к первой категории, полагаясь на компьютерное зрение.
Андрей Карпатый, глава отдела искусственного интеллекта и компьютерного зрения Tesla, возглавляет эту работу.
Ранее на этой неделе он участвовал в семинаре CVPR’20 «Масштабируемость в автономном вождении», во время которого рассказал о статусе программы Tesla и проблемах масштабирования:
Во время презентации Карпатый показал видео демонстрации программного обеспечения Tesla для разработки автопилота, выполняющего поворот, а затем прототип автопилота Waymo, выполняющий то же самое.
Он подчеркнул, что это выглядит совершенно одинаково, но процесс принятия решений, который лежит в основе маневра, совершенно иной:
Waymo и многие другие в отрасли используют карты высокой четкости. Сначала нужно проехать на машине, которая предварительно наносит на карту окружение, у вас должен быть лидар с точностью до сантиметра, и вы движетесь по рельсам. Вы точно знаете, как повернете на перекрестке, точно знаете, какие светофоры имеют для вас значение, знаете, где они расположены, и все остальное. Мы не делаем таких предположений. Для нас каждый перекресток, на который мы выезжаем, мы видим впервые. Все должно быть продумано — точно так же, как поступил бы человек в той же ситуации.
Карпатый признает, что это сложная проблема.
Однако инженер объясняет, что Tesla стремится к масштабируемой системе автопилота, которую можно развернуть на миллионах автомобилей на дорогах, и утверждает, что система Tesla, основанная на зрении, проще в масштабировании:
Говоря о масштабируемости, это гораздо более сложная проблема, но когда мы ее решим, появится возможность передать ее на миллионы автомобилей на дорогах. В то время как создание этих лидарных карт в том масштабе, в котором мы работаем, с использованием таких датчиков, было бы чрезвычайно дорого. И вы не можете просто создать их, вы должны их поддерживать, а отслеживание изменений в них чрезвычайно затруднено.
Инженер описал подход, основанный на картах, как «нерасширяемый подход».
Он отметил, что Tesla также создает карты и использует «все виды слияний между зрением и картами», но их карты не отличаются высокой точностью, и поэтому они не могут полагаться на них для навигации.
Tesla должна уметь справляться с любой ситуацией, как будто она видит ее впервые.
Карпатый объясняет, как им это удается, имея всего «несколько десятков человек», работающих над нейронными сетями.
Все построено вокруг общей инфраструктуры компьютерного зрения, вокруг которой они, в свою очередь, создают новые задачи. Хотя над нейронными сетями работают всего несколько десятков человек, у них есть «огромная» команда, занимающаяся маркировкой.
Другими словами, они разделяют основную систему обнаружения объектов с помощью зрения и отдельные задачи, которые система должна выполнять, например, распознавать все типы знаков «Стоп».
Инженер высказался о конкурентах, полагающихся на карты:
Не предполагайте, что мы, как отрасль, сможем обойтись HD-лидарными картами для глобального внедрения этих функций. Я бы взял лидарные карты, и особенно потоки всех полос движения, трафика и так далее, и подумал бы, как вы можете предсказать перекресток, не предполагая наличия лидарных карт.
Вы можете посмотреть полную презентацию по ссылке выше.
Мнение Electrek
Мне нравится, что Карпатый не стесняется признавать, что это более сложная проблема, чем те, которые пытаются решить Waymo и большинство других компаний в этой области.
Дело в данных. Tesla создает большие наборы данных и курирует их таким образом, чтобы в их нейронную сеть поступали только качественные данные.
Было особенно интересно понять, как Tesla собирает данные. Карпатый привел пример знаков «Стоп», закрытых листвой. Они собрали несколько изображений, а затем создали классификатор, чтобы парк автомобилей клиентов искал знаки «Стоп», закрытые листвой, собрали набор данных и использовали его для обучения своей нейронной сети.
Очень круто.
Tesla имеет огромное преимущество в сборе большого количества данных с сотен тысяч автомобилей, но он описывает поиск нужных данных как поиск иголки в стоге сена. Проблема масштабирования Tesla заключается в поиске этих иголок, которые представляют собой полезные сценарии, встречающиеся автомобилями Tesla, и использовании их в своих наборах данных для обучения нейронной сети.
Я думаю, что владельцы Tesla могут помочь в этом.
Они уже могут отправлять Tesla обратную связь по временным меткам со своих автомобилей. Было бы здорово иметь какую-нибудь геймификацию, чтобы помочь Tesla находить нужные данные.
Используя пример Карпатого, Tesla могла бы иметь в машине приложение с еженедельным заданием: «Сообщайте о знаках «Стоп», закрытых листвой».
Когда владельцы Tesla ездят и видят знак «Стоп», закрытый листвой, они делают голосовую команду, которая отправляет данные в Tesla, и вы набираете очки. На основе этих очков Tesla могла бы предоставить бесплатные мили Supercharging или что-то в этом роде.
Команда Autopilot могла бы обновлять эти задания в зависимости от конкретной проблемы, над которой они работают.
Что вы думаете? Дайте нам знать в разделе комментариев ниже.