Tesla развертывает новую массивную нейронную сеть Autopilot в версии 9 с впечатляющими новыми возможностями, согласно отчету

Хотя Tesla придерживает свою главную новую функцию Autopilot с выпуском версии 9, она все же развернула новую нейронную сеть для Autopilot, и, согласно новому анализу, это массивно большая нейронная сеть с впечатляющими новыми возможностями.

Основываясь на новых возможностях Autopilot в версии 9, мы уже знали, что новая нейронная сеть компьютерного зрения должна была быть значительно обновлена.

Теперь она может отслеживать автомобили и другие объекты вокруг машины — это означает, что она лучше использует 8 камер вокруг автомобиля, а не только камеры, направленные вперед.

Теперь мы лучше понимаем, насколько значительным является обновление нейронной сети Tesla в версии 9, поскольку участник TMC Jimmy_d, эксперт по глубокому обучению, имеющий доступ к программному обеспечению и публикующий свои мысли по каждому обновлению, провел интересный анализ версии 9.

Реклама — прокрутите для большего количества контента

Jimmy подтвердил, что Tesla теперь развернула новую унифицированную сетевую камеру, которая обрабатывает все 8 камер.

Он также перечислил несколько других основных изменений:

  • Один и тот же файл весов используется для всех камер (это имеет весьма интересные последствия, и ранее основной/узкий режим V8, похоже, имел отдельные веса для каждой камеры)
  • Обработанное разрешение 3 передних камер и задней камеры: 1280×960 (полное разрешение камеры)
  • Обработанное разрешение камер на стойках и повторителей: 640×480 (1/2×1/2 истинного разрешения камеры)
  • Все камеры: 3 цветовых канала, 2 кадра (2 кадра также имеют очень интересные последствия) (в V8 было 640×416, 2 цветовых канала, 1 кадр, только основной и узкий режим)

Эти изменения приводят к созданию гораздо более крупной нейронной сети, требующей гораздо большей вычислительной мощности.

Jimmy предполагает, что это может уже приближаться к пределам бортового компьютера — вот почему Tesla работает над обновлением компьютера.

Он попытался передать, насколько больше нейронная сеть в v9 по сравнению с v8:

«Эта сеть V9 — монстр, и это еще не все. Когда вы увеличиваете количество параметров (весов) в нейронной сети в 5 раз, вы получаете не просто в 5 раз большую производительность и вам нужно в 5 раз больше данных для обучения. С точки зрения увеличения выразительной способности это скорее похоже на число с в 5 раз большим количеством цифр. Так что, если выразительная способность V8 была 10, то способность V9 больше похожа на 100 000. Это умопомрачительное расширение сырой мощности. И точно так же объем данных для обучения увеличивается не просто в 5 раз. Вероятно, потребуется как минимум в тысячи, а возможно, и в миллионы раз больше данных, чтобы полностью использовать сеть с в 5 раз большим количеством параметров.

Эта сеть намного больше любой нейронной сети для зрения, публично раскрытой, и я просто поражен мыслью о том, сколько данных требуется для ее обучения. Я долго откладывал эту оценку, потому что думал, что, должно быть, ошибся. Но, перепроверяя снова и снова, я обнаруживаю, что не мои расчеты были неверны, а мои ожидания.

На основании его анализа, версия 9 выглядит более чем инкрементным шагом вперед, когда речь идет о компьютерном зрении.

Обновление: Илон Маск прокомментировал, заявив, что анализ Джимми переоценивает увеличение возможностей, которое оценивается примерно в 400%:

Эксперт по глубокому обучению считает, что Tesla использует свои сильные стороны с этим обновлением:

«Масштабирование вычислительной мощности, данных для обучения и промышленных ресурсов играет на сильных сторонах Tesla и связано с меньшей неопределенностью, чем потенциально более мощные, но менее зрелые методы. В то же время Tesla удваивает свои усилия в подходе «сначала зрение / все нейронные сети» и, насколько я могу судить, похоже, что это идет хорошо.

Мы также начинаем лучше понимать, что видит Autopilot, благодаря усилиям хакеров Tesla.

Вот как предыдущее программное обеспечение Autopilot от Tesla распознавало придорожные сооружения:

Мнение Electrek

Очень обнадеживает видеть такие важные внутренние улучшения Autopilot.

Tesla действительно делает ставку на автономное вождение на основе визуального восприятия и добивается реального прогресса в этом направлении.

Что касается реального опыта использования Autopilot, я проехал около 100 км на Autopilot с v9 за последние несколько дней, и я действительно впечатлен производительностью.

Сначала мне казалось, что он больше «пинг-понгил» между линиями, чего никогда не случалось в предыдущей версии, но, похоже, это исправилось примерно через 50 км.

Теперь опыт вождения на Autopilot на шоссе для меня практически безупречен.

Новая нейронная сеть в V9 также обеспечивает новые отрисовки на центральном дисплее (Model 3) и приборной панели (Model S и Model X).

Tesla теперь отслеживает автомобили вокруг машины и отмечает разницу между легковыми автомобилями, внедорожниками, грузовиками, мотоциклами, и даже отображает пешеходов.

Ей, безусловно, нужны некоторые улучшения, потому что я часто сталкиваюсь со странными отрисовками на низких скоростях или при остановке:

Но эти проблемы не влияют на опыт вождения. Я полагаю, что они также улучшатся с большим объемом данных для обучения новой нейронной сети.

Что вы думаете? Сообщите нам в разделе комментариев ниже.

Конечно, всегда важно держать руки на руле и оставаться внимательным при вождении с Autopilot, независимо от этих улучшений.