
Хотя Tesla придерживает свою главную новую функцию Autopilot с выпуском версии 9, она все же развернула новую нейронную сеть для Autopilot, и, согласно новому анализу, это массивно большая нейронная сеть с впечатляющими новыми возможностями.
Основываясь на новых возможностях Autopilot в версии 9, мы уже знали, что новая нейронная сеть компьютерного зрения должна была быть значительно обновлена.
Теперь она может отслеживать автомобили и другие объекты вокруг машины — это означает, что она лучше использует 8 камер вокруг автомобиля, а не только камеры, направленные вперед.
Теперь мы лучше понимаем, насколько значительным является обновление нейронной сети Tesla в версии 9, поскольку участник TMC Jimmy_d, эксперт по глубокому обучению, имеющий доступ к программному обеспечению и публикующий свои мысли по каждому обновлению, провел интересный анализ версии 9.
Jimmy подтвердил, что Tesla теперь развернула новую унифицированную сетевую камеру, которая обрабатывает все 8 камер.
Он также перечислил несколько других основных изменений:
- Один и тот же файл весов используется для всех камер (это имеет весьма интересные последствия, и ранее основной/узкий режим V8, похоже, имел отдельные веса для каждой камеры)
- Обработанное разрешение 3 передних камер и задней камеры: 1280×960 (полное разрешение камеры)
- Обработанное разрешение камер на стойках и повторителей: 640×480 (1/2×1/2 истинного разрешения камеры)
- Все камеры: 3 цветовых канала, 2 кадра (2 кадра также имеют очень интересные последствия) (в V8 было 640×416, 2 цветовых канала, 1 кадр, только основной и узкий режим)
Эти изменения приводят к созданию гораздо более крупной нейронной сети, требующей гораздо большей вычислительной мощности.
Jimmy предполагает, что это может уже приближаться к пределам бортового компьютера — вот почему Tesla работает над обновлением компьютера.
Он попытался передать, насколько больше нейронная сеть в v9 по сравнению с v8:
«Эта сеть V9 — монстр, и это еще не все. Когда вы увеличиваете количество параметров (весов) в нейронной сети в 5 раз, вы получаете не просто в 5 раз большую производительность и вам нужно в 5 раз больше данных для обучения. С точки зрения увеличения выразительной способности это скорее похоже на число с в 5 раз большим количеством цифр. Так что, если выразительная способность V8 была 10, то способность V9 больше похожа на 100 000. Это умопомрачительное расширение сырой мощности. И точно так же объем данных для обучения увеличивается не просто в 5 раз. Вероятно, потребуется как минимум в тысячи, а возможно, и в миллионы раз больше данных, чтобы полностью использовать сеть с в 5 раз большим количеством параметров.
Эта сеть намного больше любой нейронной сети для зрения, публично раскрытой, и я просто поражен мыслью о том, сколько данных требуется для ее обучения. Я долго откладывал эту оценку, потому что думал, что, должно быть, ошибся. Но, перепроверяя снова и снова, я обнаруживаю, что не мои расчеты были неверны, а мои ожидания.
На основании его анализа, версия 9 выглядит более чем инкрементным шагом вперед, когда речь идет о компьютерном зрении.
Обновление: Илон Маск прокомментировал, заявив, что анализ Джимми переоценивает увеличение возможностей, которое оценивается примерно в 400%:
To be clear, actual NN improvement is significantly overestimated in this article. V9.0 vs V8.1 is more like a ~400% increase in useful ops/sec due to enabling integrated GPU & better use of discrete GPU.
— Elon Musk (@elonmusk) October 16, 2018
Эксперт по глубокому обучению считает, что Tesla использует свои сильные стороны с этим обновлением:
«Масштабирование вычислительной мощности, данных для обучения и промышленных ресурсов играет на сильных сторонах Tesla и связано с меньшей неопределенностью, чем потенциально более мощные, но менее зрелые методы. В то же время Tesla удваивает свои усилия в подходе «сначала зрение / все нейронные сети» и, насколько я могу судить, похоже, что это идет хорошо.
Мы также начинаем лучше понимать, что видит Autopilot, благодаря усилиям хакеров Tesla.
Вот как предыдущее программное обеспечение Autopilot от Tesla распознавало придорожные сооружения:
Мнение Electrek
Очень обнадеживает видеть такие важные внутренние улучшения Autopilot.
Tesla действительно делает ставку на автономное вождение на основе визуального восприятия и добивается реального прогресса в этом направлении.
Что касается реального опыта использования Autopilot, я проехал около 100 км на Autopilot с v9 за последние несколько дней, и я действительно впечатлен производительностью.
Сначала мне казалось, что он больше «пинг-понгил» между линиями, чего никогда не случалось в предыдущей версии, но, похоже, это исправилось примерно через 50 км.
Теперь опыт вождения на Autopilot на шоссе для меня практически безупречен.
Новая нейронная сеть в V9 также обеспечивает новые отрисовки на центральном дисплее (Model 3) и приборной панели (Model S и Model X).
Tesla теперь отслеживает автомобили вокруг машины и отмечает разницу между легковыми автомобилями, внедорожниками, грузовиками, мотоциклами, и даже отображает пешеходов.
Ей, безусловно, нужны некоторые улучшения, потому что я часто сталкиваюсь со странными отрисовками на низких скоростях или при остановке:
Tesla’s Autopilot on v9 shows great improvements when it comes to rendering the surroundings on the screen, but I’m often getting those weird bugs when stopped or at low speeds. pic.twitter.com/uvfflQUaKw
— Fred Lambert (@FredericLambert) October 15, 2018
Но эти проблемы не влияют на опыт вождения. Я полагаю, что они также улучшатся с большим объемом данных для обучения новой нейронной сети.
Что вы думаете? Сообщите нам в разделе комментариев ниже.
Конечно, всегда важно держать руки на руле и оставаться внимательным при вождении с Autopilot, независимо от этих улучшений.