Tesla представила суперкомпьютер Dojo: новейшая самая мощная в мире машина для обучения ИИ

На своем AI Day компания Tesla представила свою суперкомпьютерную технологию Dojo, продемонстрировав растущий кадровый потенциал в области разработки собственных чипов.

Автопроизводитель утверждает, что разработал самую быструю в мире машину для обучения ИИ.

На протяжении многих лет Tesla анонсировала разработку нового суперкомпьютера, оптимизированного для обучения видео с помощью нейронных сетей.

Tesla обрабатывает огромные объемы видеоданных от своего парка, насчитывающего более 1 миллиона автомобилей, которые она использует для обучения своих нейронных сетей.

Реклама — прокрутите для продолжения

Автопроизводитель остался недоволен существующими аппаратными решениями для обучения своих нейронных сетей компьютерного зрения и считал, что сможет добиться лучших результатов самостоятельно.

В течение последних двух лет генеральный директор Илон Маск подогревал интерес к разработке собственного суперкомпьютера Tesla под названием «Dojo».

В прошлом году он даже намекнул, что Dojo от Tesla будет иметь мощность более эксафлопса, что составляет один квинтиллион (1018) операций с плавающей запятой в секунду, или 1000 петафлопс.

Это потенциально может сделать Dojo новым самым мощным суперкомпьютером в мире.

Сегодня, на AI Day Tesla, компания представила Dojo.

Генеш Венкатараман, старший директор Tesla по оборудованию Autopilot и руководитель проекта Dojo, провел презентацию.

Инженер начал с представления чипа D1 от Dojo, который использует 7-нанометровую технологию и обеспечивает прорывную пропускную способность и вычислительную производительность:

Site default logo image

Это второй чип, разработанный командой Tesla самостоятельно, после чипа FSD, установленного в оборудовании компьютера FSD 3 в автомобилях Tesla.

Венкатараман продемонстрировал настоящий чип D1 на сцене:

Site default logo image

Инженер прокомментировал новый чип D1:

Он был полностью разработан командой Tesla внутри компании. От архитектуры до корпуса. Этот чип обладает вычислительной мощностью уровня GPU с гибкостью уровня CPU и удвоенной пропускной способностью сетевого чипа.

Tesla утверждает, что достигла значительного прорыва в пропускной способности чипа:

Site default logo image

Tesla разработала чип для «бесшовного соединения друг с другом без каких-либо соединительных элементов», и автопроизводитель использовал это, соединив 500 000 узлов.

Он добавляет интерфейс, питание и управление температурным режимом, и в результате получается то, что он называет «тренировочным тайлом» (training tile):

Site default logo image

В результате получается тренировочный тайл мощностью 9 ПФлопс с пропускной способностью 36 ТБ/с в формате менее 1 кубического фута.

Венкатараман также продемонстрировал настоящий тренировочный тайл Dojo на сцене:

Site default logo image

Инженер прокомментировал это вычислительное устройство:

Это беспрецедентно. Это удивительный инженерный продукт.

Однако на этом представление реального оборудования Dojo компанией Tesla завершилось.

Автопроизводитель сообщил, что недавно запустил нейронную сеть на одном из тайлов, и Венкатараман, казалось, даже удивил Андрея Карпатого, руководителя отдела ИИ Tesla, на сцене, впервые раскрыв, что тренировочный тайл Dojo запустил одну из его нейронных сетей:

Site default logo image

Но теперь еще предстоит сформировать вычислительный кластер, используя эти тренировочные тайлы, чтобы по-настоящему создать первый суперкомпьютер Dojo.

Tesla утверждает, что может объединить 2 x 3 тайла в один лоток, а два лотка — в компьютерный шкаф, что обеспечит более 100 ПФлопс на шкаф:

Site default logo image

Но благодаря своей невероятной пропускной способности Tesla утверждает, что может объединить их все для создания ExaPod.

В системе из 10 шкафов ExaPod от Tesla Dojo преодолеет барьер в эксафлопс вычислений – то, чего производителям суперкомпьютеров долгое время не удавалось достичь:

Site default logo image

Tesla еще не собрала эту систему, но генеральный директор Илон Маск заявил, что она будет запущена в следующем году.

Он станет самым быстрым компьютером для обучения ИИ в мире, будучи энергоэффективным и относительно небольшим по размеру для суперкомпьютера.

Tesla планирует использовать новый суперкомпьютер для обучения своих нейронных сетей для разработки технологий автопилотирования, но также планирует сделать его доступным для других разработчиков ИИ в будущем.

Поскольку это была первая попытка Tesla разработать суперкомпьютер собственными силами, компания также полагает, что существует большой потенциал для улучшений, и намекает на 10-кратное повышение некоторых уровней производительности в следующей версии Dojo.