Tesla представила новый суперкомпьютер Dojo, настолько мощный, что он вызвал сбой в электросети

Tesla представила последнюю версию своего суперкомпьютера Dojo, и он, по-видимому, настолько мощный, что вызвал сбой в электросети в Пало-Альто.

Dojo — это собственная кастомная суперкомпьютерная платформа Tesla, разработанная с нуля для машинного обучения ИИ, и, в частности, для обучения видео с использованием видеоданных, поступающих от парка ее автомобилей.

У автопроизводителя уже есть мощный суперкомпьютер на базе NVIDIA GPU, который является одним из самых мощных в мире, но новый суперкомпьютер Dojo, созданный по индивидуальному заказу, использует чипы и всю инфраструктуру, разработанную Tesla.

Ожидается, что суперкомпьютер, созданный по индивидуальному заказу, повысит возможности Tesla по обучению нейронных сетей с использованием видеоданных, что имеет решающее значение для ее технологии компьютерного зрения, лежащей в основе системы автопилота.

Реклама — прокрутите дальше, чтобы увидеть контент

В прошлом году на Tesla AI Day компания представила свой суперкомпьютер Dojo, но в то время компания еще наращивала свои усилия. У нее был только первый чип и обучающие плитки, и она еще работала над созданием полнофункционального шкафа и кластера Dojo, или «Exapod».

Tesla представила прогресс, достигнутый в программе Dojo за последний год, на своем AI Day 2022 прошлой ночью.

Компания подтвердила, что ей удалось перейти от чипа и плитки к системному лотку и полному шкафу.

Tesla заявила, что один чип Dojo может заменить шесть блоков GPU, при этом, по словам компании, он стоит дешевле одного блока GPU. На каждом лотке расположено шесть таких плиток.

Tesla заявила, что один лоток эквивалентен «3–4 полностью загруженным стойкам суперкомпьютера».

Компания интегрирует свой хост-интерфейс непосредственно в системный лоток для создания большой полной хост-сборки:

Tesla может разместить два таких системных лотка с хост-сборкой в одном шкафу Dojo.

Вот как выглядит шкаф Dojo в закрытом и открытом виде:

На этом Tesla сейчас находится, поскольку автопроизводитель все еще разрабатывает и тестирует инфраструктуру, необходимую для объединения нескольких шкафов для создания первого «Dojo Exapod».

Билл Чанг, главный системный инженер Tesla по Dojo, сказал:

Мы знали, что нам придется пересмотреть каждый аспект инфраструктуры дата-центра, чтобы обеспечить нашу беспрецедентную плотность охлаждения и мощности.

Им пришлось разработать собственную мощную систему охлаждения и электропитания для работы шкафов Dojo.

Чанг сказал, что Tesla вывела из строя местную подстанцию электросети при тестировании инфраструктуры ранее в этом году:

Ранее в этом году мы начали нагрузочное тестирование нашей инфраструктуры электропитания и охлаждения, и нам удалось превысить 2 МВт, прежде чем мы вывели из строя нашу подстанцию и получили звонок от города.

Вот как выглядит Tesla Dojo Exapod в закрытом и открытом виде:

Tesla опубликовала основные характеристики Dojo Exapod: 1,1 EFLOP, 1,3 ТБ SRAM и 13 ТБ DRAM с высокой пропускной способностью.

Компания использовала мероприятие для привлечения новых специалистов, но также сообщила, что планирует завершить свой первый полноценный кластер, или Exapod, в первом квартале 2023 года.

В настоящее время она планирует разместить семь Dojo Exapods в Пало-Альто.

Зачем Tesla нужен суперкомпьютер Dojo?

Это справедливый вопрос. Зачем автопроизводителю разрабатывать самый мощный суперкомпьютер в мире? Tesla заявит, что это не просто автопроизводитель, а технологическая компания, разрабатывающая продукты для ускорения перехода к устойчивой экономике.

Маск сказал, что имеет смысл предлагать Dojo как услугу, возможно, чтобы конкурировать с Amazon AWS своего приятеля Джеффа Безоса, называя ее «услугой, которой вы можете пользоваться онлайн, где вы можете обучать свои модели намного быстрее и за меньшие деньги».

Но более конкретно, Tesla нужен Dojo для автоматической маркировки обучающих видео из своего парка автомобилей и для обучения своих нейронных сетей для создания системы автопилота.

Tesla поняла, что ее подход к разработке системы автопилота с использованием нейронных сетей, обучаемых на миллионах видео, поступающих от ее клиентского парка, требует огромной вычислительной мощности; она решила разработать собственный суперкомпьютер для обеспечения этой мощности.

Это краткосрочная цель, но у Tesla будет много возможностей использовать суперкомпьютер и в будущем, поскольку у нее есть большие амбиции по разработке других программ искусственного интеллекта.