
Tesla работает над важным новым продуктом, который, по их утверждению, позволит им обеспечить полную автономность своих автомобилей: новым ИИ-чипом, или «ускорителем нейронной сети», который будет выпущен в рамках обновления компьютера Autopilot Hardware 3.0.
Мы обнаружили серию новых патентных заявок от Tesla, касающихся этого нового компьютера.
Как сообщалось ранее, в 2016 году Tesla наняла команду разработчиков чипов и руководителей из AMD, которые теперь возглавляет бывший архитектор чипов Apple Питер Бэннон, для создания нового компьютера, который будет питать систему автопилота Tesla.
Бэннон, наряду с несколькими бывшими инженерами AMD, такими как Эмиль Талпес, давний архитектор чипов AMD, работавший над ядром K12 ARM, и Дебджит Дас Сарма, бывший ведущий архитектор ЦП в AMD, все указаны в серии патентных заявок, связанных с новым компьютером.
В одной из патентных заявок, опубликованных сегодня, Tesla объясняет, почему они решили отказаться от ЦП и ГП для своей системы машинного обучения:
«Обработка для машинного обучения и искусственного интеллекта обычно требует выполнения математических операций над большими наборами данных и часто включает решение нескольких сверточных и пулинговых слоев. Методы машинного обучения и искусственного интеллекта обычно используют матричные операции и нелинейные функции, такие как функции активации. Приложения машинного обучения включают в себя автомобили с автопилотом и помощью водителю. В некоторых сценариях для обучения и инференса машинного обучения используются компьютерные процессоры. Традиционные компьютерные процессоры способны очень быстро выполнять одну математическую операцию, но обычно могут обрабатывать ограниченный объем данных одновременно. В качестве альтернативы могут использоваться графические процессоры (ГП), способные выполнять те же математические операции, но над большим набором данных параллельно. Используя множество процессорных ядер, ГП могут выполнять несколько задач параллельно и обычно способны быстрее выполнять крупные задачи графической обработки, использующие параллелизм, чем традиционный компьютерный процессор. Однако ни ГП, ни традиционные компьютерные процессоры изначально не были разработаны для операций машинного обучения или искусственного интеллекта. Операции машинного обучения и искусственного интеллекта часто полагаются на многократное применение набора специфических операций процессора машинного обучения к очень большим наборам данных. Следовательно, существует потребность в микропроцессорной системе, которая поддерживает выполнение специфических операций машинного обучения и искусственного интеллекта над большими наборами данных параллельно без накладных расходов на несколько процессорных ядер для каждой параллельной операции».
Серия патентов описывает микропроцессор, разработанный для решения этой проблемы.
Новые патенты Tesla на ИИ-чипы
Ускоренный математический движок
Tesla описывает изобретение в патентной заявке:
«Различные воплощения данного раскрытия относятся к ускоренному математическому движку. В определенных воплощениях ускоренный математический движок применяется для обработки изображений таким образом, что свертка изображения ускоряется с использованием двумерного матричного процессора, состоящего из подсхем, включающих АЛУ, выходной регистр и теневой регистр. Эта архитектура поддерживает тактовую двумерную архитектуру, в которой данные изображения и веса умножаются синхронизированным образом, позволяя выполнять большое количество математических операций параллельно».
Вот несколько чертежей и схем из патентной заявки:
Вот полная патентная заявка:
[scribd id=398220774 key=key-edaiGfUrqgpzXH0fntqt mode=scroll]
Микропроцессорная система с вычислительным массивом и переменной задержкой доступа к памяти
Tesla описывает изобретение в патентной заявке:
«Микропроцессорная система включает вычислительный массив и аппаратный арбитр. Вычислительный массив включает множество вычислительных блоков. Каждый из множества вычислительных блоков работает с соответствующим значением, адресованным из памяти. Аппаратный арбитр сконфигурирован для управления выдачей по крайней мере одного запроса на память для одного или нескольких соответствующих значений, адресованных из памяти для вычислительных блоков. Аппаратный арбитр также сконфигурирован для планирования выдачи управляющего сигнала на основе выдачи запросов на память».
Вот несколько чертежей и схем из патентной заявки:
Вот полная патентная заявка:
[scribd id=398220661 key=key-HwuHE0nzW7oHjgYseeOK mode=scroll]
Микропроцессорная система с вычислительным массивом, использующая форматирование не последовательных данных
Tesla описывает изобретение в патентной заявке:
Микропроцессорная система включает вычислительный массив и аппаратный форматтер данных. Вычислительный массив включает множество вычислительных блоков, каждый из которых работает с соответствующим значением, адресованным из памяти. Значения, обрабатываемые вычислительными блоками, синхронно предоставляются вычислительному массиву в виде группы значений для параллельной обработки. Аппаратный форматтер данных сконфигурирован для сбора группы значений, где группа значений включает первый подмножество значений, расположенных последовательно в памяти, и второе подмножество значений, расположенных последовательно в памяти. Первый подмножество значений не обязательно должно располагаться последовательно в памяти относительно второго подмножества значений.
Вот несколько чертежей и схем из патентной заявки:
Вот полная патентная заявка:
[scribd id=398220565 key=key-x9aDGCJDczdb1AZghtJE mode=scroll]
Векторный вычислительный блок
Tesla описывает изобретение в патентной заявке:
«Микропроцессорная система включает вычислительный массив и векторный вычислительный блок. Вычислительный массив включает множество вычислительных блоков. Векторный вычислительный блок находится в связи с вычислительным массивом и включает множество вычислительных элементов. Вычислительные элементы сконфигурированы для приема выходных данных из вычислительного массива и их параллельной обработки.»
Вот несколько чертежей и схем из патентной заявки:
Вот полная патентная заявка:
[scribd id=398220022 key=key-WHzFpy0FkpEiMcVkx6q2 mode=scroll]