
Глава отдела искусственного интеллекта Tesla опубликовал новые кадры инструмента для автоматической разметки данных, используемого автопроизводителем в работе над системой автопилота.
Ожидается, что этот инструмент станет важным ускорителем в совершенствовании бета-версии системы Full Self-Driving от Tesla.
Разметка данных для автопилота
Часто говорят, что Tesla имеет огромное преимущество в области данных для автопилота благодаря тому, что изначально оснастила все свои автомобили датчиками и собирает реальные данные с парка, который сейчас насчитывает более миллиона автомобилей.
Автопроизводитель может использовать обширный набор данных для улучшения своих нейронных сетей, обеспечивающих работу всего комплекса функций Autopilot, и в конечном итоге верит, что это приведет к полной функциональности автопилота.
Однако эти данные становятся гораздо ценнее, когда они «размечены» — то есть, когда информация в изображениях, собранных парком автомобилей, маркируется такими данными, как автомобили, полосы движения, дорожные знаки и т. д.
Если изображения правильно размечены — например, если вы можете последовательно распознавать дорожный знак ограничения скорости и маркировать его как таковой — вы можете подать множество различных изображений различных дорожных знаков ограничения скорости в нейронную сеть компьютерного зрения, чтобы она могла их распознавать.
Разметка данных является одним из основных направлений работы команды Autopilot Tesla.
Андрей Карпатый, глава отдела ИИ и компьютерного зрения Tesla, сообщил в прошлом году, что в Tesla работает всего «несколько десятков» инженеров над нейронными сетями, но у них есть «огромная» команда, занимающаяся разметкой.
Tesla стремится автоматизировать большую часть разметки, чтобы иметь возможность использовать больше данных, собираемых парком автомобилей.
В прошлом году генеральный директор Tesla Илон Маск заявил, что водители фактически размечают данные, просто проезжая перекрестки:
По сути, водитель, управляя автомобилем и совершая действия, фактически размечает — размечает реальность — во время движения, делая их все лучше и лучше. Я думаю, что это преимущество, которого нет ни у кого другого, и мы буквально на порядки превосходим всех остальных вместе взятых.
Но Tesla также нанимает сотрудников для ручной разметки данных, которые будут подаваться в ее нейронные сети.
По сообщениям, автопроизводитель нанял тысячи специалистов по разметке, многие из которых работают на Gigafactory New York.
Автоматическая разметка
Даже с тысячами сотрудников, вручную размечающих видео, Tesla все еще упускает много ценных данных.
Сейчас на дорогах находится более миллиона автомобилей Tesla, собирающих видеоматериалы, которые можно использовать для улучшения ее нейронных сетей.
Святым Граалем разметки является разработка системы автоматической разметки, которая может автоматически и точно размечать большие объемы видеоматериалов.
Tesla заявила, что работает над таким инструментом, особенно для использования с ее суперкомпьютером Dojo.
Похоже, компания добивается прогресса.
В новой серии твитов Карпатый опубликовал изображения из нового инструмента автоматической разметки Tesla:
Карпатый написал о новых кадрах:
Некоторые эффектные примеры паноптической сегментации из нового проекта, который мы запускаем. Они слишком сырые для запуска в машине, но подаются в авто-разметчики. Сотрудничество по разметке большого (более 100 тыс.), чистого, разнообразного набора данных из нескольких камер/видео и инженеров, которые обучают модели.
Данные из нескольких камер/видео, временная непрерывность медленно движущейся точки обзора, тесное сотрудничество по поиску и разметке данных, а также бесконечный набор неразмеченных клипов значительно расширяют возможности творческого моделирования на стороне нейронной сети.
Карпатый, возглавляющий команду компьютерного зрения Tesla, заявил, что внедрение этой технологии находится на ранней стадии, и, похоже, он публикует кадры, чтобы привлечь больше людей в свою команду.