- Китайские мегасозвездия Guowang и Qianfan... (1838)
- 3 литра объёма и процессор с мощным iGPU и... (2246)
- Microsoft наконец-то дала возможность... (1767)
- iGPU Arc B390 в процессорах Core Ultra 3 —... (2559)
- Xiaomi идет по стопам Huawei: компания... (2391)
- Стало известно, когда AMD выпустит... (1427)
- Audi испытала двигатель Формулы-1 2026 года... (2331)
- Блоки питания и кулеры тоже подорожают.... (2299)
- xAI Илона Маска зафиксировала рекордный... (1334)
- В Китае запущена самая мощная в мире... (1819)
- SpaceX запустила в космос... (1625)
- Самый дальнобойный гибридный автомобиль в... (1445)
- Очень тонкий корпус 6,1 мм, 5500 мАч, 80 Вт,... (1419)
- Рассекречен новый Volkswagen Tayron L PHEV:... (1623)
- Россияне активно меняют свои Lada Granta на... (1518)
- В Китае на службу заступил «робокоп»: первый... (1541)
Специалисты Toshiba Memory Corporation разработали быстрые и энергетически эффективные алгоритм и архитектуру для процессора глубокого обучения
Дата: 2018-11-06 13:40
Компания Toshiba Memory Corporation объявила о разработке высокоскоростного и высокоэффективного алгоритма и аппаратной архитектуры для задачи глубокого обучения с уменьшенным снижением точности распознавания. Новый процессор для глубокого обучения, реализованный в FPGA, в четыре раза превосходит «обычные» по энергетической эффективности.
Глубокое обучение обычно требует большого количества операций совмещенного умножения-сложения (MAC), что увеличивает время вычислений и потребление энергии. Предложенные ранее методы решения этой проблемы построены на уменьшении разрядности параметров, но они приводят к ухудшению точности распознавания. Алгоритм, разработанный Toshiba Memory, построен на оптимизации битовой точности операций MAC для отдельных фильтров в каждом слое нейронной сети. Как утверждается, это позволяет повысить скорость, не допуская значительного ухудшения точности распознавания.
Кроме того, специалисты Toshiba Memory разработали новую аппаратную архитектуру, которая подходит для операций MAC с различной разрядностью операндов. Она делит операнды на отдельные разряды и может выполнять однобитовые операции параллельно. Это значительно повышает эффективность использования блоков MAC в процессоре по сравнению с обычными архитектурами MAC, в которых действия выполняются последовательно.
КомментироватьПодробнее на iXBT
Предыдущие новости
Результаты тестов полузаказной платформы AMD с ядрами Zen и графикой Vega
В игровых консолях Playstation 4 Pro и Xbox One X используются полузаказные однокристальные платформы AMD на не самых современных ядрах Jaguar с графикой Polaris. Однако AMD не стоит на месте и для китайского заказчика она уже создала платформу на базе новых ядер Zen и графического процессора Vega. А это позволяет примерно представить, на что будут способны будущие...
Смартфону Honor V20 приписывают наличие чипа Kirin 980 и тройной камеры
В базах данных китайских регуляторов появилась информация о смартфоне Huawei VCE-AL00/TL00: наблюдатели полагают, что под этим шифром скрывается мощный аппарат Honor V20. Основой устройства, предположительно, послужит фирменный процессор Huawei Kirin 980, производящийся по 7-нанометровой технологии. Особенностью этого чипа является наличие двух нейропроцессорных блоков...
Сбербанк заявил, что попавшие в интернет файлы не конфиденциальны
Ранее "Коммерсант" писал о том, что в интернете в открытом доступе появились данные Сбербанка Пресс-служба Сбербанка сообщила, что попавшие в сеть файлы не содержат конфиденциальной информации, данных о клиентах или...
Samsung поведала первые детали о сгибающемся смартфоне Samsung Galaxy F
До этого момент мы слышали огромное количество слухов о первом сгибающемся смартфоне компании Samsung, который должен быть представлен на этой неделе. Представители компании подтвердили, что они активно работают над пользовательским интерфейсом, а также сотрудничают с разработчиками программного обеспечения, чтобы соответствующие приложения оптимально использовали возможности...