- От -30 до более 100 °C. Первая в мире... (1602)
- От -30°C до более 100°C. Первая в мире... (1704)
- Тактический шутер PUBG: Blindspot с... (1505)
- A-Class уезжает из Германии: Mercedes-Benz... (1793)
- Nvidia возьмёт с китайских клиентов полную... (1443)
- 9000 мАч, IP69K и обратная 27-ваттная... (1673)
- Asus представила беспроводные системы... (1461)
- Windows 11 26H1 выйдет весной, но... (1429)
- 4 ZOPS производительности: Intel похвалилась... (1416)
- К пантерам затесался дикий кот: Intel... (2325)
- Такое повторится только в XXIII веке:... (1412)
- EUV-сканеры приспособили для выпуска... (1939)
- Apple Card сменит банк-партнёра: вместо... (1427)
- Gigabyte представила четвёрку игровых... (1328)
- В России на аукцион выставили редкую эмблему... (1481)
- MSI представила блоки питания с системой... (1442)
Специалисты Toshiba Memory Corporation разработали быстрые и энергетически эффективные алгоритм и архитектуру для процессора глубокого обучения
Дата: 2018-11-06 13:40
Компания Toshiba Memory Corporation объявила о разработке высокоскоростного и высокоэффективного алгоритма и аппаратной архитектуры для задачи глубокого обучения с уменьшенным снижением точности распознавания. Новый процессор для глубокого обучения, реализованный в FPGA, в четыре раза превосходит «обычные» по энергетической эффективности.
Глубокое обучение обычно требует большого количества операций совмещенного умножения-сложения (MAC), что увеличивает время вычислений и потребление энергии. Предложенные ранее методы решения этой проблемы построены на уменьшении разрядности параметров, но они приводят к ухудшению точности распознавания. Алгоритм, разработанный Toshiba Memory, построен на оптимизации битовой точности операций MAC для отдельных фильтров в каждом слое нейронной сети. Как утверждается, это позволяет повысить скорость, не допуская значительного ухудшения точности распознавания.
Кроме того, специалисты Toshiba Memory разработали новую аппаратную архитектуру, которая подходит для операций MAC с различной разрядностью операндов. Она делит операнды на отдельные разряды и может выполнять однобитовые операции параллельно. Это значительно повышает эффективность использования блоков MAC в процессоре по сравнению с обычными архитектурами MAC, в которых действия выполняются последовательно.
КомментироватьПодробнее на iXBT
Предыдущие новости
Результаты тестов полузаказной платформы AMD с ядрами Zen и графикой Vega
В игровых консолях Playstation 4 Pro и Xbox One X используются полузаказные однокристальные платформы AMD на не самых современных ядрах Jaguar с графикой Polaris. Однако AMD не стоит на месте и для китайского заказчика она уже создала платформу на базе новых ядер Zen и графического процессора Vega. А это позволяет примерно представить, на что будут способны будущие...
Смартфону Honor V20 приписывают наличие чипа Kirin 980 и тройной камеры
В базах данных китайских регуляторов появилась информация о смартфоне Huawei VCE-AL00/TL00: наблюдатели полагают, что под этим шифром скрывается мощный аппарат Honor V20. Основой устройства, предположительно, послужит фирменный процессор Huawei Kirin 980, производящийся по 7-нанометровой технологии. Особенностью этого чипа является наличие двух нейропроцессорных блоков...
Сбербанк заявил, что попавшие в интернет файлы не конфиденциальны
Ранее "Коммерсант" писал о том, что в интернете в открытом доступе появились данные Сбербанка Пресс-служба Сбербанка сообщила, что попавшие в сеть файлы не содержат конфиденциальной информации, данных о клиентах или...
Samsung поведала первые детали о сгибающемся смартфоне Samsung Galaxy F
До этого момент мы слышали огромное количество слухов о первом сгибающемся смартфоне компании Samsung, который должен быть представлен на этой неделе. Представители компании подтвердили, что они активно работают над пользовательским интерфейсом, а также сотрудничают с разработчиками программного обеспечения, чтобы соответствующие приложения оптимально использовали возможности...