- Милый, но бесполезный: Samsung заморозила... (1537)
- Космические операторы столкнулись с... (1734)
- В Gmail появились ИИ-входящие — Gemini... (1560)
- Zeekr 8X с ДВС полностью рассекречен:... (1638)
- Массовое производство HBM4 отложили до конца... (1669)
- Ещё два польских издания подтвердили... (1570)
- 60-ваттная зарядка Samsung Galaxy S26 Ultra... (1574)
- Для тех, кому ездить много и дешево.... (1606)
- Character.AI и Google урегулировали иски о... (1485)
- LMArena привлекла $150 млн и стала... (1611)
- Caterpillar внедряет ИИ от Nvidia для... (1631)
- NASA не исключает экстренное возвращение с... (1441)
- Новейшую Lada Vesta Sport 2026 с пакетом... (1649)
- Новейшую Lada Vesta Sport 2025 с пакетом... (1510)
- Новейшую Lada Vesta Sport 2025 с пакетом... (1577)
- Токамак MAST Upgrade в Великобритании... (1390)
Специалисты Toshiba Memory Corporation разработали быстрые и энергетически эффективные алгоритм и архитектуру для процессора глубокого обучения
Дата: 2018-11-06 13:40
Компания Toshiba Memory Corporation объявила о разработке высокоскоростного и высокоэффективного алгоритма и аппаратной архитектуры для задачи глубокого обучения с уменьшенным снижением точности распознавания. Новый процессор для глубокого обучения, реализованный в FPGA, в четыре раза превосходит «обычные» по энергетической эффективности.
Глубокое обучение обычно требует большого количества операций совмещенного умножения-сложения (MAC), что увеличивает время вычислений и потребление энергии. Предложенные ранее методы решения этой проблемы построены на уменьшении разрядности параметров, но они приводят к ухудшению точности распознавания. Алгоритм, разработанный Toshiba Memory, построен на оптимизации битовой точности операций MAC для отдельных фильтров в каждом слое нейронной сети. Как утверждается, это позволяет повысить скорость, не допуская значительного ухудшения точности распознавания.
Кроме того, специалисты Toshiba Memory разработали новую аппаратную архитектуру, которая подходит для операций MAC с различной разрядностью операндов. Она делит операнды на отдельные разряды и может выполнять однобитовые операции параллельно. Это значительно повышает эффективность использования блоков MAC в процессоре по сравнению с обычными архитектурами MAC, в которых действия выполняются последовательно.
КомментироватьПодробнее на iXBT
Предыдущие новости
Результаты тестов полузаказной платформы AMD с ядрами Zen и графикой Vega
В игровых консолях Playstation 4 Pro и Xbox One X используются полузаказные однокристальные платформы AMD на не самых современных ядрах Jaguar с графикой Polaris. Однако AMD не стоит на месте и для китайского заказчика она уже создала платформу на базе новых ядер Zen и графического процессора Vega. А это позволяет примерно представить, на что будут способны будущие...
Смартфону Honor V20 приписывают наличие чипа Kirin 980 и тройной камеры
В базах данных китайских регуляторов появилась информация о смартфоне Huawei VCE-AL00/TL00: наблюдатели полагают, что под этим шифром скрывается мощный аппарат Honor V20. Основой устройства, предположительно, послужит фирменный процессор Huawei Kirin 980, производящийся по 7-нанометровой технологии. Особенностью этого чипа является наличие двух нейропроцессорных блоков...
Сбербанк заявил, что попавшие в интернет файлы не конфиденциальны
Ранее "Коммерсант" писал о том, что в интернете в открытом доступе появились данные Сбербанка Пресс-служба Сбербанка сообщила, что попавшие в сеть файлы не содержат конфиденциальной информации, данных о клиентах или...
Samsung поведала первые детали о сгибающемся смартфоне Samsung Galaxy F
До этого момент мы слышали огромное количество слухов о первом сгибающемся смартфоне компании Samsung, который должен быть представлен на этой неделе. Представители компании подтвердили, что они активно работают над пользовательским интерфейсом, а также сотрудничают с разработчиками программного обеспечения, чтобы соответствующие приложения оптимально использовали возможности...