- M**a потратит $27 млрд на облачные услуги... (58)
- Возвращать на Землю эти корабли нет... (64)
- Foxconn рассчитывает на рекордную выручку... (63)
- Появилось первое видео Samsung Galaxy S26... (54)
- Пользователь решил улучшить охлаждение... (62)
- Судья назвала иск Маска к OpenAI на $134... (173)
- OpenAI объяснила, почему реклама в ChatGPT... (163)
- iOS 27 может стать обновлением без громких... (267)
- 3 ТБ — предел: «Дом.ру» режет скорость... (181)
- Samsung Galaxy A57 и Galaxy A37 показали... (347)
- Дополнительный дисплей с интерфейсом Glyph,... (200)
- Эксперты считают, что блокировка Telegram... (387)
- Samsung Galaxy A57 и Galaxy S26 FE получат... (441)
- В России появилась видеокарта за 4,4 млн... (381)
- HyperOS 3 получила важные исправления:... (138)
- Samsung наигралась в высокотехнологичные... (271)
Специалисты Toshiba Memory Corporation разработали быстрые и энергетически эффективные алгоритм и архитектуру для процессора глубокого обучения
Дата: 2018-11-06 13:40
Компания Toshiba Memory Corporation объявила о разработке высокоскоростного и высокоэффективного алгоритма и аппаратной архитектуры для задачи глубокого обучения с уменьшенным снижением точности распознавания. Новый процессор для глубокого обучения, реализованный в FPGA, в четыре раза превосходит «обычные» по энергетической эффективности.
Глубокое обучение обычно требует большого количества операций совмещенного умножения-сложения (MAC), что увеличивает время вычислений и потребление энергии. Предложенные ранее методы решения этой проблемы построены на уменьшении разрядности параметров, но они приводят к ухудшению точности распознавания. Алгоритм, разработанный Toshiba Memory, построен на оптимизации битовой точности операций MAC для отдельных фильтров в каждом слое нейронной сети. Как утверждается, это позволяет повысить скорость, не допуская значительного ухудшения точности распознавания.
Кроме того, специалисты Toshiba Memory разработали новую аппаратную архитектуру, которая подходит для операций MAC с различной разрядностью операндов. Она делит операнды на отдельные разряды и может выполнять однобитовые операции параллельно. Это значительно повышает эффективность использования блоков MAC в процессоре по сравнению с обычными архитектурами MAC, в которых действия выполняются последовательно.
КомментироватьПодробнее на iXBT
Предыдущие новости
Результаты тестов полузаказной платформы AMD с ядрами Zen и графикой Vega
В игровых консолях Playstation 4 Pro и Xbox One X используются полузаказные однокристальные платформы AMD на не самых современных ядрах Jaguar с графикой Polaris. Однако AMD не стоит на месте и для китайского заказчика она уже создала платформу на базе новых ядер Zen и графического процессора Vega. А это позволяет примерно представить, на что будут способны будущие...
Смартфону Honor V20 приписывают наличие чипа Kirin 980 и тройной камеры
В базах данных китайских регуляторов появилась информация о смартфоне Huawei VCE-AL00/TL00: наблюдатели полагают, что под этим шифром скрывается мощный аппарат Honor V20. Основой устройства, предположительно, послужит фирменный процессор Huawei Kirin 980, производящийся по 7-нанометровой технологии. Особенностью этого чипа является наличие двух нейропроцессорных блоков...
Сбербанк заявил, что попавшие в интернет файлы не конфиденциальны
Ранее "Коммерсант" писал о том, что в интернете в открытом доступе появились данные Сбербанка Пресс-служба Сбербанка сообщила, что попавшие в сеть файлы не содержат конфиденциальной информации, данных о клиентах или...
Samsung поведала первые детали о сгибающемся смартфоне Samsung Galaxy F
До этого момент мы слышали огромное количество слухов о первом сгибающемся смартфоне компании Samsung, который должен быть представлен на этой неделе. Представители компании подтвердили, что они активно работают над пользовательским интерфейсом, а также сотрудничают с разработчиками программного обеспечения, чтобы соответствующие приложения оптимально использовали возможности...