- В ЕС назвали open source одним из... (405)
- В Wildberries запустили отправку посылок... (546)
- Жители Узбекистана просто обожают Chevrolet:... (428)
- Микрогравитация меняет форму мозга... (514)
- Российский оператор Т2 внедрил бесплатную... (639)
- Broadcom представила чипы для точек доступа... (625)
- Экс-глава Google планирует запустить частный... (430)
- Возрождённая ролевая песочница Hytale в духе... (585)
- «Китайский Maybach» на шаг ближе к России:... (438)
- Минивэны от АвтоВАЗа под брендом SKM... (611)
- Китайский стартап Zhipu полностью обучил... (685)
- Китай установил крупнейший в мире морской... (609)
- Бизнес-класс для всех. Lada Aura внезапно... (448)
- Для любителей более округлых форм. Unihertz... (456)
- Китайская таможня не дала добро на ввоз... (636)
- Обнаружен VoidLink — опасный модульный вирус... (602)
Специалисты Toshiba Memory Corporation разработали быстрые и энергетически эффективные алгоритм и архитектуру для процессора глубокого обучения
Дата: 2018-11-06 13:40
Компания Toshiba Memory Corporation объявила о разработке высокоскоростного и высокоэффективного алгоритма и аппаратной архитектуры для задачи глубокого обучения с уменьшенным снижением точности распознавания. Новый процессор для глубокого обучения, реализованный в FPGA, в четыре раза превосходит «обычные» по энергетической эффективности.
Глубокое обучение обычно требует большого количества операций совмещенного умножения-сложения (MAC), что увеличивает время вычислений и потребление энергии. Предложенные ранее методы решения этой проблемы построены на уменьшении разрядности параметров, но они приводят к ухудшению точности распознавания. Алгоритм, разработанный Toshiba Memory, построен на оптимизации битовой точности операций MAC для отдельных фильтров в каждом слое нейронной сети. Как утверждается, это позволяет повысить скорость, не допуская значительного ухудшения точности распознавания.
Кроме того, специалисты Toshiba Memory разработали новую аппаратную архитектуру, которая подходит для операций MAC с различной разрядностью операндов. Она делит операнды на отдельные разряды и может выполнять однобитовые операции параллельно. Это значительно повышает эффективность использования блоков MAC в процессоре по сравнению с обычными архитектурами MAC, в которых действия выполняются последовательно.
КомментироватьПодробнее на iXBT
Предыдущие новости
Результаты тестов полузаказной платформы AMD с ядрами Zen и графикой Vega
В игровых консолях Playstation 4 Pro и Xbox One X используются полузаказные однокристальные платформы AMD на не самых современных ядрах Jaguar с графикой Polaris. Однако AMD не стоит на месте и для китайского заказчика она уже создала платформу на базе новых ядер Zen и графического процессора Vega. А это позволяет примерно представить, на что будут способны будущие...
Смартфону Honor V20 приписывают наличие чипа Kirin 980 и тройной камеры
В базах данных китайских регуляторов появилась информация о смартфоне Huawei VCE-AL00/TL00: наблюдатели полагают, что под этим шифром скрывается мощный аппарат Honor V20. Основой устройства, предположительно, послужит фирменный процессор Huawei Kirin 980, производящийся по 7-нанометровой технологии. Особенностью этого чипа является наличие двух нейропроцессорных блоков...
Сбербанк заявил, что попавшие в интернет файлы не конфиденциальны
Ранее "Коммерсант" писал о том, что в интернете в открытом доступе появились данные Сбербанка Пресс-служба Сбербанка сообщила, что попавшие в сеть файлы не содержат конфиденциальной информации, данных о клиентах или...
Samsung поведала первые детали о сгибающемся смартфоне Samsung Galaxy F
До этого момент мы слышали огромное количество слухов о первом сгибающемся смартфоне компании Samsung, который должен быть представлен на этой неделе. Представители компании подтвердили, что они активно работают над пользовательским интерфейсом, а также сотрудничают с разработчиками программного обеспечения, чтобы соответствующие приложения оптимально использовали возможности...