- Philips представила монитор Evnia 27M2G5800... (4411)
- Escape from Tarkov в космосе: анонсирован... (5000)
- Red Hat уволила сотни программистов в Китае,... (4679)
- Toyota показала в деле колёсного... (4768)
- Инсайдер: из-за GTA VI новая Fable может не... (5503)
- В Южной Корее разработан сверхтонкий модуль... (5042)
- Sandisk намерена начать опытный выпуск... (5165)
- Sandisk рассчитывает начать опытный выпуск... (5043)
- Павел Дуров объяснил, что не так с защитой... (5054)
- Apple готовит четыре варианта дизайна умных... (5122)
- Китайский робот Unitree H1 разогнался до 10... (4796)
- Китайский робот Unitree H1 продемонстрировал... (4896)
- Китайский робот Unitree H1 продемонстрировал... (5222)
- Новая статья: Обзор материнской платы MSI... (5267)
- Samsung на мероприятии в Переделкино... (3299)
- В России стартовали продажи телевизора... (5846)
Компания DeepSeek начинает 2026 год с новым методом, направленным на более эффективное обучение ИИ-моделей
Дата: 2026-01-02 10:01
Обучение больших моделей ИИ стало одной из самых больших проблем в современных вычислениях — не только из-за сложности, но и из-за стоимости, энергопотребления и нерационального использования ресурсов. Теперь DeepSeek предлагает подход, который может помочь смягчить некоторые из этих проблем.
Метод, называемый гиперсвязью, ограниченной многообразием (manifold-constrained hyperconnection, mHC), направлен на упрощение и повышение надежности обучения больших моделей искусственного интеллекта . Вместо погони за чистым повышением производительности, идея состоит в снижении нестабильности во время обучения — распространенной проблемы, которая вынуждает компании начинать дорогостоящие циклы обучения с нуля.
Изображение Midjourney Проще говоря, многие продвинутые модели ИИ терпят неудачу в процессе обучения. В таких случаях теряются недели работы, огромные объемы электроэнергии и тысячи часов работы графических процессоров. Подход DeepSeek направлен на предотвращение этих сбоев за счет повышения предсказуемости поведения модели, даже по мере ее увеличения в размерах.
Это важно, потому что сегодня обучение ИИ потребляет огромное количество энергии. Хотя mHC не снижает энергопотребление самих графических процессоров, он может уменьшить потери энергии, помогая моделям завершать обучение без сбоев или необходимости многократных перезапусков.
Еще одно преимущество — эффективность в масштабе. Когда обучение становится более стабильным, компаниям не нужно так сильно полагаться на методы «грубой силы» — например, на увеличение количества графических процессоров, памяти или продолжительности обучения для решения задачи. Это может снизить общее энергопотребление на протяжении всего процесса обучения.
Подробнее на iXBT
Предыдущие новости
Почти 4500 спутников за год: орбита Земли стремительно заполняется
В 2025 году страны мира вывели на орбиту 4499 спутников — это примерно на 1700 космических аппаратов больше, чем годом ранее. Главным драйвером роста вновь стала компания SpaceX. На её систему Starlink пришлось 3160 запущенных спутников, что составляет 70% от общего количества новых космических аппаратов за год. Фактически именно Starlink формирует основную часть современных...
165 Гц, 9000 мАч, быстрая зарядка, IP68/IP69/IP69K, Android 16. OnePlus Nord 6 готов к запуску
Смартфон OnePlus Nord 6 с модельным номером CPH2795 появился в базе сертификации TDRA в ОАЭ, что указывает на приближение глобального релиза. Ранее устройство уже засветилось в базе SIRIM в Малайзии в декабре 2025 года. Под названием OnePlus Nord 6 будет скрываться китайский OnePlus Turbo 6. Ожидается, что смартфон получит 6,78-дюймовый OLED-дисплей с разрешением 1,5K и...
«Это очень важное событие». Установка Neuralink в 2026 году станет автоматизированной, без необходимости удаления твердой мозговой оболочки
Илон Маск заявил, что планирует нарастить производство своих мозговых чипов Neuralink в 2026 году и автоматизировать процедуру их имплантации людям. Компания Neuralink начнет крупномасштабное производство устройств интерфейса «мозг-компьютер» и перейдет к оптимизированной, практически полностью автоматизированной хирургической процедуре в 2026 году. Нити устройства будут...
AMOLED 120 Гц, камера 200 Мп с OIS, 50 Мп с перископом, 6500 мАч и 80 Вт, IP68/IP69. Представлена глобальная версия Oppo Reno 15 Pro Max
Oppo официально представила на глобальном рынке смартфоны Reno 15 Pro Max и Reno 15 Pro, которые получили улучшенные AMOLED-дисплеи с частотой 120 Гц, защиту IP68/IP69 и свежую ColorOS 16 на базе Android 16. Старшая модель оснащена экраном 6,78 дюйма, а более компактный Reno 15 Pro получил дисплей диагональю 6,32 дюйма, при одинаковом разрешении Full HD+. Изображение Oppo Обе...