- Новая статья: Самые ожидаемые игры 2026... (298)
- Trump Mobile так и не выпустила... (247)
- Oppo представила глобальные версии... (511)
- «Маленький китайский дракон» Biren... (515)
- Samsung Freestyle+: портативный проектор с... (275)
- Минималистичный смартфон Punkt MC03 с... (309)
- Новый космодром у экватора: Турция начала... (289)
- Microsoft и ведущие биологи выявили... (330)
- Microsoft и ведущие биологи выявили... (369)
- Масштабы спутниковых радиочастотных помех... (300)
- За 2025 год американцы потеряли более 300... (638)
- За 2025 год американцы потеряли более 300... (333)
- В Китае запущена крупнейшая в мире атомная... (346)
- В Китае робот-полицейский в стиле... (572)
- Новый Honda HR-V на подходе: опубликованы... (709)
- Китай вводит обязательную отчётность по... (796)
Компания DeepSeek начинает 2026 год с новым методом, направленным на более эффективное обучение ИИ-моделей
Дата: 2026-01-02 10:01
Обучение больших моделей ИИ стало одной из самых больших проблем в современных вычислениях — не только из-за сложности, но и из-за стоимости, энергопотребления и нерационального использования ресурсов. Теперь DeepSeek предлагает подход, который может помочь смягчить некоторые из этих проблем.
Метод, называемый гиперсвязью, ограниченной многообразием (manifold-constrained hyperconnection, mHC), направлен на упрощение и повышение надежности обучения больших моделей искусственного интеллекта . Вместо погони за чистым повышением производительности, идея состоит в снижении нестабильности во время обучения — распространенной проблемы, которая вынуждает компании начинать дорогостоящие циклы обучения с нуля.
Изображение Midjourney Проще говоря, многие продвинутые модели ИИ терпят неудачу в процессе обучения. В таких случаях теряются недели работы, огромные объемы электроэнергии и тысячи часов работы графических процессоров. Подход DeepSeek направлен на предотвращение этих сбоев за счет повышения предсказуемости поведения модели, даже по мере ее увеличения в размерах.
Это важно, потому что сегодня обучение ИИ потребляет огромное количество энергии. Хотя mHC не снижает энергопотребление самих графических процессоров, он может уменьшить потери энергии, помогая моделям завершать обучение без сбоев или необходимости многократных перезапусков.
Еще одно преимущество — эффективность в масштабе. Когда обучение становится более стабильным, компаниям не нужно так сильно полагаться на методы «грубой силы» — например, на увеличение количества графических процессоров, памяти или продолжительности обучения для решения задачи. Это может снизить общее энергопотребление на протяжении всего процесса обучения.
Подробнее на iXBT
Предыдущие новости
Почти 4500 спутников за год: орбита Земли стремительно заполняется
В 2025 году страны мира вывели на орбиту 4499 спутников — это примерно на 1700 космических аппаратов больше, чем годом ранее. Главным драйвером роста вновь стала компания SpaceX. На её систему Starlink пришлось 3160 запущенных спутников, что составляет 70% от общего количества новых космических аппаратов за год. Фактически именно Starlink формирует основную часть современных...
165 Гц, 9000 мАч, быстрая зарядка, IP68/IP69/IP69K, Android 16. OnePlus Nord 6 готов к запуску
Смартфон OnePlus Nord 6 с модельным номером CPH2795 появился в базе сертификации TDRA в ОАЭ, что указывает на приближение глобального релиза. Ранее устройство уже засветилось в базе SIRIM в Малайзии в декабре 2025 года. Под названием OnePlus Nord 6 будет скрываться китайский OnePlus Turbo 6. Ожидается, что смартфон получит 6,78-дюймовый OLED-дисплей с разрешением 1,5K и...
«Это очень важное событие». Установка Neuralink в 2026 году станет автоматизированной, без необходимости удаления твердой мозговой оболочки
Илон Маск заявил, что планирует нарастить производство своих мозговых чипов Neuralink в 2026 году и автоматизировать процедуру их имплантации людям. Компания Neuralink начнет крупномасштабное производство устройств интерфейса «мозг-компьютер» и перейдет к оптимизированной, практически полностью автоматизированной хирургической процедуре в 2026 году. Нити устройства будут...
AMOLED 120 Гц, камера 200 Мп с OIS, 50 Мп с перископом, 6500 мАч и 80 Вт, IP68/IP69. Представлена глобальная версия Oppo Reno 15 Pro Max
Oppo официально представила на глобальном рынке смартфоны Reno 15 Pro Max и Reno 15 Pro, которые получили улучшенные AMOLED-дисплеи с частотой 120 Гц, защиту IP68/IP69 и свежую ColorOS 16 на базе Android 16. Старшая модель оснащена экраном 6,78 дюйма, а более компактный Reno 15 Pro получил дисплей диагональю 6,32 дюйма, при одинаковом разрешении Full HD+. Изображение Oppo Обе...