- Китайские учёные создали ИИ-модель для... (417)
- Кольцевое солнечное затмение 2026 года... (360)
- Астрономы раскрыли, как сверхмассивные... (358)
- Новый метод 3D-печати искусственных мышц... (355)
- Микробы на МКС раскрыли секрет эффективной... (258)
- Anthropic обвалила акции CrowdStrike и... (290)
- Новый двигатель от Geely и Renault, который... (421)
- Представлена литий-органическая батарея,... (377)
- WhatsApp перенимает функцию Telegram: в... (265)
- Производители жёстких дисков распродали... (275)
- Робот Blue Jay от Amazon провалился — проект... (371)
- Умная колонка 2.0. Первое аппаратное... (418)
- Tesla не смогла оспорить вердикт на $243 млн... (387)
- Tesla не смогла обжаловать иск на сумму $243... (395)
- Intel Core X7 358H и 128 ГБ оперативной... (392)
- Представлена компактная и бесшумная (0 дБ... (275)
Компания DeepSeek начинает 2026 год с новым методом, направленным на более эффективное обучение ИИ-моделей
Дата: 2026-01-02 10:01
Обучение больших моделей ИИ стало одной из самых больших проблем в современных вычислениях — не только из-за сложности, но и из-за стоимости, энергопотребления и нерационального использования ресурсов. Теперь DeepSeek предлагает подход, который может помочь смягчить некоторые из этих проблем.
Метод, называемый гиперсвязью, ограниченной многообразием (manifold-constrained hyperconnection, mHC), направлен на упрощение и повышение надежности обучения больших моделей искусственного интеллекта . Вместо погони за чистым повышением производительности, идея состоит в снижении нестабильности во время обучения — распространенной проблемы, которая вынуждает компании начинать дорогостоящие циклы обучения с нуля.
Изображение Midjourney Проще говоря, многие продвинутые модели ИИ терпят неудачу в процессе обучения. В таких случаях теряются недели работы, огромные объемы электроэнергии и тысячи часов работы графических процессоров. Подход DeepSeek направлен на предотвращение этих сбоев за счет повышения предсказуемости поведения модели, даже по мере ее увеличения в размерах.
Это важно, потому что сегодня обучение ИИ потребляет огромное количество энергии. Хотя mHC не снижает энергопотребление самих графических процессоров, он может уменьшить потери энергии, помогая моделям завершать обучение без сбоев или необходимости многократных перезапусков.
Еще одно преимущество — эффективность в масштабе. Когда обучение становится более стабильным, компаниям не нужно так сильно полагаться на методы «грубой силы» — например, на увеличение количества графических процессоров, памяти или продолжительности обучения для решения задачи. Это может снизить общее энергопотребление на протяжении всего процесса обучения.
Подробнее на iXBT
Предыдущие новости
Почти 4500 спутников за год: орбита Земли стремительно заполняется
В 2025 году страны мира вывели на орбиту 4499 спутников — это примерно на 1700 космических аппаратов больше, чем годом ранее. Главным драйвером роста вновь стала компания SpaceX. На её систему Starlink пришлось 3160 запущенных спутников, что составляет 70% от общего количества новых космических аппаратов за год. Фактически именно Starlink формирует основную часть современных...
165 Гц, 9000 мАч, быстрая зарядка, IP68/IP69/IP69K, Android 16. OnePlus Nord 6 готов к запуску
Смартфон OnePlus Nord 6 с модельным номером CPH2795 появился в базе сертификации TDRA в ОАЭ, что указывает на приближение глобального релиза. Ранее устройство уже засветилось в базе SIRIM в Малайзии в декабре 2025 года. Под названием OnePlus Nord 6 будет скрываться китайский OnePlus Turbo 6. Ожидается, что смартфон получит 6,78-дюймовый OLED-дисплей с разрешением 1,5K и...
«Это очень важное событие». Установка Neuralink в 2026 году станет автоматизированной, без необходимости удаления твердой мозговой оболочки
Илон Маск заявил, что планирует нарастить производство своих мозговых чипов Neuralink в 2026 году и автоматизировать процедуру их имплантации людям. Компания Neuralink начнет крупномасштабное производство устройств интерфейса «мозг-компьютер» и перейдет к оптимизированной, практически полностью автоматизированной хирургической процедуре в 2026 году. Нити устройства будут...
AMOLED 120 Гц, камера 200 Мп с OIS, 50 Мп с перископом, 6500 мАч и 80 Вт, IP68/IP69. Представлена глобальная версия Oppo Reno 15 Pro Max
Oppo официально представила на глобальном рынке смартфоны Reno 15 Pro Max и Reno 15 Pro, которые получили улучшенные AMOLED-дисплеи с частотой 120 Гц, защиту IP68/IP69 и свежую ColorOS 16 на базе Android 16. Старшая модель оснащена экраном 6,78 дюйма, а более компактный Reno 15 Pro получил дисплей диагональю 6,32 дюйма, при одинаковом разрешении Full HD+. Изображение Oppo Обе...