- В Белоруссии запретили ввоз и продажу... (95)
- Создана первая дышащая модель... (199)
- Заказы на новые кроссоверы Chevrolet Captiva... (262)
- Мышь-космонавт родила здоровое потомство... (423)
- Пекин запускает пилотное производство... (239)
- Samsung анонсировала портативный проектор... (371)
- Учёные просчитали, как лунный реголит... (368)
- Kia и Hyundai российской сборки подорожали:... (292)
- Анонсированы лёгкие и прочные ноутбуки LG... (308)
- И Oculink, и Thunderbolt 5, и блок питания... (455)
- Китай и США ищут способы продлить жизнь... (463)
- Бенчмарк AnTuTu опубликовал декабрьские... (471)
- Продажи Tesla в Европе продолжают падать, но... (557)
- Asus как минимум временно уходит с рынка... (357)
- 2-нанометровый техпроцесс озолотит TSMC.... (497)
- Стоит ли в 2026 году покупать новый игровой... (353)
Компания DeepSeek начинает 2026 год с новым методом, направленным на более эффективное обучение ИИ-моделей
Дата: сегодня 10:01
Обучение больших моделей ИИ стало одной из самых больших проблем в современных вычислениях — не только из-за сложности, но и из-за стоимости, энергопотребления и нерационального использования ресурсов. Теперь DeepSeek предлагает подход, который может помочь смягчить некоторые из этих проблем.
Метод, называемый гиперсвязью, ограниченной многообразием (manifold-constrained hyperconnection, mHC), направлен на упрощение и повышение надежности обучения больших моделей искусственного интеллекта . Вместо погони за чистым повышением производительности, идея состоит в снижении нестабильности во время обучения — распространенной проблемы, которая вынуждает компании начинать дорогостоящие циклы обучения с нуля.
Изображение Midjourney Проще говоря, многие продвинутые модели ИИ терпят неудачу в процессе обучения. В таких случаях теряются недели работы, огромные объемы электроэнергии и тысячи часов работы графических процессоров. Подход DeepSeek направлен на предотвращение этих сбоев за счет повышения предсказуемости поведения модели, даже по мере ее увеличения в размерах.
Это важно, потому что сегодня обучение ИИ потребляет огромное количество энергии. Хотя mHC не снижает энергопотребление самих графических процессоров, он может уменьшить потери энергии, помогая моделям завершать обучение без сбоев или необходимости многократных перезапусков.
Еще одно преимущество — эффективность в масштабе. Когда обучение становится более стабильным, компаниям не нужно так сильно полагаться на методы «грубой силы» — например, на увеличение количества графических процессоров, памяти или продолжительности обучения для решения задачи. Это может снизить общее энергопотребление на протяжении всего процесса обучения.
Подробнее на iXBT
Предыдущие новости
Почти 4500 спутников за год: орбита Земли стремительно заполняется
В 2025 году страны мира вывели на орбиту 4499 спутников — это примерно на 1700 космических аппаратов больше, чем годом ранее. Главным драйвером роста вновь стала компания SpaceX. На её систему Starlink пришлось 3160 запущенных спутников, что составляет 70% от общего количества новых космических аппаратов за год. Фактически именно Starlink формирует основную часть современных...
165 Гц, 9000 мАч, быстрая зарядка, IP68/IP69/IP69K, Android 16. OnePlus Nord 6 готов к запуску
Смартфон OnePlus Nord 6 с модельным номером CPH2795 появился в базе сертификации TDRA в ОАЭ, что указывает на приближение глобального релиза. Ранее устройство уже засветилось в базе SIRIM в Малайзии в декабре 2025 года. Под названием OnePlus Nord 6 будет скрываться китайский OnePlus Turbo 6. Ожидается, что смартфон получит 6,78-дюймовый OLED-дисплей с разрешением 1,5K и...
«Это очень важное событие». Установка Neuralink в 2026 году станет автоматизированной, без необходимости удаления твердой мозговой оболочки
Илон Маск заявил, что планирует нарастить производство своих мозговых чипов Neuralink в 2026 году и автоматизировать процедуру их имплантации людям. Компания Neuralink начнет крупномасштабное производство устройств интерфейса «мозг-компьютер» и перейдет к оптимизированной, практически полностью автоматизированной хирургической процедуре в 2026 году. Нити устройства будут...
AMOLED 120 Гц, камера 200 Мп с OIS, 50 Мп с перископом, 6500 мАч и 80 Вт, IP68/IP69. Представлена глобальная версия Oppo Reno 15 Pro Max
Oppo официально представила на глобальном рынке смартфоны Reno 15 Pro Max и Reno 15 Pro, которые получили улучшенные AMOLED-дисплеи с частотой 120 Гц, защиту IP68/IP69 и свежую ColorOS 16 на базе Android 16. Старшая модель оснащена экраном 6,78 дюйма, а более компактный Reno 15 Pro получил дисплей диагональю 6,32 дюйма, при одинаковом разрешении Full HD+. Изображение Oppo Обе...