- Представлен BMW Alpina — теперь независимый... (104)
- АвтоВАЗ поменял цены на все модели... (316)
- Новые УАЗы с другими моторами и коробками... (168)
- OpenAI фокусируется на разработке аудио ИИ... (207)
- Самый лёгкий в мире 17-дюймовый ноутбук с... (252)
- IKEA представила зарядное Sjoss за 4... (185)
- Samsung приготовила 130-дюймовый телевизор... (199)
- Обнаружена «планета-изгой» размером с Сатурн... (200)
- «Это очень важное событие». Установка... (372)
- 165 Гц, 9000 мАч, быстрая зарядка,... (328)
- Почти 4500 спутников за год: орбита Земли... (359)
- Компания DeepSeek начинает 2026 год с новым... (350)
- Китайская ByteDance закупила ИИ-чипы Huawei... (637)
- SoC Snapdragon 8 Elite Gen 6 Pro может стать... (604)
- Очень дешёвый шлюз для управления умной... (412)
- Выход iPhone 18 может быть отложен до 2027... (769)
Компания DeepSeek начинает 2026 год с новым методом, направленным на более эффективное обучение ИИ-моделей
Дата: сегодня 10:01
Обучение больших моделей ИИ стало одной из самых больших проблем в современных вычислениях — не только из-за сложности, но и из-за стоимости, энергопотребления и нерационального использования ресурсов. Теперь DeepSeek предлагает подход, который может помочь смягчить некоторые из этих проблем.
Метод, называемый гиперсвязью, ограниченной многообразием (manifold-constrained hyperconnection, mHC), направлен на упрощение и повышение надежности обучения больших моделей искусственного интеллекта . Вместо погони за чистым повышением производительности, идея состоит в снижении нестабильности во время обучения — распространенной проблемы, которая вынуждает компании начинать дорогостоящие циклы обучения с нуля.
Изображение Midjourney Проще говоря, многие продвинутые модели ИИ терпят неудачу в процессе обучения. В таких случаях теряются недели работы, огромные объемы электроэнергии и тысячи часов работы графических процессоров. Подход DeepSeek направлен на предотвращение этих сбоев за счет повышения предсказуемости поведения модели, даже по мере ее увеличения в размерах.
Это важно, потому что сегодня обучение ИИ потребляет огромное количество энергии. Хотя mHC не снижает энергопотребление самих графических процессоров, он может уменьшить потери энергии, помогая моделям завершать обучение без сбоев или необходимости многократных перезапусков.
Еще одно преимущество — эффективность в масштабе. Когда обучение становится более стабильным, компаниям не нужно так сильно полагаться на методы «грубой силы» — например, на увеличение количества графических процессоров, памяти или продолжительности обучения для решения задачи. Это может снизить общее энергопотребление на протяжении всего процесса обучения.
Подробнее на iXBT
Предыдущие новости
Почти 4500 спутников за год: орбита Земли стремительно заполняется
В 2025 году страны мира вывели на орбиту 4499 спутников — это примерно на 1700 космических аппаратов больше, чем годом ранее. Главным драйвером роста вновь стала компания SpaceX. На её систему Starlink пришлось 3160 запущенных спутников, что составляет 70% от общего количества новых космических аппаратов за год. Фактически именно Starlink формирует основную часть современных...
165 Гц, 9000 мАч, быстрая зарядка, IP68/IP69/IP69K, Android 16. OnePlus Nord 6 готов к запуску
Смартфон OnePlus Nord 6 с модельным номером CPH2795 появился в базе сертификации TDRA в ОАЭ, что указывает на приближение глобального релиза. Ранее устройство уже засветилось в базе SIRIM в Малайзии в декабре 2025 года. Под названием OnePlus Nord 6 будет скрываться китайский OnePlus Turbo 6. Ожидается, что смартфон получит 6,78-дюймовый OLED-дисплей с разрешением 1,5K и...
«Это очень важное событие». Установка Neuralink в 2026 году станет автоматизированной, без необходимости удаления твердой мозговой оболочки
Илон Маск заявил, что планирует нарастить производство своих мозговых чипов Neuralink в 2026 году и автоматизировать процедуру их имплантации людям. Компания Neuralink начнет крупномасштабное производство устройств интерфейса «мозг-компьютер» и перейдет к оптимизированной, практически полностью автоматизированной хирургической процедуре в 2026 году. Нити устройства будут...
AMOLED 120 Гц, камера 200 Мп с OIS, 50 Мп с перископом, 6500 мАч и 80 Вт, IP68/IP69. Представлена глобальная версия Oppo Reno 15 Pro Max
Oppo официально представила на глобальном рынке смартфоны Reno 15 Pro Max и Reno 15 Pro, которые получили улучшенные AMOLED-дисплеи с частотой 120 Гц, защиту IP68/IP69 и свежую ColorOS 16 на базе Android 16. Старшая модель оснащена экраном 6,78 дюйма, а более компактный Reno 15 Pro получил дисплей диагональю 6,32 дюйма, при одинаковом разрешении Full HD+. Изображение Oppo Обе...