- Клиент Steam стал 64-битным — поддержка... (2684)
- Мошенники маскируют DDR4 под DDR5: новый... (2230)
- Первый в мире бензиновый авто с HarmonyOS... (2109)
- Оказалось, что машины ASML для производства... (2044)
- Разработчики Lenovo Legion Go 2 могут... (2050)
- Для Nintendo Switch 2 могут появиться... (2242)
- Как китайские компании получают доступ к... (1943)
- Средняя цена продажи смартфонов и ПК в 2026... (2533)
- Новые восьмиядерные Core Ultra 5 335 и 325... (2565)
- Хватает ли 8 ГБ памяти у видеокарты в конце... (2716)
- NASA переоборудовало «Астрован II» компании... (1709)
- Toyota RAV4 существенно подорожал в России.... (2139)
- Очень редкая видеокарта Asus ROG Matrix RTX... (2255)
- Пожароопасный разъём 12V-2x6 на системной... (2713)
- Очень быстрый монитор для киберспортсменов,... (1810)
- Эра дешевых смартфонов закончилась? В Honor... (1725)
Илон Маск: искусственный интеллект исчерпал данные человечества
Дата: 2025-01-09 09:29
Илон Маск присоединился к мнению других экспертов в области искусственного интеллекта о том, что реальных данных для обучения ИИ-моделей практически не осталось.
«Мы исчерпали практически весь накопленный объём человеческих знаний для обучения ИИ. Это произошло фактически в прошлом году», — заявил Маск во время трансляции беседы с председателем Stagwell Марком Пенном на платформе X.
Маск, владелец компании xAI, поддержал идеи, которые бывший главный научный сотрудник OpenAI Илья Суцкевер озвучил на конференции по машинному обучению NeurIPS в декабре. Суцкевер, заявивший о достижении «пика данных» в индустрии ИИ, предсказал, что нехватка обучающих данных вынудит изменить существующие подходы к разработке моделей.
Источник: TCD / Prod.DB Маск предложил решение — использование синтетических данных, генерируемых самими ИИ-моделями. «Единственный способ дополнить реальные данные — это синтетические данные, где ИИ сам создаёт обучающие материалы. С синтетическими данными ИИ будет оценивать себя сам и проходить через процесс самообучения», — отметил он.
Крупные технологические компании, включая Microsoft, Meta*, OpenAI и Anthropic, уже используют синтетические данные для обучения своих флагманских ИИ-моделей. По оценкам Gartner, 60% данных, используемых для проектов в области ИИ и аналитики в 2024 году, были сгенерированы синтетически. Модель Microsoft Phi-4, открытый код которой был опубликован на этой неделе, обучалась на комбинации синтетических и реальных данных. Аналогичный подход использовался при создании моделей Google Gemma. Anthropic применила синтетические данные при разработке одной из своих самых эффективных систем — Claude 3.5 Sonnet, а Meta* улучшила последнюю серию моделей Llama с помощью ИИ-генерированных данных.
Обучение на синтетических данных имеет ряд преимуществ, включая экономическую эффективность. Стартап Writer утверждает, что их модель Palmyra X 004, разработанная почти полностью на синтетических источниках, обошлась всего в $700 000 — по сравнению с оценочной стоимостью в $4,6 миллиона за сопоставимую модель OpenAI.
Однако существуют и недостатки. Некоторые исследования показывают, что синтетические данные могут привести к «коллапсу модели», когда ИИ становится менее «креативным» и более предвзятым в своих результатах, что в конечном итоге может серьёзно нарушить его функциональность. Поскольку модели создают синтетические данные на основе уже существующих, любые предубеждения и ограничения в исходных данных будут воспроизводиться в их результатах.
*Meta признана экстремистской организацией, её деятельность на территории Российской Федерации запрещена
Подробнее на iXBT
Предыдущие новости
Этот флагман с запасом хода более 1200 км, который отлично показал себя при -30 °C, едет в Россию. Стартовало массовое производство Exeed Exlantix ET
Exeed Exlantix ET для зарубежного рынка официально сошел с конвейера, новинка поступит в продажу более чем в 20 странах в 2025 году. Китайская версия, известная как Exeed Sterra ET, вышла на рынок в мае 2024 года и доступна в версиях с электрической и гибридной силовой установками. Стоимость электромобиля стартует от 31 300 долларов, предлагая запас хода от 540 до 760 км, а...
Представлен Porsche 911 Carrera S 2025: больше мощности, но теперь без механической коробки передач
Porsche представила новые модели 911 Carrera S Coupe и Cabriolet 2025 года. Они займут промежуточное положение между базовой версией Carrera и гибридными GTS. Carrera S лишился семиступенчатой механической коробки, вместо этого используя только восьмиступенчатую коробку PDK с двойным сцеплением. Фото Porsche Модели оснащены 3,0-литровым шестицилиндровым двигателем с двумя...
Прорыв в технологии очистки ядерных отходов: учёные нашли способ контролировать образование солей
Исследователи из Университета штата Вашингтон разработали новый метод идентификации солей в плавильных установках для ядерных отходов, что может значительно улучшить технологию очистки, в том числе на площадке Хэнфорд — одном из крупнейших и сложнейших объектов по переработке ядерных отходов в мире. Согласно исследованию, опубликованному в журнале Measurement, учёные...
«Эта технология создаст будущее, в котором связь станет возможной из самых отдаленных уголков страны. SpaceX и Telstra предоставят спутниковую связь пользователям смартфонов в Австралии
Компания Telstra заявила, что намерена предоставить своим клиентам по всей Австралии услугу обмена текстовыми сообщениями через спутник прямо на смартфоны при помощи сервиса Starlink от SpaceX, а также начала тестирование и доработку предложения перед коммерческим запуском, дата которого не определена. Целью партнерства является расширение покрытия за пределы существующей...