Nvidia запустила Nemotron, продвинутую версию Llama-3.1, разработанную для превосходства над самыми передовыми моделями искусственного интеллекта (AI), включая GPT-4.
Благодаря тщательно подобранным данным и инновационному оборудованию, Nemotron обещает непревзойденную производительность в области искусственного интеллекта. В этой статье мы рассмотрим все детали.
Summary
Nemotron di Nvidia превосходит GPT-4o и Claude-3 благодаря беспрецедентной вычислительной мощности AI
Как и ожидалось, Nvidia представила свою новую модель искусственного интеллекта, Llama-3.1-Nemotron-70B-Instruct, с разрушительным воздействием.
Эта модель, согласно заявлению Nvidia, обещает превзойти самые продвинутые AI-системы, которые в настоящее время существуют, такие как GPT-4o от OpenAI и Claude-3 от Anthropic.
Объявление, сделанное через пост на X от аккаунта Nvidia AI Developer, быстро привлекло внимание экспертов в этой области.
Модель Nemotron представляет собой модифицированную и улучшенную версию Llama-3.1-70B-Instruct от Meta, платформу AI с открытым исходным кодом.
Изменение, внесенное Nvidia, подчеркнутое частью «Nemotron» в названии, отражает значительный технологический вклад компании, который поднял модель на новые высоты мощности и универсальности.
Основная идея заключается в том, что эта модель может быть более «полезной» и производительной по сравнению с более популярными моделями, такими как GPT-4 и Claude-3, благодаря тонкой настройке и передовой аппаратной инфраструктуре, разработанной самой Nvidia.
Nemotron nasce all’interno del contesto dell’arena dei chatbot, nota come lmarena, uno spazio dove diversi modelli di искусственного интеллекта vengono messi a confronto.
Meta, со своей серией AI-моделей под названием «Llama», предоставила основу, на которой Nvidia построила эту новую систему.
Основной целью было создание модели AI с открытым исходным кодом, которая была бы доступна разработчикам для дальнейшей настройки.
Тем не менее, Nvidia захотела пойти дальше, задействовав свои ресурсы для создания системы искусственного интеллекта, способной соперничать и превосходить лидеров отрасли.
Что отличает Nemotron?
Одним из ключевых элементов, который позволил Nemotron выделиться, является использование наборов данных, тщательно отобранных и высоко сложных процессов настройки.
Nvidia использовала свои огромные вычислительные мощности, применяя передовое оборудование, чтобы продвинуть модель Llama-3.1-70B за её первоначальные пределы.
Это позволило создать версию AI не только более мощную, но и более «полезную» с практической точки зрения.
Термин, который в контексте искусственного интеллекта может иметь множество интерпретаций, но который, как правило, относится к способности модели предоставлять релевантные, точные и своевременные ответы.
Бенчмаркинг — это один из методов, используемых для оценки эффективности модели искусственного интеллекта. Однако не существует единой и окончательной методологии для определения, какая модель является «лучшей».
Это потому, что полезность и эффективность модели AI часто зависят от субъективных оценок и контекста, в котором она используется.
Бенчмаркинг, на самом деле, заключается в том, чтобы подвергнуть различные модели AI одним и тем же тестам и оценить полученные результаты с точки зрения полезности и точности.
В случае с Nemotron, Nvidia утверждает, что её новая модель значительно превосходит основных конкурентов, включая GPT-4o и Claude-3.
Конкуренция на арене чат-ботов интенсивна, и Nemotron, похоже, готов подняться в рейтингах.
Хотя он еще не полностью включен в официальные рейтинги lmarena, Nvidia утверждает, что его модель получила оценку 85 в тесте «Трудный». Оценка, которая, если будет подтверждена, поставит его на вершину этой конкретной категории.
Этот результат был бы еще более примечательным, учитывая, что Llama-3.1-70B, основа Nemotron, является моделью среднего уровня по сравнению с версией 405B Llama-3.1, которая гораздо более сложная и имеет значительно большее количество параметров.
База open source и другие параметры
Чтобы дать представление о размерах и сложности моделей AI, GPT-4o, одна из самых продвинутых моделей OpenAI, была разработана с более чем 1 триллионом параметров.
Количество параметров является одним из ключевых показателей мощности и возможностей модели искусственного интеллекта.
Тем не менее, Nvidia, похоже, смогла максимизировать производительность Nemotron, несмотря на относительно меньшее количество параметров по сравнению с GPT-4o.
Еще один интересный аспект Nemotron — это его open source основа, которая делает его доступным для широкой сообщества разработчиков.
Этот подход с открытым исходным кодом имеет потенциал для дальнейшего ускорения прогресса в области искусственного интеллекта, поскольку позволяет экспертам со всего мира вносить свой вклад в улучшение и настройку модели.
Кроме того, тот факт, что Nvidia решила основывать свою работу на проекте с открытым исходным кодом, таком как Llama-3.1, демонстрирует важность сотрудничества и совместных инноваций в технологическом прогрессе.