Google Gemma 2 – огляд і доступ

Google запускає Gemma 2 із розширеними можливостями. Огляд і як отримати доступ для розробників і дослідників.
Google випустив свою нову модель AI Gemma 2 . Як і було обіцяно під час конференції Google I/O , нова модель була представлена в червні і тепер доступна для дослідників і розробників. Gemma 2 розроблено, щоб забезпечити потужні, настроювані інструменти штучного інтелекту для широкого спектру програм.
Що таке Gemma 2?
Gemma 2 — це новітнє покоління в серії Gemma від Google, створене для задоволення потреб розробників і дослідників, яким потрібні потужні та керовані інструменти ШІ. Ця нова модель пропонує значні покращення порівняно зі своєю попередницею, що робить її чудовим вибором для різноманітних додатків ШІ.
Gemma 2 продовжує традиції оригінальної серії Gemma, використовуючи ті ж передові дослідження та технології, що були в моделях Gemini. Сімейство включає такі варіанти, як CodeGemma , RecurrentGemma та PaliGemma , кожен з яких призначений для конкретних завдань ШІ. Ці моделі легко доступні завдяки інтеграції з такими партнерами, як Hugging Face, NVIDIA та Ollama.
Основні функції та можливості
Gemma 2 доступна в двох розмірах: 9 мільярдів (9B) і 27 мільярдів (27B) параметрів. Обидві версії розроблені як легкі та ефективні, здатні працювати на стандартних ігрових графічних процесорах або одному хості TPU через Vertex AI. Це робить Gemma 2 практичним вибором для різних додатків, від невеликих проектів до великомасштабних розгортань.
- Продуктивність: модель 9B перевершує аналогічні моделі, такі як LLaMa 3 8B, тоді як модель 27B відповідає якості більших моделей, таких як Mixtral 8x22B.
- Навчальні дані: версія 27B навчена на 13 трильйонах токенів, що забезпечує надійну продуктивність, а версія 9B, отримана з більшої моделі, навчена на 8 трильйонах токенів.
- Ефективність. Обидві моделі є більш ефективними у висновках, ніж перше покоління, зі значними вдосконаленнями в функціях безпеки.
- Доступність: Gemma 2 можна розгорнути на одному хості NVIDIA H100 Tensor Core GPU або TPU, що значно скорочує витрати на розгортання.
Доступ до Gemma 2
Щоб отримати доступ до Gemma 2, розробники та дослідники можуть використовувати різні платформи та інтеграції. Gemma 2 тепер доступна в Google AI Studio (Vertex) . Моделі також доступні через популярні фреймворки ШІ, і їх можна легко інтегрувати в існуючі робочі процеси. Ви можете завантажити модель ваги Gemma 2 з різних джерел.
Для досліджень і розробок Gemma 2 можна безкоштовно використовувати на Kaggle. Також доступний безкоштовний рівень для блокнотів Colab. Перші клієнти Google Cloud можуть отримати 300 доларів США кредиту. Академічні дослідники можуть подати заявку на участь у Програмі наукових досліджень Gemma 2. Ця програма пропонує кредити Google Cloud для підтримки досліджень із Gemma 2. Заявки приймаються до 9 серпня.
Продуктивність і результати
Початкове тестування Gemma 2 на таких платформах, як ChatBot Arena , де він значився під назвою «im-also-a-late-june-chatbot» , показує обнадійливі результати. Незважаючи на деяку мінливість тестових даних, модель демонструє високу продуктивність і інтелект. На даний момент модель 9B працює краще, ніж LLaMa 3 8B, тоді як модель 27B не поступається більшим моделям, таким як Mixtral 8x22B.
Оцінка Chatbot Arena ELO :

Порівняння продуктивності з Llama 3 і Grok1:

Gemma 2 від Google має стати цінним інструментом для розробників і дослідників, яким потрібні розширені можливості ШІ. Очікується, що завдяки своїй ефективній продуктивності, доступним варіантам розгортання та детальним навчальним даним Gemma 2 матиме значний вплив на спільноту AI. Слідкуйте за оновленнями та подіями, оскільки Google продовжує вдосконалювати та вдосконалювати серію Gemma.
Хоча ще занадто рано робити остаточне судження, перші результати є обнадійливими. Очікується, що Google вирішить будь-які проблеми, які вплинули на оригінальну модель Gemma, гарантуючи, що Gemma 2 забезпечує покращену продуктивність і надійність.
