Meta запустила новую модель ИИ LLaMA: После успеха ChatGPT от OpenAI, Google представила свой BARD, и несколько других последовали его примеру. Похоже, что Meta Platforms, Inc. готовится получить конкурентное преимущество.
Калифорнийский технологический гигант представил новый исследовательский инструмент, который вскоре поможет в создании чат-ботов на основе искусственного интеллекта.
Компания представила общественности свою Large Language Model Meta AI. Согласно официальному релизу, LLaMA — это современная базовая языковая модель, призванная помочь исследователям в области ИИ.
Любопытно, что это будет третья степень магистра права Meta после Glactica и Blender Bot 3, которые были немедленно закрыты из-за неточных результатов.
Сегодня мы публично представляем LLaMA — современную основополагающую степень магистра права (LLM) в рамках нашей постоянной приверженности открытой науке, прозрачности и демократизированному доступу к новым исследованиям.
Узнайте больше и запросите доступ ➡️ https://t.co/8AeLVhMWkq pic.twitter.com/1BEkTngtnM
— Мета ИИ (@MetaAI) 24 февраля 2023 г.
Оглавление
LLaMA
LLaMA — это библиотека языковых моделей с параметрами от 7 до 65 Б. Компания заявила, что обучает свои модели на триллионах токенов, утверждая, что возможно обучать передовые модели, используя общедоступные наборы данных, а не закрытые и недоступные наборы данных.
Мета утверждает, что предпочтительнее обучать меньшие базовые модели, такие как LLaMA, поскольку для их тестирования, проверки и изучения новых вариантов использования требуется гораздо меньше вычислительной мощности и ресурсов.
Хорошо известно, что базовые языковые модели обучаются на больших, немаркированных наборах данных, что делает их идеальными для настройки под конкретные задачи. Meta заявила, что предоставит параметры LLaMA в размерах, включая 7B, 13B, 33B и 65 B.
Meta отметила в своей исследовательской работе, что LLaMA-13B превзошла OpenAI GPT-3 (175B) в большинстве тестов и что LLaMA-65B сопоставима с лучшими моделями: Chinchilla70B от DeepMind и PaLM-540B от Google.
После завершения обучения LLaMA-13B может стать настоящим подарком для малого бизнеса, желающего проводить испытания этих систем; однако он все еще может быть недоступен для исследователей, работающих изолированно.
В настоящее время LLaMA не реализован ни в одном из продуктов Meta, но компания намерена сделать его доступным для исследователей.
Ранее компания представила LLM OPT-175B, но LLaMA — более продвинутая система. Meta также предоставила исходный код модели LLaMA, чтобы посторонние могли наблюдать, как работает система.
Это позволит им сотрудничать и настраивать связанные проекты.
Вы также можете прочитать:-
- Google запускает сканер уязвимостей для проектов с открытым исходным кодом
- Как скрыть личный чат в WhatsApp
- Почему Google Classroom не работает?
Расшифровка значимых языковых моделей
Большие языковые модели (LLM) — это системы искусственного интеллекта (ИИ), которые потребляют огромные объемы цифрового текста из интернет-источников, таких как статьи, новостные репортажи и сообщения в социальных сетях.
Эти цифровые тексты используются для обучения программного обеспечения, которое предсказывает и генерирует контент на основе запросов и подсказок. Эти модели могут помочь в таких задачах, как написание эссе, написание постов в социальных сетях, предложение кода и генерация разговоров чат-бота.
Последний релиз от Meta появился в период, когда компания практически не участвовала в обсуждениях революционных чат-ботов на основе искусственного интеллекта.
Он был одним из первых, кто запустил собственных чат-ботов. Однако из-за неточных результатов и вялого ответа его планы провалились. Meta, похоже, вернулась в игру через LLaMa.