Вс. Дек 22nd, 2024

Meta запустила новую модель ИИ LLaMA: После успеха ChatGPT от OpenAI, Google представила свой BARD, и несколько других последовали его примеру. Похоже, что Meta Platforms, Inc. готовится получить конкурентное преимущество.

Калифорнийский технологический гигант представил новый исследовательский инструмент, который вскоре поможет в создании чат-ботов на основе искусственного интеллекта.


Компания представила общественности свою Large Language Model Meta AI. Согласно официальному релизу, LLaMA — это современная базовая языковая модель, призванная помочь исследователям в области ИИ.

Любопытно, что это будет третья степень магистра права Meta после Glactica и Blender Bot 3, которые были немедленно закрыты из-за неточных результатов.

Оглавление


LLaMA

LLaMA — это библиотека языковых моделей с параметрами от 7 до 65 Б. Компания заявила, что обучает свои модели на триллионах токенов, утверждая, что возможно обучать передовые модели, используя общедоступные наборы данных, а не закрытые и недоступные наборы данных.

Мета утверждает, что предпочтительнее обучать меньшие базовые модели, такие как LLaMA, поскольку для их тестирования, проверки и изучения новых вариантов использования требуется гораздо меньше вычислительной мощности и ресурсов.

Хорошо известно, что базовые языковые модели обучаются на больших, немаркированных наборах данных, что делает их идеальными для настройки под конкретные задачи. Meta заявила, что предоставит параметры LLaMA в размерах, включая 7B, 13B, 33B и 65 B.

Meta отметила в своей исследовательской работе, что LLaMA-13B превзошла OpenAI GPT-3 (175B) в большинстве тестов и что LLaMA-65B сопоставима с лучшими моделями: Chinchilla70B от DeepMind и PaLM-540B от Google.


После завершения обучения LLaMA-13B может стать настоящим подарком для малого бизнеса, желающего проводить испытания этих систем; однако он все еще может быть недоступен для исследователей, работающих изолированно.

В настоящее время LLaMA не реализован ни в одном из продуктов Meta, но компания намерена сделать его доступным для исследователей.

Ранее компания представила LLM OPT-175B, но LLaMA — более продвинутая система. Meta также предоставила исходный код модели LLaMA, чтобы посторонние могли наблюдать, как работает система.

Это позволит им сотрудничать и настраивать связанные проекты.

Вы также можете прочитать:-

  • Google запускает сканер уязвимостей для проектов с открытым исходным кодом
  • Как скрыть личный чат в WhatsApp
  • Почему Google Classroom не работает?

Расшифровка значимых языковых моделей

Большие языковые модели (LLM) — это системы искусственного интеллекта (ИИ), которые потребляют огромные объемы цифрового текста из интернет-источников, таких как статьи, новостные репортажи и сообщения в социальных сетях.

Эти цифровые тексты используются для обучения программного обеспечения, которое предсказывает и генерирует контент на основе запросов и подсказок. Эти модели могут помочь в таких задачах, как написание эссе, написание постов в социальных сетях, предложение кода и генерация разговоров чат-бота.

Последний релиз от Meta появился в период, когда компания практически не участвовала в обсуждениях революционных чат-ботов на основе искусственного интеллекта.

Он был одним из первых, кто запустил собственных чат-ботов. Однако из-за неточных результатов и вялого ответа его планы провалились. Meta, похоже, вернулась в игру через LLaMa.

От admin