Большая языковая модель (LLM) — это программное обеспечение, которое позволяет генерировать осмысленные тексты в разных стилях, жанрах и на разных языках, а также программный код. Ещё LLM умеют распознавать изображения (а многие даже и создавать их), переводить тексты на десятки языков, делать рерайт, саммари, выжимки; находить нужные цитаты и фрагменты в большой книге или статье. Большие языковые модели обучаются на огромных массивах данных, обычно это доступный интернет, цифровые библиотеки или специализированные подборки.
Сейчас у многих крупных технологических компаний (Yandex, Amazon, Meta*) есть собственные LLM. Также существуют проекты, направленные исключительно на разработку и поддержание больших языковых моделей — например, OpenAI (создатели ChatGPT) и Anthropic (создатели Claude). Вспомним модели, которые «на слуху», а заодно и их возможности — LLM умеют не только генерировать текст!
1. GPT-4.1 от OpenAI (США). Генерирует текст и изображения, хорошо создаёт программный код. Сильная сторона этой модели — работа с длинным контекстом, то есть внутри одного чата модель будет «помнить» все прошлые сообщения и учитывать их в генерации ответа. Например, придерживаться заданного стиля. GPT-4.1 позиционируется как флагманская языковая модель для сложных задач, но у ChatGPT есть и более простые версии. Также в «семейство» OpenAI входит
Sora — нейросеть для генерации видео.
Комментарии к статье
Комментарии: 0